0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么分页场景下mysql请求速度非常慢

Android编程精选 ? 来源:掘金 ? 作者:牛牛码特 ? 2021-10-08 14:46 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源丨https://juejin.cn/post/6844903939247177741

从一个问题说起五年前在tx的时候,发现分页场景下,mysql请求速度非常慢。数据量只有10w的情况下,select xx from 单机大概2,3秒。我就问我导师为什么,他反问“索引场景,mysql中获得第n大的数,时间复杂度是多少?”

答案的追寻确认场景假设status上面有索引。select * from table where status = xx limit 10 offset 10000。会非常慢。数据量不大的情况就有几秒延迟。

小白作答瞎猜了个log(N),心想找一个节点不就是log(N)。自然而然,导师让我自己去研究。

这一阶段,用了10分钟。

继续解答仔细分析一下,会发现通过索引去找很别扭。因为你不知道前100个数在左子树和右子数的分布情况,所以其是无法利用二叉树的查找特性。通过学习,了解到mysql的索引是b+树。

0c76bb4e-23df-11ec-82a8-dac502259ad0.png

看了这个图,就豁然开朗了。可以直接通过叶子节点组成的链表,以o(n)的复杂度找到第100大的树。但是即使是o(n),也不至于慢得令人发指,是否还有原因。

这一阶段,主要是通过网上查资料,断断续续用了10天。

系统学习这里推荐两本书,一本《MySQL技术内幕 InnoDB存储引擎》,通过他可以对InnoDB的实现机制,如mvcc,索引实现,文件存储会有更深理解。

第二本是《高性能MySQL》,这本书从着手使用层面,但讲得比较深入,而且提到了很多设计的思路。

两本书相结合,反复领会,mysql就勉强能登堂入室了。

这里有两个关键概念:

聚簇索引:包含主键索引和对应的实际数据,索引的叶子节点就是数据节点

辅助索引:可以理解为二级节点,其叶子节点还是索引节点,包含了主键id。

即使前10000个会扔掉,mysql也会通过二级索引上的主键id,去聚簇索引上查一遍数据,这可是10000次随机io,自然慢成哈士奇。这里可能会提出疑问,为什么会有这种行为,这是和mysql的分层有关系,limit offset 只能作用于引擎层返回的结果集。换句话说,引擎层也很无辜,他并不知道这10000个是要扔掉的。以下是mysql分层示意图,可以看到,引擎层和server层,实际是分开的。

直到此时,大概明白了慢的原因。这一阶段,用了一年。

触类旁通此时工作已经3年了,也开始看一些源码。在看完etcd之后,看了些tidb的源码。无论哪种数据库,其实一条语句的查询,是由逻辑算子组成。

逻辑算子介绍 在写具体的优化规则之前,先简单介绍查询计划里面的一些逻辑算子。

DataSource 这个就是数据源,也就是表,select * from t 里面的 t。

Selection 选择,例如 select xxx from t where xx = 5 里面的 where 过滤条件。

Projection 投影, select c from t 里面的取 c 列是投影操作。

Join 连接, select xx from t1, t2 where t1.c = t2.c 就是把 t1 t2 两个表做 Join。

选择,投影,连接(简称 SPJ) 是最基本的算子。其中 Join 有内连接,左外右外连接等多种连接方式。

select b from t1, t2 where t1.c = t2.c and t1.a 》 5 变成逻辑查询计划之后,t1 t2 对应的 DataSource,负责将数据捞上来。上面接个 Join 算子,将两个表的结果按 t1.c = t2.c连接,再按t1.a 》 5做一个 Selection 过滤,最后将 b 列投影。下图是未经优化的表示:

所以说不是mysql不想把limit, offset传递给引擎层,而是因为划分了逻辑算子,所以导致无法直到具体算子包含了多少符合条件的数据。

怎么解决《高性能MySQL》提到了两种方案

方案一

根据业务实际需求,看能否替换为下一页,上一页的功能,特别在iosandroid端,以前那种完全的分页是不常见的。这里是说,把limit, offset,替换为》辅助索引(即搜索条件)id的方式。该id再调用时,需要返回给前端。

方案二

正面刚。这里介绍一个概念:索引覆盖:当辅助索引查询的数据,只有id和辅助索引本身,那么就不必再去查聚簇索引。

思路如下:select xxx,xxx from in (select id from table where second_index = xxx limit 10 offset 10000) 这句话是说,先从条件查询中,查找数据对应的数据库唯一id值,因为主键在辅助索引上就有,所以不用回归到聚簇索引的磁盘去拉取。再通过这些已经被limit出来的10个主键id,去查询聚簇索引。这样只会十次随机io。在业务确实需要用分页的情况下,使用该方案可以大幅度提高性能。通常能满足性能要求。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7270

    浏览量

    92501
  • SQL
    SQL
    +关注

    关注

    1

    文章

    786

    浏览量

    45528

原文标题:分页场景(limit,offset)为什么会慢?

文章出处:【微信号:AndroidPush,微信公众号:Android编程精选】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MySQL查询终极优化指南

    作为一名在生产环境摸爬滚打多年的运维工程师,我见过太多因为查询导致的线上故障。今天分享一套经过实战检验的MySQL查询分析与索引优化方法论,帮你彻底解决数据库性能瓶颈。
    的头像 发表于 08-13 15:55 ?191次阅读

    CentOS 7MySQL 8双主热备高可用架构全解

    Centos7部署MySQL8+keepalived双主热备(含Keepalived配置与GTID同步优化方案) 架构拓扑原理 GTID同步 VIP 192.168.1.100 MySQL主节点1
    的头像 发表于 08-12 17:08 ?229次阅读

    NVMe高速传输之摆脱XDMA设计13:PCIe请求模块设计(

    在接收到请求总线接口的请求事务后,当请求类型的值为0时,表示通过PCIE硬核的配置管理接口发送请求,由于请求接口的接口和时序与配置管理接口基
    的头像 发表于 08-04 16:35 ?195次阅读
    NVMe高速传输之摆脱XDMA设计13:PCIe<b class='flag-5'>请求</b>模块设计(<b class='flag-5'>下</b>)

    MySQL配置调优技巧

    上个月,我们公司的核心业务系统突然出现大面积超时,用户投诉电话不断。经过紧急排查,发现是MySQL服务器CPU飙升到99%,大量查询堆积。通过一系列配置调优和SQL优化,最终在30分钟内恢复了服务。
    的头像 发表于 07-31 10:27 ?180次阅读

    云网络访问卡怎么办?

    一次完整的 HTTP 请求包括:域名解析、建立 TCP 连接、发起请求、服务器接收请求并返回处理结果、浏览器对 HTML 代码进行解析并请求其他资源,以及对页面进行渲染呈现。其中,HT
    的头像 发表于 06-28 14:51 ?195次阅读

    科普|公司的Wi-Fi,为什么这么

    好了,也搞不定。这是为什么呢?公司的Wi-Fi,到底有什么“苦衷”?█Wi-Fi速率为什么这么?Wi-Fi速度慢,其实说白了,就两种原因:一是北向的出口带宽小。水
    的头像 发表于 06-20 06:06 ?669次阅读
    科普|公司的Wi-Fi,为什么这么<b class='flag-5'>慢</b>?

    MySQL数据库是什么

    MySQL数据库是一种 开源的关系型数据库管理系统(RDBMS) ,由瑞典MySQL AB公司开发,后被Oracle公司收购。它通过结构化查询语言(SQL)进行数据存储、管理和操作,广泛应用于Web
    的头像 发表于 05-23 09:18 ?588次阅读

    华益精点闪耀第91届CMEF 引领病管理新时代

    2025年4月11日,第91届中国国际医疗器械博览会(CMEF)圆满落下帷幕。在这场全球医疗行业的顶级盛会上,华益精点以“病管理全场景解决方案”为主题盛大登场,引发业界广泛关注与热议。 互联互通
    的头像 发表于 04-17 16:20 ?340次阅读
    华益精点闪耀第91届CMEF  引领<b class='flag-5'>慢</b>病管理新时代

    MCUXpresso_24.12.148/FRDM-K22F调试会话启动速度非常,怎么解决?

    任何错误消息。加载速度非常。加载 Debug 会话后,调试似乎以正常的响应速度进行。 如果我构建并调试一个 NXP 示例项目,则 Debug 会话几乎立即出现 - 只需几秒钟。 我
    发表于 04-02 08:26

    使用插件将Excel连接到MySQL/MariaDB

    使用插件将 Excel 连接到 MySQL/MariaDB 适用于 MySQL 的 Devart Excel 插件允许您将 Microsoft Excel 连接到 MySQL 或 MariaDB
    的头像 发表于 01-20 12:38 ?748次阅读
    使用插件将Excel连接到<b class='flag-5'>MySQL</b>/MariaDB

    MySQL数据库的安装

    MySQL数据库的安装 【一】各种数据库的端口 MySQL :3306 Redis :6379 MongoDB :27017 Django :8000 flask :5000 【二】MySQL 介绍
    的头像 发表于 01-14 11:25 ?662次阅读
    <b class='flag-5'>MySQL</b>数据库的安装

    华为云 Flexus X 实例评测使用体验——MySQL 安装全过程 +MySQL 读写速度测试

    ?前言 我这里我使用的默认公共镜像 Huawei Cloud EulerOS,因为这里有个标识说是可以对数据库添加加速功能,例如 Redis 和 MySQL 数据库都可以加速,我这里先测试一
    的头像 发表于 12-31 10:38 ?573次阅读
    华为云 Flexus X 实例评测使用体验——<b class='flag-5'>MySQL</b> 安装全过程 +<b class='flag-5'>MySQL</b> 读写<b class='flag-5'>速度</b>测试

    调试ADS1299 EEG开发板,读取寄存器的速度特别,为什么?

    大家好,我最近在用ads1299作开发,原来实验室有留下一套ADS1299 EEG 开发板,现在拿来调试,但是发现读取寄存器的速度特别,读一次数据要十几分钟,而且通过GUI看不到波形,读取
    发表于 12-25 07:37

    什么是虚拟内存分页 Windows系统虚拟内存优化方法

    内存有限的情况。 虚拟内存的作用 内存扩展 :虚拟内存允许系统使用硬盘空间作为额外的内存,从而扩展可用的内存资源。 数据交换 :当物理内存不足时,系统会将不常用的数据从物理内存移动到分页文件中,以便为活跃的程序腾出空间。
    的头像 发表于 12-04 09:16 ?1712次阅读

    MySQL编码机制原理

    前言 一位读者在本地部署 MySQL 测试环境时碰到一个问题,我觉得挺有代表性的,所以写篇文章介绍一,看完相信你会对 MySQL 的编码机制有最本质的了解,本文的目录结构如下 读者问题简介
    的头像 发表于 11-09 11:01 ?664次阅读