0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

缓存系统的三座大山

Linux爱好者 ? 来源:程序员大白啊 ? 2020-08-14 17:00 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1.无处不在的缓存

缓存在计算机系统是无处不在,在CPU层面有L1-L3的Cache,在Linux中有TLB加速虚拟地址和物理地址的转换,在浏览器有本地缓存、手机有本地缓存等。

可见,缓存在计算机系统中有非常重要的地位,其主要作用是提高响应速度、减少磁盘访问等,本文主要讨论在高并发系统中的缓存系统。

一句话概括缓存系统在高并发系统中的地位的话:如果高并发系统是烤羊肉串,那么缓存系统就是那一撮孜然。

2.高并发系统中的缓存

2.1 缓存系统的作用

缓存系统在高并发系统的作用很大,在某种程度上可以说没有缓存系统很难支撑高并发场景。

基于机械磁盘或SSD的数据库系统,一般来说读写的速度远慢于内存,因此单纯磁盘介质的数据库无法支撑很高的并发,可以简单认为缓存是保护磁盘数据库的重要屏障。

对于一些基于LSM的存储引擎数据库来说,随机写改为顺序写速度提升很大,但是随机读仍然是个问题,所以缓存系统是很有必要的。

2.2 缓存系统访问流程

实际场景也是读多写少,看看请求是如何得到响应的,简单看下交互流程:

请求到达之后,业务线程首先访问缓存,如果缓存命中则返回

如果未命中则继续请求磁盘数据库系统,获取数据返回

从磁盘获取数据后将结果回写到缓存系统且增加老化时间,为下次请求做准备

以上是高并发系统中缓存和磁盘数据库系统、客户端请求之间的交互过程,后续的问题分析,也是基于此过程展开的。

3.缓存系统的三大问题

网络上对于缓存三大问题的文章很多,提到的三个问题主要是:

缓存雪崩 Cache Avalanche

缓存穿透 Cache Penetration

缓存击穿 Hotspot Invalid

对于上面的三个名词我一直分不清楚,脑海中并没有清晰的区别。

于是想到去谷歌看看歪果仁是怎么说的,然而英文表述就是上面的英文,基本上和汉语翻译是一样的,所以只能强记,太难了。

3.1 缓存雪崩问题

所谓雪崩就是原来有所支撑的冰雪,某一瞬间失去依托,瞬间涌下来。

这个场景让我想起了2011年上映的柯南剧场版《沉默的十五分钟》,柯南在北泽村水库为了拯救村庄制造的雪崩:

可见雪崩确实很可怕,回到高并发系统,如果缓存系统故障,大量的请求无法从缓存完成数据请求,就全量汹涌冲向磁盘数据库系统,导致数据库被打死,整个系统彻底崩溃。

3.2 缓存雪崩解决方案

造成缓存雪崩的主要原因是缓存系统不够高可用,因此提高缓存系统的稳定性和可用性十分必要,比如对于使用Redis作为缓存的系统而言可以使用哨兵机制、集群化、持久化等来提高缓存系统的HA。

除了保证缓存系统的HA之外,服务本身也需要支持降级,可以借助比如Hystrix来实现服务的熔断、降级、限流来降低出现雪崩时的故障程度。

说白了就是别让服务彻底死掉就行,就像大雪封高速肯定不能通行了,堵车慢一些至少可以走。

3.3 缓存穿透问题

穿透形象一点就是:请求过来了 转了一圈 一无所获 就像穿过透明地带一样。

在高并发系统中缓存穿透,如果一个req需要请求的数据在缓存中没有,这时业务线程就会访问磁盘数据库系统,然而磁盘数据库也没有这个数据,无奈业务线程只能白白处理一圈。

如果某时段有大量恶意的不存在的key的集中请求,那么服务将一直处理这些根本不存在的请求,导致正常请求无法被处理,从而出现问题。

举个栗子:


拉面馆的服务员和厨师不允许拒绝已经进来的消费者,但是拉面馆的经营范围有限。此时恶意消费者点了一只5斤的澳洲龙虾,经过服务员和厨师都无法响应这个需求,此时轮流来了1000个这样的恶意消费者,拉面馆基本要歇菜了。

3.4 缓存穿透解决方案

有效甄别是否存在这个key再决定是否读取很重要,常见的做法有:

把不存在的key写一下null,这样再来就相当于命中了,其实这种方法局限性很大,今天是5斤龙虾,明天改成6斤的螃蟹,缓存系统和数据库中存储大量无用key本身是无意义的,所以一般不建议

另外一种思路,转换为查找问题,类似于在海量数据中查找某个key是否存在,考虑空间复杂度和时间复杂度,一般选用布隆过滤器来实现。

布隆过滤器是个好东西,有非常多的用途,包括:垃圾邮件识别、搜索蜘蛛爬虫url去重等,主要借助K个哈希函数和一个超大的bit数组来降低哈希冲突本身带来的误判,从而提高识别准确性。

布隆过滤器也存在一定的误判,假如判断存在可能不一定存在,但是假如判断不存在就一定不存在,因此刚好用在解决缓存穿透的key查找场景,事实上很多系统都是基于布隆过滤器来解决缓存穿透问题的。

3.5 缓存击穿问题

缓存击穿是这样一种情况:

由于缓存系统中的热点数据都有过期时间,如果没有过期时间就造成了主存和缓存的数据不一致,因此过期时间一般都不会太长。

设想某时刻一批热点数据同时在缓存系统中过期失效,那么这部分数据就都将请求磁盘数据库系统。

从描述上来看有点像微小规模的雪崩,但是对数据库的压力就很小了,只不过会影响并发性能,然而在多线程场景中缓存击穿却是经常发生的,相反缓存穿透和雪崩频率不如缓存击穿,因此研究击穿的现实意义更大一些。

3.6 缓存击穿解决方案

可以采用的方案大概有几种:

在设置热点数据过期时间时尽量分散,比如设置100ms的基础值,在此基础上正负浮动10ms,从而降低相同时刻出现CacheMiss的key的数量。

另外一种做法是多线程加锁,其中第一个线程发现CacheMiss之后进行加锁,再从数据库获取内容之后写到缓存中,其他线程获取锁失败则阻塞数ms之后再进行缓存读取,这样可以降低访问数据数据库的线程数,需要注意在单机和集群需要使用不同的锁,集群环境使用分布式锁来实现,但是由于锁的存在也会影响并发效率。

一种方法是在业务层对使用的热点数据查看是否即将过期,如果即将过期则去数据库获取最新数据进行更新并延长该热点key在缓存系统中的时间,从而避免后面的过期CacheMiss,相当于把事情提前解决了。

缓存击穿的解决方法都有一定的权衡,实际中根据自己的需求来解决。

缓存击穿的影响一般来说并不会太大,或许在你的服务跑了很久之后你才意识到会有缓存击穿问题。

4.小结

缓存系统无论在实际工作中还是在面试中都是热点内容,缓存系统目的是为了让访问又准又快,不要一味追求缓存命中率,缓存和主数据库的数据一致性是需要重点考虑的。

总起来说,如何在保证数据正确性的前提下提高缓存命中率就是核心问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11115

    浏览量

    218260
  • Linux
    +关注

    关注

    88

    文章

    11535

    浏览量

    214853
  • 缓存
    +关注

    关注

    1

    文章

    246

    浏览量

    27382

原文标题:什么是缓存系统三座大山

文章出处:【微信号:LinuxHub,微信公众号:Linux爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷东智能亮相2025年AI眼镜产业共创共赢峰会

    近日,在潮电智库主办的“2025年第二届AI眼镜产业共创共赢峰会”上,谷东智能用一场不到20分钟的主题演讲,把过去困扰AI+AR眼镜的“三座大山”——高功耗、高成本、高退货率——一口气掀翻。演讲结束
    的头像 发表于 07-26 14:19 ?1012次阅读

    千方科技推出AI大模型公路构造物评定系统

    公路构造物(桥梁、隧道、涵洞等)检测评定是养护管理的核心环节,通过量化构造物的技术状况评定等级,可为养护资源分配决策提供技术支持。传统公路构造物技术状况评定面临“三座大山”:一是评定结果易受人
    的头像 发表于 07-09 15:54 ?349次阅读

    高性能缓存设计:如何解决缓存伪共享问题

    在多核高并发场景下, 缓存伪共享(False Sharing) 是导致性能骤降的“隐形杀手”。当不同线程频繁修改同一缓存行(Cache Line)中的独立变量时,CPU缓存一致性协议会强制同步整个
    的头像 发表于 07-01 15:01 ?187次阅读
    高性能<b class='flag-5'>缓存</b>设计:如何解决<b class='flag-5'>缓存</b>伪共享问题

    SiC/磁材破局关键战!百余位技术精英聚首东莞

    在“双碳”目标的驱动下,光储充产业迎来爆发式增长,但效率瓶颈、安全焦虑与成本高压仍是横亘在行业面前的三座大山。 6月26日,第十六届光储充关键元器件技术创新研讨会邀请来自德州仪器(TI)、瑞萨电子
    的头像 发表于 06-23 16:28 ?253次阅读
    SiC/磁材破局关键战!百余位技术精英聚首东莞

    聚徽视角|粉尘、油污、震动:工业触摸屏一体机如何攻克重工业环境“三座大山”?

    在钢铁冶炼、矿山开采、船舶制造等重工业场景中,工业触摸屏一体机需直面粉尘、油污、震动的重考验。某钢铁厂高炉控制屏因粉尘侵入导致触控失灵,引发高炉停产事故,单日损失超500万元;某船舶发动机调试台因
    的头像 发表于 06-11 14:21 ?324次阅读

    RAKsmart服务器如何助力企业破解AI转型的难题

    当今,企业AI转型已成为提升竞争力的核心战略。然而,算力不足、成本失控、部署复杂等问题却成为横亘在转型路上的“三座大山”。面对这一挑战,RAKsmart服务器凭借其技术创新与全球化资源整合能力,为企业提供了一套从底层硬件到上层应用的全栈解决方案,助力企业突破AI转型瓶颈。
    的头像 发表于 05-27 10:00 ?167次阅读

    MCU缓存设计

    MCU 设计通过优化指令与数据的访问效率,显著提升系统性能并降低功耗,其核心架构与实现策略如下: 一、缓存类型与结构 指令缓存(I-Cache)与数据缓存(D-Cache)? I-Ca
    的头像 发表于 05-07 15:29 ?462次阅读

    nginx中强缓存和协商缓存介绍

    缓存直接告诉浏览器:在缓存过期前,无需与服务器通信,直接使用本地缓存
    的头像 发表于 04-01 16:01 ?456次阅读

    揭秘:安科瑞实现地铁等公共交通车站内灯箱智能照明控制的重要性

    痛点直击:地铁灯箱照明的“三座大山” 1. 能耗黑洞:传统灯箱24小时全亮,电费成本居高不下。 2. 维护难题:人工巡检效率低,突发故障难追溯。 3. 体验割裂:固定亮度模式无法匹配客流峰谷,乘客
    的头像 发表于 02-27 14:22 ?481次阅读
    揭秘:安科瑞实现地铁等公共交通车站内灯箱智能照明控制的重要性

    台积电亚利桑那州第三座工厂或于6月动工

    近日,市场传言台积电可能加速推进美国亚利桑那州第三座工厂的建设计划,并计划在6月份举行动工典礼。这一消息引起了业界的广泛关注。 针对此传言,台积电方面进行了回应。他们表示,对于市场传闻,公司通常不予
    的头像 发表于 02-18 10:49 ?519次阅读

    宁德时代计划在欧洲建立第四电池工厂,深化合资合作战略

    在近日达沃斯论坛的活动中,宁德时代联席董事长潘健透露了一个重要消息:公司有望在今年确定其在欧洲的第四电池工厂选址,并继续沿用与车企合资的合作模式。这一动态标志着宁德时代在欧洲市场的布局正在进一步加深。   宁德时代目前在欧洲已经建立了三座电池工厂,各具战略意义。
    的头像 发表于 01-23 14:51 ?1032次阅读

    HTTP缓存头的使用 本地缓存与远程缓存的区别

    HTTP缓存头是一组HTTP响应头,它们控制浏览器和中间代理服务器如何缓存网页内容。合理使用HTTP缓存头可以显著提高网站的加载速度和性能,减少服务器的负载。 1. HTTP缓存头概述
    的头像 发表于 12-18 09:41 ?557次阅读

    缓存之美——如何选择合适的本地缓存

    Guava cache是Google开发的Guava工具包中一套完善的JVM本地缓存框架,底层实现的数据结构类似于ConcurrentHashMap,但是进行了更多的能力拓展,包括缓存过期时间设置、缓存容量设置、多种淘汰策略、
    的头像 发表于 11-17 14:24 ?888次阅读
    <b class='flag-5'>缓存</b>之美——如何选择合适的本地<b class='flag-5'>缓存</b>?

    甲骨文规划三座小型核电站赋能AI数据中心

    甲骨文公司近日宣布了一项重大能源战略,已获得授权建设三座小型模块化核反应堆,旨在为旗下庞大的AI数据中心提供清洁、稳定的电力支持。这一创新举措由公司董事长拉里·埃里森亲自披露,彰显了甲骨文在可持续发展与AI技术融合方面的前瞻视野。
    的头像 发表于 09-19 18:18 ?1210次阅读

    什么是CPU缓存?它有哪些作用?

    CPU缓存(Cache Memory)是计算机系统中一个至关重要的组成部分,它位于CPU与内存之间,作为两者之间的临时存储器。CPU缓存的主要作用是减少CPU访问内存所需的时间,从而提高系统
    的头像 发表于 08-22 14:54 ?6544次阅读