0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI训练不可或缺的存储,HBM3 DRAM再升级

花茶晶晶 ? 来源:电子发烧友网 ? 作者:黄晶晶 ? 2023-04-23 00:01 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶) SK海力士近日发布全球首次实现垂直堆叠12个单品DRAM芯片,成功开发出最高容量24GB的HBM3 DRAM新产品。


图源:SK海力士


目前已向数多全球客户公司提供了24GB HBM3 DRAM样品正在进行性能验证,预计从今年下半年起将其推向市场。而现有HBM3 DRAM的最大容量是垂直堆叠8个单品DRAM芯片的16GB。无论是堆叠数量还是容量上,此次发布的新品都有显著提升。

HBM(高带宽存储器)是高价值、高性能存储器,垂直互连多个DRAM芯片。目前SK海力士在HBM市场处于领先地位,约有60%-70%的份额。


图源:SK海力士


SK海力士于2013年首次开发HBM DRAM(第一代)产品,随后以HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)的顺序开发。早在去年6月,SK海力士宣布其HBM3将与NVIDIA H100Tensor CoreGPU结合用于加速计算,SK hynix于2022年第三季度开始发货。今年年初随着ChatGPT的火爆,HBM订单激增。那么SK海力士有哪些技术来提升HBM的性能呢,以下结合SK海力士多位技术专家的分享进行一些解读。

训练计算需匹配高性能存储

训练GPT-3、Megatron-Turing NLG 530B等超大语言模型所要求的算力提升速度呈数倍到数百倍的增长。尤其是ChatGPT的训练,ChatGPT人工智能语言模型的背后就是Transformer架构。这个架构突破了传统的循环神经网络(RNN)和长短时记忆网络(LSTM)的局限性,能够在大规模数据集上进行高效训练。为了实现高效训练计算,就需要有与之匹配的高性能存储。


图源:SK海力士


SK海力士于2021年10月推出全球首款HBM3,并在2022年6月实现量产。据介绍,该款HBM3每个引脚传输速率达6.4Gbps,1024位宽接口,最高带宽可达819GB/s,较HBM2E(460GB/s)高约78%。16Gb内核密度、尖端的TSV垂直堆叠技术,满足了系统对更高密度的要求,该技术可实现12层堆叠内存立方体,从而实现最大24GB封装密度。HBM3配备On-die ECC(纠错码)可靠性功能,可自我检测和纠正数据错误,从而在SoC和DRAM之间实时传输海量数据。


图源:SK海力士

先进的封装技术

此次新产品采用了先进(Advanced)MR-MUF和TSV技术。SK海力士表示,通过先进MR-MUF技术加强了工艺效率和产品性能的稳定性,又利用TSV技术将12个比现有芯片薄40%的单品DRAM芯片垂直堆叠,实现了与16GB产品相同的高度。这两项技术也是SK海力士先进封装技术的重要组成。

首先来看先进MR-MUF技术。根据SK海力士的官方资料,MR-MUF(Mass Reflow Molded Underfill, 批量回流模制底部填充)将半导体芯片贴附在电路上,并在堆叠芯片时使用“EMC (Epoxy Molding Compound, 液态环氧树脂模塑料”填充芯片之间或芯片与凸块之间间隙的工艺。这种新的工艺主要是比之前的NCF技术工艺有了很大提升。此前的NCF技术是在芯片之间使用薄膜进行堆叠。与NCF相比,MR-MUF导热率高出两倍左右,工艺速度和良率都有提升。

图源:SK海力士

另一个是TSV(Through Silicon Via, 硅通孔技术)。TSV技术是在DRAM芯片打上数千个细微的孔,并通过垂直贯通的电极连接上下芯片的先进封装技术。这种技术已经成为一种提升DRAM性能和密度的重要手段,可以应用于3D-TSV DRAM和HBM。

图源:SK海力士

HBM主要用于弥补SoC高带宽需求与主存储器最大带宽供应能力之间的带宽缺口。SK海力士专家表示,特别是在AI应用中,每个SoC的带宽需求可能都会超过几TB/s,这是常规主存储器无法满足的。例如具有3200Mbps DDR4 DIMM的单个主存储器通道只能提供25.6GB/s的带宽。即使是具有8个存储器通道的CPU平台,其速度也只能达到204.8GB/s。而围绕单个SoC的4个HBM2堆叠可提供大于1TB/s的带宽。根据不同的应用程序,HBM既可以单独用作缓存,也可以用作两层存储中的第一层。

图源:SK海力士

实际上除了GPU搭载了HBM之外,CPU也实现了封装HBM。去年底,英特尔就正式推出了全球首款配备 HBM 内存的 x86 CPU——Intel Xeon Max 系列。根据下图介绍,它具有64 GB的HBM2e 内存,分为4个16 GB的集群,总内存带宽为1 TB / s,每个内核的HBM都超过1 GB。


图源:Intel

当前HBM的技术方向主要是在速度、密度、功耗、占板空间等方面的提升。SK海力士通过提高引脚数据速率、I/O总线位宽等方式提升速率;通过扩展Die堆叠层数和物理堆叠高度,以及增加核心Die密度以优化堆叠密度。通过评估内存结构和操作方案,最大限度地降低每带宽扩展的绝对功耗;为了实现总内存Die尺寸最小化,则是通过在不扩大现有物理尺寸的情况下增加存储单元数量和功能。

小结

显然,人工智能、数据中心的应用还将拉动HBM的需求,但从成本来看,HBM的平均售价至少是DRAM的三倍,前不久受ChatGPT的拉动,HBM的价格更是水涨船高,消息人士称,与性能最高的DRAM相比HBM3的价格上涨了五倍。不过,这一市场前景也正是DRAM存储厂商投入技术和产品的动力。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 块存储
    +关注

    关注

    0

    文章

    6

    浏览量

    2395
  • HBM3
    +关注

    关注

    0

    文章

    74

    浏览量

    349
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI推理的存储,看好SRAM?

    看到了其前景并提前布局。AI推理也使得存储HBM不再是唯一热门,更多存储芯片与AI推理芯片结合,拥有了市场机会。 ? 已经有不少
    的头像 发表于 03-03 08:51 ?1835次阅读
    <b class='flag-5'>AI</b>推理的<b class='flag-5'>存储</b>,看好SRAM?

    风景独好?12层HBM3E量产,16层HBM3E在研,产业链涌动

    电子发烧友网报道(文/黄晶晶)在早前的报道中,对于HBM产能是否即将过剩,业界有不同的声音,但丝毫未影响存储芯片厂商对HBM产品升级的步伐。 ? 三大厂商12 层
    的头像 发表于 10-06 01:03 ?4745次阅读
    风景独好?12层<b class='flag-5'>HBM3</b>E量产,16层<b class='flag-5'>HBM3</b>E在研,产业链涌动

    HBM4到来前夕,HBM热出现两极分化

    电子发烧友网报道(文/黄晶晶)高带宽存储HBM由于生成式AI的到来而异军突起,成为AI训练不可或缺
    的头像 发表于 09-23 12:00 ?3232次阅读

    存储DRAM:扩张与停产双重奏

    电子发烧友网报道(文/黄晶晶)高带宽存储HBM因数据中心、AI训练而大热,HBM三强不同程度地受益于这一
    的头像 发表于 05-10 00:58 ?8126次阅读

    海思SD3403边缘计算AI数据训练概述

    模型,将模型转化为嵌入式AI模型,模型升级AI摄像机,进行AI识别应用。 AI训练模型是不断迭
    发表于 04-28 11:11

    曙光存储全新升级AI存储方案

    近日,曙光存储全新升级AI存储方案,秉持“AI加速”理念,面向AI
    的头像 发表于 03-31 11:27 ?579次阅读

    为何原理图比对是电子设计中不可或缺的功能?

    为何原理图比对是电子设计中不可或缺的功能?原理图比对功能是现代电子设计流程中不可或缺的一部分,能够提高设计的准确性、效率和协作能力。它不仅能够帮助团队在设计阶段减少错误,还能在后期的维护和版本管理中
    的头像 发表于 03-10 11:02 ?574次阅读
    为何原理图比对是电子设计中<b class='flag-5'>不可或缺</b>的功能?

    不再是HBMAI推理流行,HBF存储的机会来了?

    D NAND闪存和高带宽存储器(HBM)的特性,能更好地满足AI推理的需求。 ? HBF的堆叠设计类似于HBM,通过硅通孔(TSVs)将多个高性能闪存核心芯片堆叠,连接到可并行访问闪存
    的头像 发表于 02-19 00:51 ?3125次阅读
    不再是<b class='flag-5'>HBM</b>,<b class='flag-5'>AI</b>推理流行,HBF<b class='flag-5'>存储</b>的机会来了?

    AI兴起推动HBM需求激增,DRAM市场面临重塑

    HBM的出货量将实现同比70%的显著增长。这一增长主要归因于数据中心和AI处理器对HBM的依赖程度日益加深。为了处理低延迟的大量数据,这些高性能计算平台越来越倾向于采用HBM作为首选
    的头像 发表于 12-26 15:07 ?669次阅读

    AI时代核心存力HBM(上)

    ? 一、HBM 是什么? 1、HBMAI 时代的必需品作为行业主流存储产品的动态随机存取存储D
    的头像 发表于 11-16 10:30 ?1781次阅读
    <b class='flag-5'>AI</b>时代核心存力<b class='flag-5'>HBM</b>(上)

    为什么ai模型训练要用gpu

    GPU凭借其强大的并行处理能力和高效的内存系统,已成为AI模型训练不可或缺的重要工具。
    的头像 发表于 10-24 09:39 ?1082次阅读

    三星电子HBM3E商业化遇阻,或重新设计1a DRAM电路

    近日,业界传出三星电子HBM3E商业化进程迟缓的消息,据称这一状况或与HBM核心芯片DRAM有关。具体而言,1a DRAM的性能问题成为了三星电子向英伟达提供
    的头像 发表于 10-23 17:15 ?1006次阅读

    预计第四季度DRAM市场仅HBM价格上涨

    据市场研究公司TrendForce预测,2024年第四季度DRAM市场将呈现出一丝暖意,但仅限于高带宽存储器(HBM)领域。预计HBM价格将实现环比上涨,而通用
    的头像 发表于 10-14 16:34 ?773次阅读

    SK海力士引领未来:全球首发12层HBM3E芯片,重塑AI存储技术格局

    今日,半导体巨头SK海力士震撼宣布了一项业界瞩目的技术里程碑,该公司已成功在全球范围内率先实现12层HBM3E芯片的规模化生产,此举不仅将HBM存储器的最大容量推升至史无前例的36GB新高度,更进一步巩固了SK海力士在
    的头像 发表于 09-26 16:30 ?1415次阅读

    DRAM存储器的基本单元

    DRAM(Dynamic Random Access Memory),即动态随机存取存储器,是现代计算机系统中不可或缺的内存组件。其基本单元的设计简洁而高效,主要由一个晶体管(MOSFET)和一个电容组成,这一组合使得
    的头像 发表于 09-10 14:42 ?2330次阅读