0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存内计算之路——道阻且长,行则将至

Carol Li ? 来源:电子发烧友网 ? 作者:李弯弯 ? 2022-05-24 00:02 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)如今随着技术发展,计算任务越来越复杂,而在冯诺依曼架构中,数据需要在存储、内存、缓存、计算单元中不断搬运,造成大部分时间、带宽、缓存、功耗都消耗在数据搬运上,而不是计算上,因此存储墙成了一个越来越严重的问题。

存内计算,故名思义就是把计算单元嵌入到内存当中,理想中是可以完美解决存储墙的问题,近几年,三星、SK海力士、台积电、英特尔、美光、阿里等半导体领域巨头都在积极研发,许多新兴企业也陆续加入进来,并取得了不错进展。

面对打得火热的存内计算,也有人认为,存内计算可能行不通,有几个方面的原因:一是AI算法模型的容量比较大,而这个在存储器里面做计算,成本会非常高;二是受限于存储芯片的工艺,比如说密度要做到很高,良品率要比较高,工艺就比较难以做到。

那么存内计算到底可不可行?存内计算未来的市场机会点在哪里?苹芯科技CEO杨越在接受电子发烧友采访时,针对在存储器内做计算成本不会太高,存储芯片工艺能不能行,存内计算的主要的应用场景方向,做了详细的分享和解答。

存内计算到底可不可行


针对“AI算法模型的容量比较大,而这个在存储器里面做计算,成本会非常高”的疑问,杨越解释道,有人认为在存储器里面做计算,成本会高,是因为他们认为要容下非常多网络参数,就需要把存储器做得非常大,存储器做大就意味着成本高。

针对这个问题,杨越表示目前已经有很多方法可以解决。

第一,在算法模型上进行解决,即将网络模型轻量化,比如知识蒸馏,简单来说就是减少算法模型中的参数的存储需求,目前已经有很多非常成熟的方法,比如CNN压缩,就是属于这一类。

苹芯科技以S200为基础搭建的功能演示平台,在这个演示系统里,就采用了其中一种基于神经网络架构搜索NAS的方法来得到轻量化的模型,而且能完成非常高的识别率,可以达到99%的关键字识别功能。S200是苹芯首款可商用的存内计算芯片,以S200为基础搭建功能演示平台,目的是演示在28nm工艺节点上的存内计算可以跑通端对端的神经网络。

第二,从可扩展的架构设计上着手。杨越表示我们可以试图打破将整个算法模型必须同时全部加载到内存中之后,才可以开始计算的固化假设。相应地,一个好的存算架构是可以支持以计算负载为主或以存储负载为主的不同任务,从而形成一个基于存内计算的向上适配能力强的算力平台。

第三,可以通过使用新型存储器解决这个问题,包括磁性存储器MRAM和忆阻器RRAM,相比于SRAM来说,MRAM和RRAM都有更高的存储密度,所以从存储单元介质本身就可以做到更大,这样可以达到存储更多计算参数的目的。

可以看到,从这三个方面着手,都可以达到解决AI算法模型太大,存储器要放下这么多数据,需要把存储器做得很大,从而带来成本高的问题。

针对存储芯片的工艺可能带来限制的问题,杨越谈到,苹芯科技主要是基于SRAM的存内计算,目前SRAM的工艺已经非常成熟,就存储器器件本身来说,市面上已经有7nm、5nm的产品,成熟工艺的良率很有保证。

“另外,对于新型存储器MRAM和RRAM,头部代工厂也已经有22nm甚至更高制程的量产线。”杨越说,所以在他看来,存内计算技术可以跟随新型存储器器件本身的技术逐步共同走向成熟。

另外需要提到的一点是,新型存储器MRAM和RRAM虽然可以解决容量不大这个问题,但是作为一个新的产品类型,还存在一些挑战,比如在可靠性,耐用性上存在一些挑战。不过杨越预计在近期未来新型存储就会达到商业成熟化的程度。

苹芯科技虽然成立时间不长,但是团队在创业前期就已经有很长时间的积累,存内计算是一项技术壁垒非常高的工程,而苹芯科技在包括从底层内存器件的物理特性的理解,到上层芯片架构的设计,再到最后产品落地成本的控制上都有足够的积累,在各个技术栈都有自己的IP,苹芯科技也是第一个拥有工业级28nm SRAM存内计算加速单元DEMO的团队,并首次利用RRAM存内计算完成基于LeNet的CIFAR10的识别任务。

苹芯科技下一代芯片S300已从代工厂回片,据杨越介绍,目前工程团队,正在进行相应的测试和展示工作,相较于S200,S300具有更强大的计算能力,可以兼容更多网络模型,从而支持更丰富的边缘端应用场景。

存内计算的机会点在哪里


我们知道,存内计算有多种不同的技术路线,每个技术路线各有特点,比如Flash的优点是密度比较高,DRAM成本会比较低,磁性存储器MRAM、忆阻器RRAM除了存储密度比较高之外,功耗也比较低,杨越说:“这两类新型存储器MRAM和RRAM代表着存内计算的未来。”不过因为是新技术,就如上文所言,在工艺成熟度和商业化上还需要一些耐心。

苹芯科技采用的是SRAM+MRAM和RRAM混合技术路线。杨越解释说:“之所以选择这样的技术路线,背后的原因是,SRAM作为读写速度最快的内存介质,具备很多优势,比如,它可以向更先进的制程节点兼容,具备高能效比的计算优势,同时它又不存在其他非易失性存储所具备的耐久性问题,更重要的是,基于SRAM的设计方案,可以支持纯数字化设计,从而能够解决很多应用场景所关心的精度问题。”

苹芯选择新型存储器,一是因为它具有高性能天花板,二是这也有利于团队核心成员更好地发挥过往的技术积累和工程经验。

存内计算未来的应用个机会点在哪里呢?现在很多具有AI计算功能的芯片,包括GPUFPGA以及NPU、SOC等,都是基于传统的冯诺伊曼架构设计的,会受到存储墙、功耗墙的约束,这就导致他们在绝对计算上很强,但在整个计算效率上存在天花板。

而存内计算就可以弥补这些问题,短期来看,存内计算的主要市场机会主要会出现在端侧的产品上,因为存内计算的技术优势,能够提供比较高的计算效率和比较低的功耗,比如可穿戴设备、智能家居等是非常适合存内计算的应用方向。

长期来看,随着新型存储器工艺的成熟,它不但会给低功耗的市场带来机会,同时会把计算能力提升2-3个量级,让存内计算的应用扩展到更多场景中,比如在一些用电量受限,但对绝对算力仍然有要求的场景层面,存内计算就可以给客户带来差异化的选择机会。

小结

如Gardner曲线的解读,任何新兴技术在发展初期都会经历一些起伏,尤其像存内计算这种在底层上有巨大突破的技术,从最初的热捧,到发展期的理性,到成长期的企稳上升,再到最后产品商业化。扎实的技术背景和可靠的工程化能力,是存内计算企业立足市场并获得客户认可的重要基础。我们期待着更多更好的技术与产品,为智能化场景描绘出更美好的未来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7261

    浏览量

    92256
  • 计算
    +关注

    关注

    2

    文章

    453

    浏览量

    39391
  • AI算法
    +关注

    关注

    0

    文章

    263

    浏览量

    12723
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    比亚迪新能源车队护航2025丝绸之路万里

    近日,作为第二届上海合作组织国家电视节核心活动,2025丝绸之路万里“上合之路·一路向前”大型跨国全媒体活动于西安盛大启程。作为本次活动的官方指定用车,比亚迪旗下王朝、海洋、方程豹、腾势、仰望的多款新能源车型将为全媒体采访团护
    的头像 发表于 07-23 11:26 ?354次阅读

    “算平衡”有多重要?

    。而决定这种配合效率的关键指标,正是我们今天要聊的“算比”。什么是算比?算比=计算能力(如每秒浮点运算次数)÷存储容量(如GB/TB),但更核心的是
    的头像 发表于 07-11 14:06 ?140次阅读
    “算<b class='flag-5'>存</b>平衡”有多重要?

    中国EDA产业自主化:则将至

    电子设计自动化(EDA)软件是集成电路(IC)设计的基石,被誉为“芯片之母”,其重要性不言而喻。目前,全球EDA市场高度集中,主要由美国的Synopsys、Cadence以及德国西门子旗下的Mentor Graphics(现为Siemens EDA)这三大巨头垄断。中国芯片产业的崛起,使得EDA工具的自主可控成为国家战略层面的重要议题。那么,中国通过自己培养人才、发展本土产品来取代国际EDA巨头的产品与服务,究竟需要多长时间? ? 这是一个复杂的问题,采访不同的专家,也都难
    发表于 06-04 14:04 ?3574次阅读
    中国EDA产业自主化:<b class='flag-5'>道</b><b class='flag-5'>阻</b><b class='flag-5'>且</b><b class='flag-5'>长</b>,<b class='flag-5'>行</b><b class='flag-5'>则将至</b>

    第二届知科技杯华东高校计算创新应用大赛正式启动

    在数字化浪潮席卷各行业的当下,数据量呈爆炸式增长,算力需求也水涨船高。计算架构作为创新解决方案,备受产学研各界关注。为推动
    的头像 发表于 05-06 17:51 ?499次阅读

    水网线型号是什么

    。以下是一些常见的水网线型号及其特点: 超五类非屏蔽水网线: 如金佳佰业的CAT5E UTP超五类非屏蔽室外水网线W323,该型号网线采用8根0.5mm无氧铜导体,支持百兆传输无延迟,
    的头像 发表于 03-17 10:02 ?403次阅读

    软通动力刘天文一赴软通计算机无锡基地考察

    近日,软通动力集团董事兼首席执行官刘天文一赴软通计算机无锡基地考察,并与无锡市政府及华为公司高层进行工作会谈。
    的头像 发表于 02-20 10:33 ?626次阅读

    8通LED阳极驱动电路——AiP3318

    8通LED阳极驱动电路——AiP3318
    的头像 发表于 02-18 09:49 ?577次阅读
    8通<b class='flag-5'>道</b>LED阳极<b class='flag-5'>行</b>驱动电路——AiP3318

    环宇智:以技术创新引领智驾普惠之路

    树立行业标杆,讲好中国故事,传递中国声音,充分展现腾飞的中国经济、崛起的民族品牌和向上的企业家精神。近日,“崛起的民族品牌”专题系列节目对话武汉环宇智科技有限公司的董事曹晶女士,探讨智能驾驶领域
    的头像 发表于 12-30 11:31 ?563次阅读
    环宇智<b class='flag-5'>行</b>:以技术创新引领智驾普惠<b class='flag-5'>之路</b>

    ADS58C20热有顶面(9.3度/W)和底面(0.5度/W),请问一下折算为一面的热怎么计算

    ADS58C20热有顶面(9.3度/W)和底面(0.5度/W),请问一下折算为一面的热怎么计算
    发表于 12-12 06:43

    专注计算的知科技荣获2024全球(中国)半导体市场年度最佳企业奖

    在近日举行的2024-2025全球半导体市场峰会上,知科技凭借在市场竞争力及未来前景方面的卓越表现,荣获世界集成电路协会(World Integrated Circuit Association
    的头像 发表于 12-11 17:33 ?2263次阅读
    专注<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>的知<b class='flag-5'>存</b>科技荣获2024全球(中国)半导体市场年度最佳企业奖

    开源芯片系列讲座第24期:基于SRAM算的高效计算架构

    鹭岛论坛开源芯片系列讲座第24期「基于SRAM算的高效计算架构」明晚(27日)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目基于SRAM算的高效计算架构报告简介
    的头像 发表于 11-27 01:05 ?929次阅读
    开源芯片系列讲座第24期:基于SRAM<b class='flag-5'>存</b>算的高效<b class='flag-5'>计算</b>架构

    科技启动首届计算创新大赛

    计算作为一项打破“内存墙”“功耗墙”的颠覆性技术,消除了与算的界限,相比CPU或GPU能够实现更高计算并行度、更大专用算力,达成数量级
    的头像 发表于 11-21 10:44 ?681次阅读

    THS1408的热Rjb是多大啊,怎么计算

    THS1408的热Rjb是多大啊,怎么计算
    发表于 11-15 06:04

    算一体化与边缘计算:重新定义智能计算的未来

    随着数据量爆炸式增长和智能化应用的普及,计算与存储的高效整合逐渐成为科技行业关注的重点。数据存储和处理需求的快速增长推动了对计算架构的重新设计,“算一体化”技术应运而生。同时,随着物联网、5G网络
    的头像 发表于 11-12 01:05 ?882次阅读
    <b class='flag-5'>存</b>算一体化与边缘<b class='flag-5'>计算</b>:重新定义智能<b class='flag-5'>计算</b>的未来

    中国汽研董事周玉林一莅临国芯科技调研交流

    日前,中国汽车工程研究院股份有限公司(以下简称: 中国汽研 ,股票代码: 601965 )董事周玉林及副总经理王红钢一莅临苏州国芯科技股份有限公司(以下简称“ 国芯科技 ”,股票代码
    的头像 发表于 08-13 09:54 ?911次阅读