0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

稀疏化计算产品商业落地将赋能AI产业变革

lPCU_elecfans ? 来源:电子发烧友网 ? 作者:电子发烧友网 ? 2022-09-02 09:45 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)AI5G等新兴产业的蓬勃发展催生了海量数据计算需求,同时AI算法模型持续迭代,复杂化日益凸显,数字经济时代下市场需要强大、普惠的算力引擎。而从供给端来看,先进制程的迭代周期变长,使得芯片能效比的提升并不显著。

针对AI应用特点实现硬件架构创新是必然趋势,墨芯人工智能CEO王维在某论坛上谈到,依托对AI的理解用软硬一体解决算力瓶颈问题是行业公认的发展方向。他认为,稀疏化能够有效应对算力瓶颈,实现原理是,不存储和不处理零值,从而得到更小且更快的模型。

软硬一体化稀疏路径符合AI计算核心诉求软硬一体化稀疏路径符合AI计算高吞吐、低功耗、低延时的核心需求。AI稀疏产业化的成功要素包括:1、跨算法、软件、硬件领域的协同开发;2、拥有持续多层次优化稀疏运算的底层算法能力;3、架构需保证可编程性、高度可拓展属性及快速迭代能力。

稀疏化路径已具备批量化工程应用能力。英伟达在2020年推出的A100产品中,就率先引入稀疏Tensor Core实现4:2结构化稀疏,稀疏是神经网络轻量化的重要手段,英伟达稀疏化产品有效引领市场应用趋势。稀疏化架构可与现有AI软件生态深度适配,例如英伟达直接使用Tensor Core进行稀疏矩阵乘累加操作,无需进行底层编程。

基于双稀疏特点,自研核心AI架构墨芯是全球最早研发稀疏化算法及架构的企业,并在2018年开始稀疏化的全球专利布局,该公司也是最早商用稀疏化产品实现销售的,第一款FPGA产品在2019年Q4开始产生销售。

王维表示,现有芯片架构设计在稀疏化支持中面临较大局限,比如CPU架构,可支持跳点运算,但因其算力限制,仅能够支持边缘端应用,无法支持更大的模型,再比如GPU架构,只能进行并行计算,所有元素(包括0元素)均参与运算,无法实现高倍数加速。

基于双稀疏特点,墨芯自研核心AI架构。其双稀疏架构设计理念:平衡的权重和激活张量剪枝技术,可将精度损失降至最低的前提下保持对硬件的友好度;墨芯独有的剪枝和压缩技术可以再许多网络和应用中实现最多高到32倍的稀疏。

墨芯首款稀疏化云端AI芯片Antoum-1已经回片,实测性能ResNet 50超33000SPS;墨芯板卡S4(单颗Antoum-1)仅30W功耗,实测性能实现英伟达主流产品T4近16倍能效比;墨芯板卡S4对比英伟达主流产品Latency可以做到1/4-1/5。

稀疏化计算产品商业落地,将赋能AI产业变革。一、助力云服务商降低单位算力拥有成本,2021年,Nvidia在中国营收超过38亿美金,其中阿里,腾讯等头部互联网公司采购金额基本超过1亿美金。随着AI持续发展,数据量的指数上升导致AI芯片的需求会持续上升,云服务商采购额将逐年增加,因此他们对降低成本的诉求非常强劲,基于Antoum-1的推理卡S4相较于英伟达对标推理卡T4,ResNest50及BERT每FPS/SPS成本降低约85%。

二、助力云服务商缩减能耗成本,电费支出是数据中心最大的营业成本,平均数据中心近60%的营业成本是电力成本,降低能耗是数据中心和云服务商的最大痛点,2021年全国数据中心的耗电量占社会总用电的近3%,且增长率已连续8年超过12%,基于Antoum-1的推理卡S4相较于Nvidia主力推理卡T4,ResNest50及BERT每FPS/SPS能耗成本降低约90%。

小结目前基于稀疏化的AI架构主要面向云端训练场景,不过理论上来说,稀疏化训练由于能大幅降低对内存、带宽与计算的需求,十分适合训练,未来墨芯在满足推理市场的需求后,将切入训练市场,建立稀疏训练生态,产品在软件层面对训练做更多的开发,支持训练专用的算子,同时硬件上也会为训练定义架构。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 硬件
    +关注

    关注

    11

    文章

    3498

    浏览量

    67760
  • AI
    AI
    +关注

    关注

    88

    文章

    35760

    浏览量

    282482
  • 人工智能
    +关注

    关注

    1810

    文章

    49221

    浏览量

    251554

原文标题:?稀疏化应对算力瓶颈,助力云服务商大幅降低成本

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利尔达AIoT模组与解决方案获瞩目,AI+机器人产业加速落地

    AI产品线市场经理范远航先生受邀出席,并发表了主题演讲,彰显了公司在推动AIoT技术深度产业智能
    的头像 发表于 07-25 14:06 ?485次阅读
    利尔达AIoT模组与解决方案获瞩目,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>+机器人<b class='flag-5'>产业</b>加速<b class='flag-5'>落地</b>

    睿赛德邀您共赴“2025AI商业落地论坛”:共探实效派AI产业变革力量 | 活动预告

    作为全球人工智能领域的年度盛会,2025世界人工智能大会(WAIC)将于7月26日在上海盛大启幕。“AI商业落地论坛”是世界人工智能大会的重要系列论坛之一,自第一届举办便目光锁定到
    的头像 发表于 07-21 20:15 ?323次阅读
    睿赛德邀您共赴“2025<b class='flag-5'>AI</b><b class='flag-5'>商业</b><b class='flag-5'>落地</b>论坛”:共探实效派<b class='flag-5'>AI</b>的<b class='flag-5'>产业</b><b class='flag-5'>变革</b>力量 | 活动预告

    芯盾时代以AI战略全线产品智能升级

    ChatGPT掀起的智能革命席卷全球,DeepSeek等大模型持续刷新性能边界,人工智能从实验走向产业深处,成为重塑经济格局、重构安全范式的核心力量。从国家战略到企业实践,从技术突破到场景落地,智能浪潮以前所未有的速度推动着社
    的头像 发表于 07-14 15:47 ?1033次阅读

    CES Asia 2025蓄势待发,聚焦低空经济与AI,引领未来产业变革

    分享最新的科研成果和技术发展趋势,为行业发展提供理论支持。头部企业展示最前沿的技术和产品,分享实践经验,推动技术的商业化应用。创新力量也将在这个平台上崭露头角,带来新的创意和思路,激发行业的创新活力。 CES
    发表于 07-09 10:29

    赛美特“AI智造”生态体系亮相,四大方向智能制造

    行业专家、技术先锋及生态伙伴共聚一堂,共议AI智能制造的趋势与落地实践,为产业智能升级提供
    发表于 05-26 14:30 ?896次阅读

    COMPUTEX 2025:德明利以全栈存储技术AI NEXT”产业落地

    2025年5月20日,全球科技盛会台北国际电脑展启幕。在千亿参数大模型商业化与算力需求指数级增长的双重驱动下,存储技术已从数据载体发展为AI效能的深度落地关键。德明利通过端侧适配方案、全栈技术整合
    的头像 发表于 05-21 15:05 ?478次阅读
    COMPUTEX 2025:德明利以全栈存储技术<b class='flag-5'>赋</b><b class='flag-5'>能</b>“<b class='flag-5'>AI</b> NEXT”<b class='flag-5'>产业</b><b class='flag-5'>落地</b>

    RAKsmart服务器如何AI开发与部署

    AI开发与部署的复杂性不仅体现在算法设计层面,更依赖于底层基础设施的支撑能力。RAKsmart服务器凭借其高性能硬件架构、灵活的资源调度能力以及面向AI场景的深度优化,正在成为企业突破算力瓶颈、加速AI应用
    的头像 发表于 04-30 09:22 ?364次阅读

    研华科技全栈式Edge AI产品助力工业智能升级

    在2025慕尼黑上海电子设备展上,研华展示了其全栈式Edge AI产品,助力工业智能升级。通过边缘计算AI技术的深度融合,研华
    的头像 发表于 03-28 17:23 ?844次阅读

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    助力 AI、智能制造和物联网行业的发展。未来,Banana Pi 继续深化与Renesas的技术合作,推动更多高性能嵌入式解决方案的落地。 ” BPI-AI2N开发板
    发表于 03-19 17:54

    AI边缘网关:开启智能时代的新蓝海

    在数字转型的浪潮中,AI与边缘计算的结合正掀起一场深刻的产业变革。边缘网关作为连接物理世界与数字世界的桥梁,在
    发表于 02-15 11:41

    大模型进化论:AI产业落地卷向何方?

    大模型进化论:AI产业落地卷向何方?
    的头像 发表于 01-24 09:28 ?386次阅读

    声智科技荣获工信部“2024年先进计算新质生产力典型应用案例”

    近日,工业和信息部网站发布《2024年先进计算新质生产力典型应用案例》公示信息,声智科技“基于中医大模型的抑郁症AI自助诊疗平台”作为
    的头像 发表于 12-28 14:57 ?723次阅读

    名单公布!【书籍评测活动NO.49】大模型启示录:一本AI应用百科全书

    一次大模型变革中,完全不缺态度,只缺认知与落地的经验。 在过去的两年中,我们看到了全球太多的巨头和普通中小企业,进入All in AI的投资周期。有的已经开始落地到具体的生产流程,例如
    发表于 10-28 15:34

    华为云徐峰:AI 应用现代,加速软件生产力跃升

    ,分享了智能应用的行业实践,并发布了华为云在应用开发、运行、运维、集成领域的智能产品能力。 在主题为“ AI
    的头像 发表于 10-14 09:45 ?1053次阅读
    华为云徐峰:<b class='flag-5'>AI</b> <b class='flag-5'>赋</b><b class='flag-5'>能</b>应用现代<b class='flag-5'>化</b>,加速软件生产力跃升

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,RISC-V高效落地

    方式,从同质的市场环境中脱颖而出,通过专业接口技术RISC-V导入下游广阔的互联互通场景,为万物互联的世界。 03 青稞内核+接口PHY,让RISC-V高效
    发表于 08-30 17:37