0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面对AI终端市场需求,定制AI芯片将成为趋势

独爱72H ? 来源:雷锋网 ? 作者:雷锋网 ? 2019-11-14 15:34 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:雷锋网)

随着AI算法的逐步成熟以及芯片算力的提升,历经几年的热潮之后,AI技术只有落地应用才能获得进一步的发展。不过,算法需求与芯片算力不匹配的需求成为了AI落地的一大障碍,AI软硬一体化成为关键。但在软硬一体化提高效率的同时,如何满足多样化的需求也非常关键,定制化成为了趋势。

这一轮AI热潮,不仅让越来越多的人认识和了解了AI技术,AI也正在成为每台智能设备日常工作的一部分。事实证明,深度神经网络(DNN)非常有用,但是AI的进一步发展和落地仍有很多挑战。比如,如何使得现有解决方案跟上发展趋势?如何扩展解决方案?如何以成熟的工具链缩短TTM(Time to Market)和降低成本?

面对这些问题,需要整个产业链的协作,共同满足市场的需求。根据市场研究机构的报告,到2022年,全球具有计算机视觉/机器视觉相继的规模将超过15亿个,包括智能手机、安防、消费电子、汽车图像传感器、工业等。这就意味着,定制化的AI加速器可以更好地满足市场的不同需求,但与此同时,AI在边缘端的落地也面临挑战。CEVA营销副总裁Moshe Sheier认为,在边缘AI中,AI的落地面临的问题就是数据量太大且运算太复杂,芯片的算力非常关键。

Moshe Sheier近日接受雷锋网采访时表示,AI算法公司在做落地项目的时候,受困于硬件算力不足的问题,可能会牺牲很多特性。所以我们现在希望算法公司能够向芯片公司提出更多的需求,让芯片的设计能够更好地满足算法需求。只有算法的效率提高了,AI才能更好的落地。

提到效率,无法避开的问题就是AI到底需要专用还是通用的芯片,通用的芯片能够更好适应算法的演进,但算力不及专用芯片。Moshe Sheier认为,AI加速器一定是一个趋势,同时,视频DSP在AI中非常重要,因为AI算法还有很多不确定性。如今算法公司不会只采用一种神经网络,而是会进行组合。运行多个神经网络模型就一定会涉及对结果进行CV的处理,这时候CPU可能会面临一些瓶颈。我们的XM DSP针对了所有流行的神经网络都进行了优化,能够更好的满足多神经网络的算法。

基于对流行神经网络特征的理解,CEVA在今年9月推出了第二代面向边缘设备的AI推理处理器架构NeuPro-S,NeuPro-S系列包括NPS1000、NPS2000和NPS4000,它们是每个周期分别具有1000、2000和4000个8位MAC的预配置处理器。NPS4000具有最高的单核CNN性能,在1.5GHz时可达到12.5 TOPS,并且可完全扩展,最高可达到100 TOPS。

根据官方的说法,与CEVA第一代AI处理器相比,NeuPro-S的性能平均提升50%,内存带宽和功耗分别降低了40%和30%。这种性能的提升主要来自硬件还是软件的优化?Moshe Sheier表示主要是来自硬件,因为CEVA在NeuPro-S中增加了离线的权重压缩和硬件的权重解压缩。

之所以要这么做,是因为神经网络与视频编解码不太一样,即便很小的图片,引入卷积后权重的数据量非常大,因此带宽成为了AI处理器的瓶颈。而CEVA采用的多重权重压缩,可分为两种方式,一种是零值和非零值,可以用4bit或者8bit表示,另一种是通过查表的方式,通过共用权重,只传一次数据,减少对带宽的需求。

不仅如此,NeuPro-S还支持多级内存系统。具体而言,就是加入了L2内存的支持,用户通过设置L2的大小,可以尽量把数据放在L2的缓存,减少使用外部SDRAM,降低传输成本。Moshe Sheier指出,硬件增加L2并不复杂,CEVA主要的工作是在我们CNDD软件框架中加入对L2内存的支持。

因此,NeuPro-S相比上一代NeuPro非常重要的工作就是进行带宽的优化,这样才有可能达到理论设计的利用率。雷锋网(公众号:雷锋网)了解到,CEVA设计神经网络引擎时最关注的问题就是乘法利用率,CEVA借助DSP设计的丰富经验,设计出的神经网络引擎理论的乘法利用率在80%-90%、虽然实际利用率会低于理论值,但NeuPro-S带宽的增大将能够减少数据的等待,能提高乘法利用率。

最终,经设计优化NeuPro-S,能够对边缘设备中视频和图像中的物品进行分割、检测和分类神经网络,显著提高系统感知性能。除了支持多级内存系统以减少使用外部SDRAM的高成本传输,并支持多重压缩选项和异构可扩展性,提升算力满足AI算法的需求。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    460

    文章

    52736

    浏览量

    444142
  • AI
    AI
    +关注

    关注

    88

    文章

    35758

    浏览量

    282461
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI终端爆发!模拟芯片企业2024年狂揽市场,最高净利暴增400%

    ,他们均受益于市场需求的增长,特别是在高性能数模混合信号、电源管理、信号链等领域。这些企业不仅在传统业务领域取得了显著增长,还积极布局AI技术,以应对新兴的市场需求和技术挑战。 ? ? 图:2024年模拟
    的头像 发表于 04-18 00:18 ?2515次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>终端</b>爆发!模拟<b class='flag-5'>芯片</b>企业2024年狂揽<b class='flag-5'>市场</b>,最高净利暴增400%

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    基础。 睿海光电在深圳建有3120+平方米智能制造基地与独立研发中心,构建了从设计到交付的全链条能力,支撑其快速响应市场需求。 二、交付速度:比行业快2-3天,赋能客户抢占先机 在AI算力竞赛中,交付效率
    发表于 08-13 19:01

    4450亿美元!Edge AI市场大爆发,英特尔布局哪些AI SoC芯片

    AI是边缘计算和IoT增长的最大驱动力,预计到2030年,AI将成为全球边缘市场的重要驱动力,市场规模有望达到4450亿美元。英特尔在边缘
    的头像 发表于 08-04 08:46 ?5704次阅读
    4450亿美元!Edge <b class='flag-5'>AI</b><b class='flag-5'>市场</b>大爆发,英特尔布局哪些<b class='flag-5'>AI</b> SoC<b class='flag-5'>芯片</b>?

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    ,接下来一一解读。 算法创新 在深度学习AI芯片的创新上,书中围绕大模型与Transformer算法的算力需求,提出了一系列架构与方法创新,包括存内计算技术、基于开源RISC-V架构的AI
    发表于 07-28 13:54

    AI算力需求激增,芯片散热材料如何选?

    电子终端产品持续向高集成、轻薄化方向发展的大趋势下,芯片和元器件体积不断缩小,功率密度却在快速增加,消费电子产品的散热方案需要不断升级。封装材料成本通常会占到整体封装成本的
    的头像 发表于 07-18 07:18 ?462次阅读
    <b class='flag-5'>AI</b>算力<b class='flag-5'>需求</b>激增,<b class='flag-5'>芯片</b>散热材料如何选?

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型的普及是近三年来的一件大事,万物皆可大模型已成为趋势。作为大模型开发应用中重要组
    发表于 05-02 09:26

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发者大会2025(MDDC 2025),不仅聚合了全球生态
    发表于 04-13 19:52

    DeepSeek推动AI算力需求:800G光模块的关键作用

    的100G光模块已无法满足高效能AI训练和推理所需的大规模数据传输。为了应对这一挑战,400G、800G乃至1.6T光模块的出现成为行业必然趋势。特别是随着DeepSeek等模型的规模扩大,如何提升
    发表于 03-25 12:00

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    加速特定任务,如数据预处理、加密和解密等,从而提高整体计算效率。 3.芯片设计与生态的变革? 定制化与灵活性:FPGA的可编程性使其能够根据特定应用需求进行定制化设计,这与
    发表于 03-03 11:21

    行业集结:共同定制 RK3566 集成 AI 眼镜的前沿 AR 方案

    高性能、低功耗和多功能集成等优势,适用于多种智能场景。设简约,佩戴轻巧,AI 眼镜不仅是一款智能设备,更是彰显品味的时尚单品。通过丰富的硬件和软件支持,可以快速实现产品化,满足市场需求。 在技术革新前沿
    发表于 02-20 18:44

    AI芯片上的应用:革新设计与功能

    AI芯片上的应用正在深刻改变着芯片设计、制造和应用的全过程。未来,随着AI技术的不断进步和应用场景的不断拓展,AI
    的头像 发表于 02-17 16:09 ?672次阅读

    AI赋能边缘网关:开启智能时代的新蓝海

    的引入彻底改变了这一局面。通过在边缘网关集成AI芯片和算法模型,使其具备了实时数据分析、智能决策和自主控制能力。在工业质检场景中,搭载AI算法的边缘网关能够实时识别产品缺陷,将检测效率提升300%以上
    发表于 02-15 11:41

    聚焦AI芯片,角逐芯未来

    国内智算中心建设的加速推进与互联网企业对AI需求的激增,智算芯片市场需求正步入快速增长通道,预计至2026年,国内AI
    的头像 发表于 01-08 09:10 ?637次阅读

    苹果利用AWS定制AI芯片提升服务

    。 据了解,苹果目前正积极利用AWS的定制AI芯片来提升其搜索等核心服务的性能和效率。通过借助AWS的专业技术和资源,苹果能够更好地满足全球客户的需求,提供更加智能化、高效化的服务体验
    的头像 发表于 12-05 14:14 ?647次阅读

    Marvell CTO揭示AI芯片市场挑战:UQD零部件与定制芯片成关键

     Marvell(美满电子)公司的首席技术官(CTO)Noam Mizrahi近日表示,由于保持竞争力所需资金庞大,仅有少数顶级芯片开发商能够持续投资人工智能(AI)计算的半导体领域。他强调,定制
    的头像 发表于 10-22 14:33 ?983次阅读