0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

端侧AI需求大爆发!安谋科技新一代NPU IP赋能AI终端应用

章鹰观察 ? 来源:电子发烧友 ? 作者:章鹰 ? 2025-07-11 01:16 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(电子发烧友网报道 文/章鹰) 2025年是端侧AI爆发元年,以AI眼镜为例,Meta的Ray-Ban系列价格已降至299美元,2025年预计出货200万副,此外,混合AI在端侧实现手机拍照功能优化,汽车自动驾驶的本地决策,都依赖算力提升,这对端侧AI SoC的性能带来挑战,上游IP厂商的新品可以给SoC厂商带来最新助力。

7月9日,在上海张江举办的端侧AI技术论坛上,安谋科技(中国)有限公司高级产品经理叶斌表示,当前端侧AI正从概念走向现实,安谋科技自研“周易”NPU可驱动终端算力跃迁,助力产业把握端侧AI“芯”机遇。

端侧大模型参数提升,安谋科技DSA架构驱动芯片能效比


“当前,端侧设备部署的AI大模型10B为上限,Meta开源了LIama3大模型,包括8B、30B、70B模型。未来,数据将在云端汇集训练,云端AI模型将具备更强的通用性。终端设备上则进行轻量化模型运用,体现出更低延迟、更具个性化和隐私安全等优势。端侧设备,从旗舰平板、手机、智慧屏到PC,硬件平台的演进中,对AI SoC来讲,多核、算力提升成为当前主流发展趋势。”安谋科技叶斌分析说。

在他看来,随着技术发展,计算重心将进一步向更高效、更专业的计算架构或芯片转移,以平衡性能与成本,更好地支撑大模型及各类AI应用的发展。这种情况下,DSA架构仍然是端侧追求能效比和面效比的选择。端侧利用NPU IP等多核协同,实现算力提升,将成为技术发展的关键。

安谋新一代周易NPU IP支持高精度浮点运算,应对未来应用场景


叶斌指出,安谋科技新一代自研周易“NPU” IP,从架构设计角度对于transformer继续优化,兼容CNN超分场景和大模型场景加速,并且持续大规模软件投入,不断完善算字库,支持大语言模型轻量化部署与快速响应,快速满足AI PC、手机、智能座舱,ADAS等新兴端侧AI应用需求。

AI大模型要提升理解能力,必然要增加上下文窗口、序列长度来达到一个效果。AI处理器的架构设计上,充分考虑算力配比平衡的需求。

端侧AI能力受制于算力墙、内存墙和功耗墙。从应用和场景算力匹配的能力看,从存储的演进路线来说,LPDDR5X可以支持端侧10B以下的模型,主要应用在手机、PAD和PC端,汽车智能座舱都是在10B上下的模型,物联网设备的模型体量更小,未来存储演进到LPDDR6,预期模型的容量可以提升50%以上。

叶斌表示,大模型是算法、硬件平台双向奔赴的一个过程,随着更低位宽的算法应用,效果提升,最终令这些模型可以部署到端侧。未来2年到3年,更大的模型在端侧部署的场景。我们预测,20B、30B的AI模型部署在端侧,甚至到30B、40B的模型在端侧部署。

在当前趋势下,端侧AI应用对算力的需求将持续增加,从CNN时代的INT低精度变为需要高精度的FLOAT浮点运算。安谋科技新一代周易NPU做了性能的升级和优化,支持多数据类型,从INT4、 INT8、INT16以及FLOAT 浮点运算。考虑到能效比,硬件上面做到充分的复用。未来在端侧减少内存数据的搬运,中间做一个专用的加速优化。长下文场景,安谋科技在AI加速部分进行了增强。此外,我们对于多任务执行QOS技术进行增强,确保端侧AI多样应用的使用体验。

叶斌强调说:“我们看到AI大模型对带宽提出更高要求及AI计算中心偏移。结合端侧大模型诉求,端侧从NPU,追求能效比和面效比的选择。加上多级缓存,硬件流水的结构,使得数据本地化,节省数据搬运和功耗的开销。”

在端侧AI设备加速落地,AI SoC芯片设计热潮的推动下,半导体IP的战略价值不断显现。IP授权模式,安谋科技采取灵活的架构授权模式,无论是硬件、软件,NPU除了DSK架构外,软件生态也非常关键。安谋科技继承了ARM的基因,NPU IP有一套完整的软件工具链,GPU最新量化工具,还有动态识别的支持和开源的模型库,安谋科技加大投入不断完善算子库,凭借软硬件的创新系统,新一代周易NPU IP能更好满足新兴端侧AI应用需求,满足用户兼具功耗和性能优势的端侧算力体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NPU
    NPU
    +关注

    关注

    2

    文章

    333

    浏览量

    19808
  • 安谋科技
    +关注

    关注

    0

    文章

    116

    浏览量

    7881
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科技CEO陈锋:立足全球标准与本土创新,AI计算“芯”时代

    表题为 《立足全球标准与本土创新, AI 计算 “ 芯 ” 时代》 的主旨演讲。聚焦新兴AI大模型技术趋势,陈锋系统性地阐述了
    发表于 07-11 16:36 ?1149次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技CEO陈锋:立足全球标准与本土创新,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>计算“芯”时代

    苹芯科技 N300 存算NPU,开启 AI 新征程

    随着人工智能技术的爆发式增长,智能设备对本地算力与效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制
    的头像 发表于 05-06 17:01 ?501次阅读
    苹芯科技 N300 存算<b class='flag-5'>一</b>体 <b class='flag-5'>NPU</b>,开启<b class='flag-5'>端</b><b class='flag-5'>侧</b> <b class='flag-5'>AI</b> 新征程

    首创开源架构,天玑AI开发套件让AI模型接入得心应手

    猛增50倍,将训练时间从整天缩短至半小时。更快的LoRA训练,让AI基于用户
    发表于 04-13 19:52

    高通推动终端AI释放全新价值

    通过蒸馏技术将百亿参数模型压缩至设备可运行的创新,让AI推理成本大幅下降,为终端AI
    的头像 发表于 03-21 09:28 ?532次阅读
    高通推动<b class='flag-5'>终端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>释放全新价值

    科技“周易”NPU成功部署DeepSeek-R1

    近日,科技宣布其最新一代“周易”NPU处理器硬件平台已成功运行DeepSeek-R1系列模型,实现了软硬件协同优化的卓越性能与成本效益。这
    的头像 发表于 02-19 10:30 ?684次阅读

    软硬协同优化,科技新一代“周易”NPU实现DeepSeek-R1高效部署

    ?近日,搭载科技最新一代“周易”NPU处理器的硬件平台成功运行DeepSeek-R1系列模型,性能卓越、成本优异,为用户带来了更高效、便捷的AI
    发表于 02-14 10:52 ?196次阅读
    软硬协同优化,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技<b class='flag-5'>新一代</b>“周易”<b class='flag-5'>NPU</b>实现DeepSeek-R1<b class='flag-5'>端</b><b class='flag-5'>侧</b>高效部署

    科技与智源研究院达成战略合作,共建开源AI“芯”生态

    支持、生态系统建设与推广等系列深入合作,共同打造基于Arm架构的开源技术生态体系,国内大模型与人工智能产业的高速发展。 图:现场签约照片
    发表于 12-26 17:06 ?425次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技与智源研究院达成战略合作,共建开源<b class='flag-5'>AI</b>“芯”生态

    广和通开启AI新时代

    AI发展正酣,随着终端芯片算力越来越高、模型能力越来越强、实时响应及隐私保护的应用
    的头像 发表于 12-12 10:35 ?826次阅读

    MediaTek天玑移动平台腾讯会议AI人像分割模型

    MediaTek 与腾讯会议联合优化的 NPU 虚拟背景功能,已在搭载 MediaTek 天玑旗舰芯的终端正式上线。作为双方初次开展的软硬件生态合作,此次联合优化旨在充分利用天玑移
    的头像 发表于 11-29 15:30 ?722次阅读

    AI,风起移动智能计算

    新一代骁龙旗舰芯片,AI的繁荣肇始
    的头像 发表于 11-22 09:55 ?2992次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>,风起移动智能计算

    智能无处不在:科技“周易”NPU开启AI新时代

    需求,将AI的触角延伸至世界的每个角落。 近日,在EEVIA主办的第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上,科技产品总监
    发表于 11-15 11:42 ?440次阅读
    智能无处不在:<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技“周易”<b class='flag-5'>NPU</b>开启<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新时代

    AI浪潮已来!炬芯科技发布新一代AI音频芯片,效比和AI算力大幅度提升

    电子发烧友原创 章鹰 ? 11月5日,在深圳会展中心7号馆内,炬芯科技董事长兼CEO周正宇博士带来了《AI芯片的未来》演讲,他对
    的头像 发表于 11-06 09:11 ?4069次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>浪潮已来!炬芯科技发布<b class='flag-5'>新一代</b><b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>音频芯片,<b class='flag-5'>能</b>效比和<b class='flag-5'>AI</b>算力大幅度提升

    AI应用趋热:NPU如何解决其关键痛点

    智库举办的第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上,科技的产品总监鲍敏祺深入剖析了AI应用的广阔前景,并强调了神经处理单
    的头像 发表于 10-31 15:00 ?1350次阅读

    科技异构算力组合,破局生成式AI算力挑战

    ,“此芯P1”不仅异构集成了Armv9 CPU核心与Arm Immortalis GPU,还搭载了科技(中国)有限公司(以下简称“科技”)“周易”
    的头像 发表于 08-13 09:12 ?960次阅读

    科技异构算力AI计算,此芯科技首款AI PC芯片发布

    7月30日,此芯科技集团有限公司(以下简称“此芯科技”)AI PC战略暨首款芯片发布会在上海举行,正式推出了其首款专为AI PC打造的异构高能效芯片产品——“此芯P1”。作为国产新一代AI
    发表于 07-31 14:36 ?1329次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技异构算力<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>计算,此芯科技首款<b class='flag-5'>AI</b> PC芯片发布