0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

苹芯科技存算一体创新架构,突破边缘AI芯片技术困局

Carol Li ? 来源:电子发烧友网 ? 作者:李弯弯 ? 2025-07-17 08:01 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)在数字化浪潮席卷全球的当下,边缘人工智能正以前所未有的速度重塑产业格局。根据市场调研机构数据显示,2025年全球AI芯片市场规模预计突破1200亿美元,年均复合增长率超25%,其中,边缘计算芯片增速达35%。这一增长势头背后,是可穿戴、智能安防、智慧工业等场景对低功耗、低延迟、高隐私性计算的迫切需求。

然而,行业高速发展的同时,传统冯·诺依曼架构的“存储墙”瓶颈、高功耗与能效比失衡等技术挑战,正成为制约边缘AI大规模落地的关键掣肘。在此背景下,电子发烧友特别采访了存算一体芯片企业——苹芯科技,探寻其突破技术困局的创新路径。

苹芯科技:存算一体架构重构边缘计算范式

苹芯科技成立于 2021 年,是一家专注于存算一体技术的芯片设计企业。致力于利用新兴存算一体技术对人工智能计算进行加速,目标是低成本实现高性能AI计算引擎,引领构建非冯架构计算体系与生态系统。其核心团队由清华系科学家与高通、美光等半导体巨头的技术专家组成,在存储器设计、神经网络加速、低功耗架构等领域拥有深厚积累。

“传统冯·诺依曼架构面临严重的‘存储墙’和‘功耗墙’瓶颈,数据在存储器与计算单元间频繁迁移导致60%~80%的能耗浪费,严重制约了边缘AI芯片的实时性能。”苹芯科技联合创始人兼CEO杨越表示,“我们的存算一体架构从根本上突破了这一限制,通过在SRAM存储器内部直接完成乘累加运算,实现了计算与存储的深度融合。”

苹芯科技采用了多项关键技术创新构建竞争壁垒:其一是混合精度存算阵列设计,通过纯数字计算和数字域控制的协同优化,实现高并行度的矩阵-向量乘法运算,在28nm工艺下达到27 TOPS/W的能效比。其二是自适应稀疏化计算引擎,利用神经网络的稀疏性特征,通过硬件加速器动态识别,实现2-5倍的性能提升。其三是多级功耗管理技术,集成了时钟门控、电压岛和动态电压频率调节,在保证计算性能的同时将待机功耗降低至μW级别。

“另外,在系统架构层面,我们也通过数据流优化技术,算子融合技术,配合零拷贝数据处理机制等等方式,使我们的存算一体芯片在关键指标上实现了显著突破,如:核心计算能效比达到27 TOPS/W,推理延迟降低至毫秒级别。”杨越介绍:“这些技术优势使得我们的方案在很多对实时性和功耗敏感的边缘AI应用场景中具备了独特的竞争优势,为客户提供了更优的性价比和更强的产品差异化能力。”

苹芯科技目前已经开发多款产品,包括PIMCHIP-S300、PIMCHIP-N300等。PIMCHIP-S300是一款多模态智慧感知决策AI芯片,搭载基于SRAM的存算一体计算加速单元,具备AI算力整合、多模态融合感知、跨领域智慧决策、超低功耗、极速响应等特点。可提供端到端的语音、图像、雷达等完整解决方案和应用,为智能可穿戴设备、智能安防、具身智能、AI大模型、健康数据分析等领域提升运算效率、降低能耗。

PIMCHIP-N300是新一代存算一体神经网络处理单元,专为机器学习和人工智能领域设计,能高效处理人工神经网络等算法和模型。同时团队提供免费软件工具链,具有高度灵活性和易集成性,可缩短产品开发周期,加速客户品牌智能化升级。

目前苹芯科技的芯片主要应用于智能可穿戴设备、智能安防、智慧工业、智慧医疗、教育智能化等行业。

谈到其产品的独特优势,杨越认为主要体现在三个方面:其一,能效比领先优势。通过存算一体架构实现数据“零搬运”,在28nm工艺下达到27 TOPS/W的能效比,相比传统架构提升了一个数量级。这一技术突破使得苹芯科技的芯片在同等算力下功耗仅为竞品的1/10,在同等功耗下算力提升10倍以上。

其二,快速迭代验证能力。基于模块化IP核设计和成熟SRAM工艺,苹芯科技能够快速的完成从算法优化到芯片验证的完整迭代,相比传统12-18个月的开发周期缩短60%以上,帮助客户快速抢占市场先机。

其三,边缘场景深度优化。针对边缘AI应用的“低功耗、小体积、高实时性”需求,苹芯科技开发了专用的神经网络加速引擎和自适应功耗管理技术,在保证计算精度的同时实现毫秒级响应。

“我们的客户厂商在开发新一代智能健康监测产品时遇到了严峻挑战。该产品需要实时处理心音心电、体温、运动状态等多维生理数据并进行AI算法分析,但原有ARM+DSP架构方案存在AI推理功耗高达2.5W、数据处理延迟100-200ms、长时间运行导致设备表面温度超过40°C等问题,严重影响用户体验和产品竞争力。”杨越举例道:“客户在对比了多家厂商方案后,最终选择集成了我们的PIMCHIP-N300加速单元。关键原因在于我们的NPU在处理相同AI算法时功耗相比原方案降低80%,通过存算一体架构将数据处理延迟降低至5-10ms,显著改善了用户体验。”

经过6个月的技术适配、原型验证和芯片集成,客户产品成功交付。实际效果超出预期:设备续航时间从原来的12小时提升至72小时,实时健康监测功能获得用户高度认可,同时帮助客户节省电池成本约30%,整体BOM成本降低20%。杨越强调:“这一案例充分体现了我们存算一体技术在边缘AI应用中的显著优势,不仅解决了客户的技术难题,更带来了实质性的商业价值和市场竞争力提升。”

创新方案、生态构建,精准捕捉和解决行业痛点

边缘AI芯片的落地高度依赖场景需求,针对如何精准捕捉不同行业痛点的问题,杨越谈到:“我们建立了‘三层深入、四维分析’的行业痛点捕捉机制。通过深入产业链上游(算法开发商)、中游(设备制造商)和下游(最终用户)进行需求调研,从技术性能、成本控制、功耗管理和部署便利性四个维度全面评估行业需求。通过与行业龙头企业建立联合实验室、参与标准制定等方式,我们能够在技术趋势萌芽期就准确识别行业痛点。”

以智能安防监控行业为例,苹芯科技通过深度调研发现了两个核心痛点:首先是电池驱动场景下的超低功耗智能化需求,传统方案在待机状态下功耗仍达到数百毫瓦,导致电池续航仅能维持几天,无法满足偏远地区、临时部署等场景的长期监控需求;其次是成本压力,随着AI算法复杂度提升,传统GPU方案成本激增,中小型安防厂商难以承受。

“基于上述痛点,我们充分发挥存算一体架构的独特优势,设计了‘超低功耗待机+多模态识别唤醒’的创新方案。”杨越介绍:“在待机状态下,我们通过存算一体架构实现了微瓦级的功耗控制,芯片仅保持基础的音频红外传感器监测功能运行。当检测到声音异常、人体热源或运动轨迹等多模态信号时,系统能够在毫秒级时间内从待机状态唤醒至全功能运行模式。”

杨越进一步介绍说:“具体技术实现上,我们在存算一体阵列中集成了专用的多模态信号处理单元,通过硬件加速音频特征提取、红外图像处理和运动检测算法,实现了超低功耗的智能唤醒功能。同时,采用成熟的28nm工艺节点,有效控制了单颗芯片的实际成本,相比传统方案降低了70%以上。”

实际测试结果显示,苹芯科技的芯片在待机状态下功耗为微瓦级别,在客户的常规状态使用模式下,保证系统的电池续航可达6个月以上,唤醒响应时间小于10ms,多模态识别准确率达到92%以上。这一方案不仅解决了电池驱动安防设备的续航难题,更以极具竞争力的成本优势帮助客户快速占领市场。

在生态合作伙伴网络构建上,苹芯科技也有自己的独到见解。苹芯科技通过“分层联动、场景绑定”的模式构建生态合作伙伴网络。在技术层与芯片制造企业、算法供应商建立联合研发机制,共建技术验证平台;在产品层为设备厂商提供从芯片到解决方案的全栈支持,包括硬件参考设计、软件工具链及测试服务;在市场层与系统集成商深度协同,针对垂直领域打造端到端行业方案。通过这种多层级合作体系,实现从技术创新到商业落地的全链路贯通。

目前,苹芯科技已形成覆盖产业链关键环节的战略级合作矩阵。在供应链端,与头部晶圆制造企业、封装测试厂商建立长期联合开发关系;在终端,与消费电子、工业设备等领域的龙头企业达成深度合作,共同定义下一代产品规格;在 AI基础设施端,与主流算法框架厂商、云服务提供商构建技术适配联盟,推动存算一体技术与开源生态的融合。

“这些合作精准解决了产业链各环节的核心痛点。”杨越谈道:“与芯片制造企业合作时,我们针对存算一体架构的特殊工艺需求,联合优化光刻精度控制、存储单元一致性校准等关键环节,将量产良率大幅提升,同时解决了新型计算单元与现有产线的兼容性问题,使芯片量产周期缩短的同时确保高性能芯片的稳定供应。”

苹芯科技还与算法供应商协同突破“算法-芯片”适配瓶颈,针对传统架构中90%算力浪费在数据搬运的问题,通过定制化指令集与算法算子的深度绑定,将有效算力利用率大幅提升;同时开发跨框架迁移工具,解决了主流算法在存算一体芯片上的适配难题,显著提升AI处理效率。

与设备厂商及系统集成商合作聚焦场景落地障碍,杨越表示:“我们为设备厂商提供模块化硬件接口和功耗调节SDK,解决了芯片在智能耳机、工业传感器等不同终端的供电稳定性与空间适配问题。此外,我们联合系统集成商开发行业专用固件,将产品在各行业的部署调试周期缩短,加速技术方案向商业应用的转化。”

边缘AI芯片商业化阻碍及技术演进趋势

边缘AI芯片大规模商用面临几大核心阻碍:其一是成本与ROI的矛盾,当前AI芯片的设计、制造和部署成本相对较高,而许多应用场景的商业回报周期较长,企业难以在短期内看到明确的投资回报,这在很大程度上制约了大规模商用的积极性。

其二是技术门槛与人才短缺,边缘AI芯片涉及算法优化、硬件设计、软件开发等多个专业领域,企业往往缺乏既懂AI算法又懂芯片架构的复合型人才,同时开发工具链不够完善,增加了产品开发的难度和周期。

其三是标准化与生态协同问题,不同厂商的芯片架构、接口标准、软件生态各不相同,导致系统集成复杂度高,互操作性差,企业在选择方案时面临较大的技术风险和迁移成本。

从行业的角度来看,该如何应对这些阻碍呢?杨越认为:“需要建立统一的行业标准和认证体系,降低不同厂商产品间的集成难度;完善开源工具链和开发生态,降低技术门槛;加强产学研合作,培养更多复合型人才;推动产业链上下游协同,通过规模效应降低整体成本。只有通过行业协作才能真正推动边缘AI芯片的大规模商用落地。”

为了应对挑战,苹芯科技采取的行动主要是:采取优化芯片架构设计、应用高性能传统工艺降低成本;加强软件研发,完善软件工具链和生态;积极参与行业标准制定等。

杨越认为,未来3~5年,边缘AI芯片将呈现这样几个趋势:其一,多模态AI融合成为主流。单一模态的AI应用将向多模态融合演进。视觉、语音、文本、传感器数据的协同处理将成为标配,要求芯片具备更强的异构计算能力和跨模态数据处理效率。

其二,边缘大模型轻量化部署。随着大语言模型和多模态大模型的快速发展,如何在边缘设备上高效部署轻量化大模型将成为关键挑战。这要求芯片在保持低功耗的同时,具备处理复杂推理任务的能力。

其三,超低功耗与长续航需求激增。物联网设备、可穿戴设备、智能家居等应用场景对功耗要求越来越苛刻,毫瓦级甚至微瓦级的功耗控制将成为基本要求,电池续航需要达到月级别甚至年级别。

其四,实时性要求持续提升。自动驾驶工业控制、医疗监测等关键应用对延迟的容忍度进一步降低,从毫秒级向微秒级演进,对芯片的实时响应能力提出更高要求。

其五,成本压力与规模化部署。随着AI应用的普及,成本将成为决定性因素,芯片需要在保证性能的前提下实现更低的单位成本,以支撑大规模商业化部署。

对此,苹芯科技也有自己的应对布局。苹芯科技将持续深化存算一体架构技术,重点突破三个方向:一是提升存算一体阵列的密度和效率;二是开发支持多精度、多数据类型的灵活计算单元,适应不同AI算法的精度需求;三是构建硬件级的多模态数据融合处理能力,通过专用的跨模态特征提取和融合单元,实现视觉、语音、传感器数据的高效协同处理。

同时基于超低功耗优势,苹芯科技也将重点布局三个高增长赛道:一是智能物联网领域的环境监测、跟踪等应用,目标实现年级别的电池续航;二是医疗健康领域的连续监测设备,重点突破生理信号的实时AI分析;三是工业4.0场景的边缘智能,专注于预测性维护和质量检测等应用。

“这些战略布局的核心目标是,确保我们在未来3~5年的技术演进中始终保持领先地位,不仅要在技术指标上持续突破,更要在商业化落地和生态建设上形成竞争壁垒,最终实现从技术领先到市场领导的转变。”杨越强调。

写在最后

边缘AI芯片作为推动各行业智能化转型的核心部件,其发展前景广阔。然而,面对低功耗、高性能、低成本等多重挑战,行业需要不断创新与协作。苹芯科技凭借其存算一体架构的技术优势,在边缘AI芯片领域取得了显著突破,为行业提供了高效、低功耗的解决方案。未来,随着多模态AI融合、边缘大模型轻量化部署等趋势的加速推进,边缘AI芯片将迎来更加广阔的发展空间。苹芯科技将继续深耕存算一体技术,为构建智能化的未来世界贡献力量。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 边缘AI
    +关注

    关注

    0

    文章

    167

    浏览量

    5477
  • 存算一体
    +关注

    关注

    0

    文章

    109

    浏览量

    4686
  • 苹芯科技
    +关注

    关注

    1

    文章

    25

    浏览量

    384
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    缓解高性能一体芯片IR-drop问题的软硬件协同设计

    在高性能计算与AI芯片领域,基于SRAM的一体(Processing-In-Memory, PIM)
    的头像 发表于 07-11 15:11 ?185次阅读
    缓解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>芯片</b>IR-drop问题的软硬件协同设计

    国际首创新突破!中国团队以一体排序架构攻克智能硬件加速难题

    2025 年 6 月 25 日,北京大学团队在智能计算硬件方面取得领先突破,国际上首次实现了基于一体技术的高效排序硬件
    的头像 发表于 07-02 16:50 ?237次阅读
    国际首<b class='flag-5'>创新</b><b class='flag-5'>突破</b>!中国团队以<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>排序<b class='flag-5'>架构</b>攻克智能硬件加速难题

    Pimchip-N300 | MCU厂商迈向AI时代的“站式钥匙”

    天花板,难以从根本上适应边缘AI应用的计算要求。因此,团队带来PIMCHIP-N300,款基于
    的头像 发表于 05-30 17:02 ?1127次阅读
    Pimchip-N300 | MCU厂商迈向<b class='flag-5'>AI</b>时代的“<b class='flag-5'>一</b>站式钥匙”

    科技 N300 一体 NPU,开启端侧 AI 新征程

    随着端侧人工智能技术的爆发式增长,智能设备对本地力与能效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制约端侧AI性能
    的头像 发表于 05-06 17:01 ?501次阅读
    <b class='flag-5'>苹</b><b class='flag-5'>芯</b>科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b> NPU,开启端侧 <b class='flag-5'>AI</b> 新征程

    PIMCHIP S300 全球首款28nm节点实现存一体产品化AI芯片

    PIMCHIP-S300 芯片科技基于一体技术
    的头像 发表于 03-28 17:06 ?1130次阅读
    PIMCHIP S300 全球首款28nm节点实现存<b class='flag-5'>算</b><b class='flag-5'>一体</b>产品化<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>

    出席2024中国AI芯片开发者论坛

    12月5日,科技CTO章尧君受邀出席了2024中国AI芯片开发者论坛,并发表了题为《
    的头像 发表于 02-05 16:51 ?711次阅读
    <b class='flag-5'>苹</b><b class='flag-5'>芯</b>出席2024中国<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>开发者论坛

    一体行业2024年回顾与2025年展望

    2024年,大模型技术的迅猛发展成为人工智能领域的核心驱动力,其对硬件力和存储效率的极致需求,促使一体
    的头像 发表于 01-23 11:24 ?1114次阅读

    · 智启未来 — 2024科技产品发布会盛大召开

    8月8日,国际领先的一体芯片开拓者——科技在北京召开“
    的头像 发表于 12-18 15:31 ?1688次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b>于<b class='flag-5'>芯</b> · 智启未来 — 2024<b class='flag-5'>苹</b><b class='flag-5'>芯</b>科技产品发布会盛大召开

    科技亮相2024中国AI芯片开发者论坛

    近日,科技CTO章尧君受邀出席了2024中国AI芯片开发者论坛,并发表了题为《
    的头像 发表于 12-10 16:21 ?557次阅读

    开源芯片系列讲座第24期:基于SRAM的高效计算架构

    鹭岛论坛开源芯片系列讲座第24期「基于SRAM的高效计算架构」明晚(27日)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目基于SRAM
    的头像 发表于 11-27 01:05 ?902次阅读
    开源<b class='flag-5'>芯片</b>系列讲座第24期:基于SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b>的高效计算<b class='flag-5'>架构</b>

    一体化与边缘计算:重新定义智能计算的未来

    、人工智能(AI)等技术的发展,数据量的分布性、实时性需求增加,边缘计算也逐渐从概念走向落地。本文将介绍
    的头像 发表于 11-12 01:05 ?861次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>化与<b class='flag-5'>边缘</b>计算:重新定义智能计算的未来

    一体架构创新助力国产大AI芯片腾飞

    在湾展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《
    的头像 发表于 10-23 14:48 ?899次阅读

    科技新突破:首款支持多模态一体AI芯片成功问世

    一体介质,通过存储单元和计算单元的深度融合,采用22nm成熟工艺制程,有效把控制造成本。与传统架构下的AI
    发表于 09-26 13:51 ?686次阅读
    科技新<b class='flag-5'>突破</b>:首款支持多模态<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>成功问世

    科技发布AI革命新品,引领高效能计算新纪元

    智能芯片领域再迎突破科技于北京盛大召开新品发布会,以“
    的头像 发表于 08-12 15:04 ?799次阅读

    科技引领存一体技术革新 PIMCHIP系列芯片重塑AI计算新格局

    智能芯片国产化再传利好,8月8日,国际领先的一体芯片开拓者——
    发表于 08-08 17:21 ?407次阅读
    <b class='flag-5'>苹</b><b class='flag-5'>芯</b>科技引领存<b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>技术</b>革新   PIMCHIP系列<b class='flag-5'>芯片</b>重塑<b class='flag-5'>AI</b>计算新格局