0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

安霸发布N1系列生成式AI芯片支持前端设备运行本地LLM应用

Ambarella安霸半导体 ? 来源:Ambarella安霸半导体 ? 2024-01-09 15:19 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

单颗 SoC 支持 1 至 340 亿参数的多模态大模型(Multi-Modal LLM)推理,实现前端低功耗生成式 AI

美国加利福尼亚州圣克拉拉市,2024年1月8日-

Ambarella (下称“安霸”,专注 AI 视觉感知的半导体公司,纳斯达克股票代码:AMBA)于当天宣布,在 2024 国际消费电子展(CES)期间,展出在其新款 N1 系列 SoC 上运行多模态大模型(Multi-Modal LLM),其每次推理的功耗显著低于当前市场的通用 GPU 解决方案。

生成式 AI 是为了处理大规模数据集而最早应用于服务器上的变革性技术,而安霸的目标是将生成式 AI 部署于终端设备和本地硬件上,从而将其广泛应用于视频安防分析、机器人以及众多工业领域。

安霸将在中高端 SoC 上提供已优化的生成式 AI 处理。这些 AI SoC 包含了功耗低于 5 瓦的 CV72 芯片,以及最新的可应用于服务器端,功耗低于 50 瓦的 N1 芯片。与 GPU 及其他 AI 加速器相比,安霸提供了完整的 SoC 解决方案,每生成一个 token 的能效比最高可提高 3 倍,并可快捷、低成本地部署在终端产品中。

生成式 AI 在我们的目标市场上实现了突破,之前无法想象的功能得以实现。使用我们的 N1 系列 SoC 来进行多模态大模型推理,将使所有的前端设备变得更智能,更低功耗,和更低成本。

市场研究公司 Omdia 高级计算首席分析师 Alexander Harrowell 表示:“在未来 18 个月内,几乎所有设备前端应用都将被生成式 AI 增强。把生成式 AI 的计算转移到设备前端的要点,就在于每瓦的 AI 性能,以及它与前端生态系统其余部分的集成,而不仅仅是原始数据的吞吐量。”

所有安霸的 AI SoC 均可搭配全新的 Cooper 开发平台。此外,为了缩短客户新产品上市的时间,安霸已预先移植和优化了 LIama-2 等流行的大语言模型。其在 N1 芯片上运行的大语言和视觉助手 LLava 模型,可对多达 32 个摄像头同时进行多模态视觉分析。这些经过预训练和调优的模型可从 Cooper Model Garden 下载。

在现实世界的众多应用里,除了语言,视觉输入也是一种关键模式。安霸 SoC 的特有架构非常适合以超低功耗同时运行视频处理和 AI 计算。安霸的 AI SoC 并不是单一的 AI 加速器,它不仅能够高效处理多模态大模型,还能同时执行各种系统功能。

生成式 AI 将成为计算机视觉处理中跨越式的新技术,它可将上下文学习和场景理解应用于各种设备,从而涵盖安防设施、自主机器人以及众多工业应用。基于安霸 AI 芯片的设备端通过运行大语言模型和多模态处理可实现以下功能:安防视频的上下文智能搜索、通过自然语言命令控制的机器人、以及多才多艺的AI助手,比如代码、文本和图像的生成等。

这些依赖摄像头和自然语言理解的系统,大部分将受益于设备前端的生成式 AI 处理,其处理速度得以提高,隐私保护得到加强,并且总成本也会降低。安霸解决方案支持的本地处理也非常适合垂直领域大语言模型,这些大语言模型通常需要针对每个具体应用场景进行调整;而传统的集中式服务器方案则是使用更大、功耗更高的大语言模型来满足不同用例的要求。

基于安霸最初为自动驾驶开发的 CV3-HD 架构,N1 系列 SoC 对总算力资源进行了针对性的优化,从而以超极低功耗运行多模态大模型。例如,N1 SoC 在单流模式下以低于 50 瓦的功耗运行 Llama2-13B,每秒可推理 25 个 token。N1 解决方案自带移植好的大模型,使系统整合更容易,因此它可快速帮助 OEM 厂商部署生成式 AI,特别是要求低功耗的各种应用,比如自带本地应用的 AI 智能盒子、送货机器人等,不一而足。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    828

    浏览量

    39221
  • soc
    soc
    +关注

    关注

    38

    文章

    4410

    浏览量

    223279
  • 计算机视觉
    +关注

    关注

    9

    文章

    1710

    浏览量

    46910
  • AI芯片
    +关注

    关注

    17

    文章

    1990

    浏览量

    35997
  • LLM
    LLM
    +关注

    关注

    1

    文章

    328

    浏览量

    895

原文标题:安霸发布 N1 系列生成式 AI 芯片,支持前端设备运行本地 LLM 应用

文章出处:【微信号:AMBARELLA_AMBA,微信公众号:Ambarella安霸半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    在ISC West上推出下一代前端多模态AI技术

    近日,Ambarella (下称“”,纳斯达克股票代码:AMBA, AI 视觉感知芯片公司)在美国拉斯维加斯西部防展(ISC West
    的头像 发表于 04-03 09:57 ?447次阅读

    Banana Pi 发布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 计算与嵌入开发

    RZ/V2N——近期在嵌入世界2025上新发布,为 AI 计算、嵌入系统及工自动化提供强大支持
    发表于 03-19 17:54

    AI Agent 应用与项目实战》阅读心得3——RAG架构与部署本地知识库

    继续学习迪哥的AI Agent入门引导书籍。 LLM在落地应用中面临着专业领域表现不足、知识更新困难、容易产生\"幻觉\"等问题,这些挑战严重制约了AI技术在各行业的深入
    发表于 03-07 19:49

    大算力AI芯片接入DeepSeek R1

    (Ambarela)在人工智能领域持续发力,已成功在多款 AI 芯片,包括 N 系列大算力
    的头像 发表于 02-17 13:36 ?594次阅读

    正点原子ESP32S3系列开发板全面支持小智AI

    飞速发展的大语言模型应用到实际的硬件设备中。 小智AI功能如下: WiFi / ML307 Cat.1 4G BOOT键唤醒和打断,支持点击和长按两种触发方式 离线语音唤醒ESP-SR
    发表于 02-14 17:01

    Gauzy和的战略合作取得突破性进展

    Gauzy 的 AI Smart-Vision CMS 采用先进的 CVflow AI SoC 支持 ADAS 功能,提升道路安全,重塑
    的头像 发表于 02-07 11:20 ?711次阅读

    发布N1-655前端生成AI芯片

    Ambarella(下称“”,纳斯达克股票代码:AMBA,AI 视觉感知芯片公司)在 CES 上发布
    的头像 发表于 01-09 10:29 ?1047次阅读

    基于Arm Neoverse平台的处理器革新生成AI体验

    Llama 是一个专为开发者、研究人员和企业打造的开源大语言模型 (LLM) 库,旨在推动生成 AI 的创新、实验及可靠地扩展。
    的头像 发表于 01-03 15:31 ?727次阅读
    基于Arm Neoverse平台的处理器革新<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>体验

    定制本地的ChatFile的AI问答系统

    会遇到这样的困扰?今天,我们将利用下面两个技术为自己定制一个本地的 ChatFile 的 AI 问答系统: 1. Google 最新开源的生成
    的头像 发表于 01-03 09:26 ?715次阅读
    定制<b class='flag-5'>本地</b>的ChatFile的<b class='flag-5'>AI</b>问答系统

    LG与携手推动 AI 舱内安全解决方案的发展

    移动技术领域的领导者 LG Electronics(下称“LG”)和 Ambarella(下称“”,纳斯达克股票代码:AMBA,AI 视觉感知芯片公司)今天宣布,LG 将在 202
    的头像 发表于 12-05 09:27 ?1157次阅读
    LG与<b class='flag-5'>安</b><b class='flag-5'>霸</b>携手推动 <b class='flag-5'>AI</b> 舱内安全解决方案的发展

    恩智浦如何在边缘设备上部署LLM

    近来,与AI相关的周期性热点几乎都围绕着大语言模型 (LLM) 和生成AI模型,这样的趋势反映出这些话题近年来日益增强的影响力和普及程度。
    的头像 发表于 11-29 09:39 ?1026次阅读

    设备上利用AI Edge Torch生成API部署自定义大语言模型

    MediaPipe LLM Inference API 让开发者们能够将一些最受欢迎的 LLM 部署到设备上。现在,我们很高兴能进一步拓展对模型的支持范围,并让大家部署到
    的头像 发表于 11-14 10:23 ?1233次阅读
    在<b class='flag-5'>设备</b>上利用<b class='flag-5'>AI</b> Edge Torch<b class='flag-5'>生成</b><b class='flag-5'>式</b>API部署自定义大语言模型

    生成AI工具作用

    生成AI工具是指那些能够自动生成文本、图像、音频、视频等多种类型数据的人工智能技术。在此,petacloud.ai小编为您整理
    的头像 发表于 10-28 11:19 ?794次阅读

    三行代码完成生成AI部署

    OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分为两个安装包分别是基础包与生成AI支持包,新发布的Ge
    的头像 发表于 08-30 16:49 ?811次阅读
    三行代码完成<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>部署

    谋科技异构算力组合,破局生成AI算力挑战

    ,“此芯P1”不仅异构集成了Armv9 CPU核心与Arm Immortalis GPU,还搭载了谋科技(中国)有限公司(以下简称“谋科技”)“周易”NPU等自研业务产品。凭借高能效的异构算力资源、系统级的安全保障以及强大的
    的头像 发表于 08-13 09:12 ?984次阅读