0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘AI应用越来越普遍,AI模型在边缘端如何部署?

Carol Li ? 来源:电子发烧友网 ? 作者:李弯弯 ? 2023-07-04 00:11 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)在人工智能时代,越来越多的AI应用需要从云端扩展到边缘端,比如智能耳机、智能摄像机、智能手环、物流机器人等,在边缘端部署AI已经成为趋势。如今AI大模型迅猛发展,AI大模型在端侧的部署也成了业界关注的焦点。

如何把AI模型在边缘端部署

首先得软硬件适配,硬件方面,适配的AI芯片越多越好,这样对于工程师来说,就降低了端侧模型适配迁移的难度,即使换一个设备也可以轻松部署上去;软件方面,主要的操作系统需要做适配,包括Linux、Windows、AndroidiOS等,这样无论是手机、PC都可以部署。还有框架适配,也是越全越好,比如PaddlePaddle、TensorFlow、PyTorch、Caffe、MXNet等。

其次是需要对模型进行压缩,在保证高精度的同时,最好也能够让模型跑得更快更省内存,这里需要采用模型压缩技术,比如模型量化、剪枝和蒸馏技术。尤其是如今AI大模型迅猛发展,未来大模型在端侧的部署也少不了要用到压缩技术。

可以说,模型压缩技术是实现AI大模型在边/端部署的核心技术。模型压缩技术可在保有大模型原有性能和精度基本不变前提下降低对推理算力的需求。

具体来看,量化,即将浮点计算转成低比特定点计算;网络剪枝,即去除神经网络中冗余的通道、神经元节点等;知识蒸馏,即将大模型作为教师模型,用其输出训练性能接近、结构更简的模型。

以清华大学唐杰教授团队2022年8月发布的1300亿参数模型 GLM-130B 为例,原模型支持在一台 A100 40G*8或 V100 32G*8 服务器上进行推理,而将模型量化至 INT 4精度后,相较INT 8精度其所需 GPU 内存降低50%,且可在一台4×RTX 3090(24G)或 8×RTX 2080Ti (11G )服务器上进行推理。

众多厂商实现AI大模型的端侧部署

谷歌、高通、华为等厂商已经实现AI大模型在端侧的部署。今年5月份,在Google/O开发者大会上,Google宣布了一个专门针对移动设备优化系统的TensorFlow新版本TensorFlowLite。这款被称为TensorFlowLite的软件库,是可在移动设备上运行的深度学习工具,它允许开发人员在用户的移动设备上实时地运行人工智能应用。

该软件库在设计上追求高速度和小储存,支持iOS和Android系统。如果开发者使用其他系统,也可以经过一系列复杂而冗长的编译流程,将TensorFlow编译成移动操作系统所支持的软件库,这样并不会改变TensorFlow的功能。

TensorFlowLite还提供了有限的预训练人工智能模型,包括MobileNet和InceptionV3物体识别计算机模型,以及SmartReplay自然语言处理模型。开发者用自己的数据集做的定制模型也可以部署在上面。TensorFlowLite使用Android神经网络应用程序界面(API),可以在没有加速硬件时直接调用CPU来处理,确保其可以兼容不同设备。

高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar此前表示,随着生成式AI的飞速普及,混合处理的重要性空前突显。混合处理AI的重要性空前突显,正如传统计算从大型主机和瘦客户端演变为当前云端和边缘终端相结合的模式,AI处理必须在云端和终端混合进行才能发挥其最大潜能。

根据高通的演示,将手机设置成“飞行模式”,再通过手机端全栈AI优化,这一模型能够完全在终端侧运行,实现在15秒内完成20步推理,生成饱含细节的图像。很重要的是,即便在飞行模式下,这些AI能力都可以得到实现,例如将Stable Diffusion的能力集成到相机应用中之后,用户在任何一个地点拍摄照片,再要求AI将照片背景改为夕阳之下的万里长城。

Ziad Asghar透露,如果在云端运行一个超过10亿参数的生成式AI模型,可能需要数百瓦的功耗,而在终端侧运行需要的功耗仅有几毫瓦。这赋予了高通在生成式AI领域的独特优势。不久的将来,拥有 100 亿或更高参数的模型将能够在终端上运行。

在今年3月春季旗舰新品发布会上,华为带来全新智慧搜图功能,基于多模态大模型技术,在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。用户可以像与人对话一样,通过语音唤醒小艺,使用自然语言在手机图库中搜索出匹配如 “山顶看日出”、“围炉煮茶”、“蓝色珊瑚中的小丑鱼”等描述的照片。

相较于传统图库使用标签进行照片搜索,存在准确率低、响应速度慢等问题,智慧搜图更加“聪明”。结合多模态大模型技术,智慧搜图对亿级的图文数据进行预训练,增加了对泛化通用语义的理解,支持包含颜色、形状、物体、行为、时间和地点等多信息组合的自然语言搜索,同时还实现了端侧轻量化应用。

小结

由于AI在边缘或者端侧的部署具有诸多优势,近年来AI在边缘侧的应用渗透率也越来越高。AI大模型迅猛发展,未来在终端的部署也是必然趋势,众多厂商已经对此进行探索,并有所突破,期待AI大模型未来能够是实实在在赋能各行各业。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281265
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    边缘智能网关在水务行业中的应用—龙兴物联

    :? 减少海量抄表数据上行压力,仅上传关键信息或日/月汇总数据。 防洪排涝与雨水管理? 应用:? 雨水井、河道、排水管网部署液位、流速、雨量传感器,边缘网关实时监控。 优势:? 内涝实时预警:?
    发表于 08-02 18:28

    为何边缘设备正成为AI的新重心

    人工智能 (AI) 正在以惊人的速度发展。企业不再仅仅是探索 AI,而是积极推动 AI 的规模化落地,从实验性应用转向实际部署。随着生成式模型
    的头像 发表于 07-30 09:12 ?230次阅读

    边缘AI实现的核心环节:硬件选择和模型部署

    边缘AI的实现原理是将人工智能算法和模型部署到靠近数据源的边缘设备上,使这些设备能够本地进行数
    的头像 发表于 06-19 12:19 ?569次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>实现的核心环节:硬件选择和<b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    STM32F769是否可以部署边缘AI

    STM32F769是否可以部署边缘AI
    发表于 06-17 06:44

    边缘AI实现的核心环节:硬件选择和模型部署

    电子发烧友网综合报道 边缘AI的实现原理是将人工智能算法和模型部署到靠近数据源的边缘设备上,使这些设备能够
    发表于 05-26 07:09 ?967次阅读

    Deepseek海思SD3403边缘计算AI产品系统

    海思SD3403边缘计算AI框架,提供了一套开放式AI训练产品工具包,解决客户低成本AI系统,针对差异化AI 应用场景,自己采集样本数据,进
    发表于 04-28 11:05

    AI模型部署正当时:移远端侧AI模型解决方案,激活场景智能新范式

    AI技术飞速发展的当下,AI模型的应用正从云端向侧加速渗透。 作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻
    发表于 03-27 11:26 ?277次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>端</b>侧<b class='flag-5'>部署</b>正当时:移远端侧<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    Arm 推出 Armv9 边缘 AI 计算平台,以超高能效与先进 AI 能力赋能物联网革新

    电子发烧友网报道(文/黄晶晶)当下,快速发展的 AI 正不断赋予边缘设备越来越先进的智能性,使边缘设备胜任越来越重要的任务。为应对
    的头像 发表于 03-06 11:43 ?1368次阅读
    Arm 推出 Armv9 <b class='flag-5'>边缘</b> <b class='flag-5'>AI</b> 计算平台,以超高能效与先进 <b class='flag-5'>AI</b> 能力赋能物联网革新

    AI赋能边缘网关:开启智能时代的新蓝海

    的引入彻底改变了这一局面。通过边缘网关集成AI芯片和算法模型,使其具备了实时数据分析、智能决策和自主控制能力。工业质检场景中,搭载
    发表于 02-15 11:41

    研华边缘AI Box MIC-ATL3S部署Deepseek R1模型

    随着深度求索(DeepSeek)大模型的发布引发行业热议,研华科技基于昇腾Atlas平台边缘AI Box MIC-ATL3S正式发布与Deepseek R1模型
    的头像 发表于 02-14 16:08 ?1488次阅读
    研华<b class='flag-5'>边缘</b><b class='flag-5'>AI</b> Box MIC-ATL3S<b class='flag-5'>部署</b>Deepseek R1<b class='flag-5'>模型</b>

    企业AI模型部署攻略

    当下,越来越多的企业开始探索和实施AI模型,以提升业务效率和竞争力。然而,AI模型部署并非易事
    的头像 发表于 12-23 10:31 ?824次阅读

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    以及边缘计算能力的增强,越来越多的目标检测应用开始直接在靠近数据源的边缘设备上运行。这不仅减少了数据传输延迟,保护了用户隐私,同时也减轻了云端服务器的压力。然而,
    发表于 12-19 14:33

    AI模型部署边缘设备的奇妙之旅:如何在边缘部署OpenCV

    的算法和模型来解析图像的意义。 实际应用中,这两者往往是紧密结合的,共同作用于解决复杂的问题。例如,一个自动驾驶系统中,图像处理可能会用于清理传感器输入的数据,而计算机视觉则负责识别道路上的行人
    发表于 12-14 09:31

    AI模型部署边缘设备的奇妙之旅:如何实现手写数字识别

    系统的智能化水平,还极大地拓展了其应用范围, 使得嵌入式系统智能家居、智能交通、智能医疗等领域有了更深层次的运用。AI技术的嵌入,已经成为未来嵌入式系统发展 的一个重要趋势。踏入边缘
    发表于 12-06 17:20

    研华科技打造整体边缘AI服务器解决方案

    近年来,AIoT数据量快速成长、硬件效能提升、绿色低碳意识抬头等趋势影响下,边缘AI应用的系统架构也出现改变。随着越来越多企业将AI
    的头像 发表于 11-18 15:35 ?728次阅读