0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在本地跑AIGC,英特尔PC没问题

looger123 ? 来源:looger123 ? 作者:looger123 ? 2023-08-22 09:40 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

不管被动还是主动,大模型,AIGC,ChatGPT,Stable Diffusion,MidJourney 等等名词在大家的新闻列表里狂轰滥炸,经历了上半年的惊喜、恐慌、期待和担忧之后,AIGC 现今已不是天降福音或者天网再临,人们开始正视它,理解它,适度利用它。

当然,这一轮 AIGC 浪潮主要发生在云端,无论是 ChatGPT,还是文心一言,通义千问这类大语言模型应用,亦或是 MidJourney 这类 AI 生成图片的应用,还有不少像 Runway 这样 AI 生成视频的应用,都需要联网,因为 AI 计算都发生在千里之外的云端服务器上。

毕竟一般而言,服务器端能够提供的算力和存储,要远大于电脑端和手机端,但情况也并非绝对,响应快,无需联网的端侧 AI 毫无疑问是另一个趋势,和云端 AI 能够相互互补。

在前不久的小米年度演讲中,小米创始人雷军表示,小米 AI 大模型最新一个 13 亿参数大模型已经成功在手机本地跑通,部分场景可以媲美 60 亿参数模型在云端运行结果。

虽然参数量不太大,但说明了大模型在端侧的可行性和潜力。

在算力大得多的 PC 端,是否也有端侧大模型等 AIGC 运用的可行性和潜力呢?8 月 18 日,英特尔举办了一场技术分享会,着重分享了 2 个方面的信息:英特尔锐炫显卡 DX11 性能更新,并推出全新英特尔 PresentMon Beta 工具,以及展示英特尔在 AIGC 领域的进展。

去年英特尔锐炫台式机产品发布时,就承诺过英特尔锐炫显卡会持续优化升级,带来更出色的体验。

wKgZomTkEhOAXK9LAAImQS_sIlc933.png

通过最新 Game On 驱动的发布,英特尔锐炫显卡在运行一系列 DX11 游戏的时候,能够获得 19% 的帧率提升,以及平均约 20% 的99th Percentile帧率流畅度提升(相较于首个驱动版本)。此前购买使用过英特尔锐炫 A750 显卡的用户,可以直接下载最新驱动,在《守望先锋 2》、《DOTA 2》、《Apex Legends》等游戏中获得体验升级。

对于在显卡选择上有点犹豫的用户来说,1700 元档位上的锐炫 A750 显卡也成为了颇有竞争力的选择。

wKgaomTkEhSAej-fAARueRlTbTg425.png

PresentMon Beta 则是英特尔推出的图形性能分析工具,提供了 Overlay(叠加视图)等功能,可以在运行游戏时在屏幕上显示性能数据,帮助玩家实时遥测 GPU 的电压和温度等,实时分析大量信息。同时也可以查看 99th Percentile 帧时间与 GPU 占用率图表。

另外,PresentMon Beta 也带来了名为「GPU Busy」的全新指标。这里可以解释一下,用户通过它可以看到 GPU 实际使用了多少时间进行实际渲染而不是处于等待状态,或者在运行游戏的 PC 是否处于 CPU 和 GPU 平衡。

游戏是 PC 永恒的主题,而 AI 则是新晋的主题。

实际上,这一轮 AIGC 浪潮发生的主阵地设备,就是 PC,无论是 ChatGPT,还是 MidJourney,或者 Stable Diffusion 等等应用,包括基于大模型的微软 Office Copilot,亦或是金山办公的 WPS AI,都是在 PC 上才可以获得更好的体验。

但 PC 相较于其他设备,诸如手机,平板和优势,不仅在于屏幕更大,交互输入更高效,还在于芯片性能。

在英特尔谈 PC 上的 AIGC 之前,我们关注到 PC 端侧跑 AIGC,往往就是用高性能游戏本去跑图,但轻薄本往往被排除在外。

现在,英特尔明确表示了,基于英特尔处理器的轻薄本能跑大模型,也可以跑大模型和 Stable Diffusion。

英特尔基于 OpenVINO PyTorch (英特尔推出的一个开放源码工具包,旨在优化深度学习模型的推理性能,并将其部署到不同的硬件平台上)后端的方案,通过 Pytorch API 让社区开源模型能够很好地运行在英特尔的客户端处理器、集成显卡、独立显卡和专用 AI 引擎上。

比如开源的图像生成模型 Stable Diffusion (具体讲,是 Automatic1111 WebUI)就可以通过这种方式,在英特尔 CPU 和 GPU(包括集成显卡和独立显卡)上运行 FP16 精度的模型,用户实现文字生成图片、图片生成图片以及局部修复等功能。

比如这张 512×512 分辨率的蜂蜜薄饼图在英特尔处理器轻薄本(只用 i7-13700H 的核显)上,只需要十几秒就可以生成出来。

这主要得益于 13 代酷睿处理器在核心数、性能、功耗比还有图形性能上的进步,以 14 核心 20 线程的 i7-13700H 处理器为例,它的 TDP 达到了 45W,集成的 Intel Iris Xe Graphics (96EU) 显卡也不容小觑。

作为目前最高规格的核显之一,Intel Iris Xe Graphics (96EU) 相较于 Iris Plus 核显最高 64EU,基本规格提升明显,FP16、FP32 浮点性能提升幅度高达 84%,还引入了 INT8 整数计算能力 ,这些都加强了它的 AI 图形计算能力,也是英特尔轻薄本能够很好支持 Stable Diffusion 的主要原因。

在以往,TDP 45W 左右的英特尔处理器很难装进轻薄本,不过到了 13 代酷睿,已经出现了一大批在 1.4KG 左右的轻薄本把 14 核心 20 线程的 i7-13700H 处理器乃至性能更高的 i7-13900H 处理器塞了进去,所以,在笔记本上跑 Stable Diffusion 快速出图已经不是高性能独显游戏本的专属,今后轻薄本同样能够胜任这项工作。

当然,Stable Diffusion 本身主要跑在本地,轻薄本通过芯片性能的提升和优化来运行合乎逻辑,不过本地的端侧大模型则属于较为新生的事物。

通过通过模型优化,降低了模型对硬件资源的需求,进而提升了模型的推理速度,英特尔让一些社区开源模型能够很好地运行在个人电脑上。

以大语言模型为例,英特尔通过第 13 代英特尔酷睿处理器 XPU 的加速、low-bit 量化以及其它软件层面的优化,让最高达 160 亿参数的大语言模型,通过 BigDL-LLM 框架运行在 16GB 及以上内存容量的个人电脑上。

虽然离 ChatGPT3.5 的 1750 亿参数有量级差距,但毕竟 ChatGPT3.5 是跑在一万颗英伟达 V100 芯片构建的 AGI 网络集群上。而这通过 BigDL-LLM 框架运行 160 亿参数大模型是跑在英特尔酷睿 i7-13700H 或 i7-13900H 这样为高性能轻薄本打造的处理器上。

不过这里也可以看到,PC 端侧的大语言模型,也比手机端侧的大语言模型高一个量级。

出现了数十年的 PC,并非运行云端大模型的工具人,得益于硬件进步,英特尔处理器支持的 PC 已经能够快速对接新兴模型,兼容 HuggingFace 上的 Transformers 模型,目前已经验证过的模型包括但不限于:LLAMA/LLAMA2、ChatGLM/ChatGLM2、MPT、Falcon、MOSS、Baichuan、QWen、Dolly、RedPajama、StarCoder、Whisper 等。

wKgaomTkEhSACbRkAAFUgERtm68215.png

(图片来自:爱极物)

在技术分享会现场,英特尔演示了基于酷睿 i7-13700H 设备跑大模型的表现:ChatGLM-6b 可以做到首个 token 生成 first latency 241.7ms,后续 token 平均生成率为 55.63ms/token。在在自然语言处理领域,「token」 是指文本中的一个基本单元,可以是一个单词、一个字、一个子词(subword)、一个标点符号,或者其他可以进行语义处理的最小单元。可以看到,这个处理器速度相当不错。

目前还可以得到的消息是,英特尔的下一代处理器 Meteor Lake 具备独特的分离式模块架构的优势,更好地为 AI 服务,包括像 Adobe Premiere Pro 中的自动重新构图和场景编辑检测等多媒体功能,并实现更有效的机器学习加速。

虽然 AIGC 是 2023 年的一个关键词,但是 AI 并不新鲜,而且也是英特尔这几年来经常挂在嘴边的关键词。

更早之前的 AI 视频通话降噪,AI 视频通话背景降噪等等,其实都是 AI 的应用。

可以看到,未来处理器的竞争力,将不局限于核心数、线程数、主频这些,能否更好地驱动 AI 功能,将成为愈发重要的维度,也会是今后消费者选购产品会考虑的因素之一。

审核编辑 黄宇



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10213

    浏览量

    175484
  • AI
    AI
    +关注

    关注

    88

    文章

    35760

    浏览量

    282497
  • AIGC
    +关注

    关注

    1

    文章

    388

    浏览量

    2629
  • 大模型
    +关注

    关注

    2

    文章

    3231

    浏览量

    4227
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英特尔发布最强大的商用AI PC产品阵容

    2025年世界移动通信大会(MWC 2025)上,英特尔发布了该公司迄今为止最强大的商用AI PC产品阵容,搭载了英特尔 酷睿 Ultra 200V、200U、200H、200HX和
    的头像 发表于 03-08 09:28 ?733次阅读

    请问OpenVINO?工具套件英特尔?Distribution是否与Windows? 10物联网企业版兼容?

    无法基于 Windows? 10 物联网企业版的目标系统上使用 英特尔? Distribution OpenVINO? 2021* 版本推断模型。
    发表于 03-05 08:32

    英特尔?NCS2运行演示时“无法启动后找到启动设备”怎么解决?

    使用 英特尔? NCS2 运行 推断管道演示脚本 。 首次尝试中成功运行演示应用程序。 从第二次尝试开始遇到错误:E: [ncAPI] [ 150951] [security_barrie
    发表于 03-05 06:48

    英特尔赋能DeepSeek本地运行,助力汽车升级“最强大脑”

    英特尔近期宣布支持DeepSeek本地实现高效运行。据悉,借助英特尔的软件定义汽车车载平台,DeepSeek-R1系列模型,从1.5B(十亿参数)到14B参数版本,均能在该平台上流畅
    的头像 发表于 02-17 09:37 ?747次阅读

    探索座舱“未至之境”:英特尔支持DeepSeek车内本地运行

    超火的DeepSeek进入驾舱是什么样子?英特尔告诉你答案。英特尔的软件定义汽车车载平台上DeepSeek-R1,从1.5B直到14B,能明显提升GPU内存的利用率,而第二代
    的头像 发表于 02-14 16:19 ?418次阅读
    探索座舱“未至之境”:<b class='flag-5'>英特尔</b>支持DeepSeek车内<b class='flag-5'>本地</b>运行

    英特尔与扣子云平台合作推出AI PC Bot专区和端侧插件商店

    通过创新的端云协同技术,为开发者提供更为便捷、高效的智能应用开发环境。 通过扣子的“端插件”机制,英特尔AI PCPC操控、本地知识库、本地
    的头像 发表于 12-31 10:24 ?1156次阅读

    英特尔与扣子云平台共推AI PC Bot专区和端侧插件商店

    ,将英特尔AI PCPC操控、本地知识库、本地推理及本地生成等核心功能无缝嵌入扣子大模型与工作
    的头像 发表于 12-30 10:09 ?820次阅读

    英特尔与扣子云平台合作推出AI PC Bot专区与端侧插件商店

    。 Coze-AIPC是扣子云平台与英特尔联合发布的增强版智能体开发平台,它深度整合了英特尔AI PC的端侧能力与扣子云平台的优势。通过扣子云平台创新的“端插件”机制,英特尔AI
    的头像 发表于 12-27 14:11 ?1142次阅读

    使用英特尔AI PC为YOLO模型训练加速

    之后,情况有了新的变化,PyTorch2.5正式开始支持英特尔显卡,也就是说,此后我们能够借助英特尔 锐炫 显卡来进行模型训练了。
    的头像 发表于 12-09 16:14 ?1736次阅读
    使用<b class='flag-5'>英特尔</b>AI <b class='flag-5'>PC</b>为YOLO模型训练加速

    英特尔构建AI PC新平台,引领AI应用新生态

    PC产品和解决方案,展现了技术卓越性和全栈生态优势。AI PC问世一周年之际,英特尔持续深耕生态并与全产业链共同推动AI PC变革,将更
    的头像 发表于 12-05 09:09 ?831次阅读

    同花顺携手英特尔,推出基于强大算力的AI PC版,引领金融科技新潮流

    11月26日,英特尔成都举办了新质生产力技术生态大会,聚焦全行业的生态合作和技术分享。AI PC软件生态产品发布分论坛上,作为中国领先的互联网金融信息服务提供商,同花顺今日宣布推出
    的头像 发表于 11-27 15:13 ?833次阅读
    同花顺携手<b class='flag-5'>英特尔</b>,推出基于强大算力的AI <b class='flag-5'>PC</b>版,引领金融科技新潮流

    英特尔目标明年出货1亿台AI PC

    英特尔近日宣布,其目标是明年实现1亿台AI PC的出货,相较于2024年4000万台的出货目标,实现了150%的大幅增长。这一雄心勃勃的目标展示了英特尔
    的头像 发表于 10-31 17:07 ?677次阅读

    英特尔计划明年AI PC出货一亿台

    英特尔设定明年AI PC出货目标为一亿台,较2024年原定计划激增150%   英特尔销售与营销部总监Jack Huang于10月28日透露,公司计划在明年实现一亿台AI PC
    的头像 发表于 10-31 14:26 ?985次阅读

    高通或收购英特尔部分设计业务,拓展产品线战略浮现

    高通被曝正探索收购英特尔设计业务股权的可能性,旨在进一步拓宽其产品线。据两位内部消息人士透露,高通对英特尔的多个业务部门表达了兴趣,尤其是其客户端PC设计业务,但也全面审视
    的头像 发表于 09-06 15:51 ?861次阅读

    英特尔下代 CPU 还值得信任吗?

    半导体行业里,英特尔(Intel)这个名字几乎等同于个人电脑的心脏。作为PC时代的主导者之一,英特尔不仅塑造了计算机产业的发展方向,更影响了一代又一代人的工作与生活方式。然而,在过去
    的头像 发表于 09-04 13:57 ?839次阅读
    <b class='flag-5'>英特尔</b>下代 CPU 还值得信任吗?