0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型AI兴起:新一轮芯片、服务器、智算等浪潮来袭

架构师技术联盟 ? 来源:架构师技术联盟 ? 2023-04-26 09:21 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI需要多元异构算力提供支持,拉动AI芯片需求。人工智能算法需要从海量的图像、语音、视频等非结构化数据中挖掘信息。从大模型的训练、场景化的微调以及推理应用场景,都需要算力支撑。而以CPU为主的通用计算能力已经无法满足多场景的AI需求。以CPU+AI芯片(GPUFPGAASIC)提供的异构算力,并行计算能力优越、具有高互联带宽,可以支持AI计算效力实现最大化,成为智能计算的主流解决方案。

服务器中的CPU和AI卡的数量并不固定,会根据客户应用需求调整,对于AI服务器来讲,较为常见的是配备2个CPU,以及八个AI卡。而相比于AI服务器,传统的通用服务器则以CPU为主。因此,AI的发展将极大拉动GPGPU、TPU、NPU等AI芯片的需求。

AI 计算需要多元异构算力提供支持,将极大拉动GPGPU、AISC 等 AI 芯片的需求。中国 AI 芯片市场规模有望快速增长,据艾瑞咨询发布的《2022 年中国人工智能产业研究报告(Ⅴ)》,预计 2027 年达到 2164 亿元。

中国AI芯片市场将保持高速增长,AI推理芯片份额有望持续提升,国产化AI芯片占比有望提升。2022年,中国的AI芯片市场规模约385亿元。随着AI发展以及智算中心建设浪潮,该市场预计将保持高增长趋势。据艾瑞咨询测算,到2027年,中国的AI芯片市场规模预计将达到2164亿元。另外,在我国高性能及AI服务器中,GPGPU凭借其优秀的性能和通用能力占比92%,剩下份额由AISC和FPGA分享。随着AI模型的优化落地,AI推理芯片的占比将日益提升。据艾瑞咨询,2022年,中国AI训练芯片以及AI推理芯片的占比分别为47.2%和52.8%。

445950e8-e3ce-11ed-ab56-dac502259ad0.png

AI芯片领域的三类玩家。大模型的训练需要大规模的训练数据以及强大的计算资源,需要多卡多机协同完成。这对AI芯片本身的性能,以及多卡多机的互联提出了很高的要求。目前,在AI芯片领域,有三类玩家。一种是以Nvidia、AMD为代表的实力强劲的老牌芯片巨头,这些企业积累了丰富的经验,产品性能突出。

另一种是以Google、百度、华为为代表的云计算巨头,这些企业纷纷布局通用大模型,并自己开发了AI芯片、深度学习平台等支持大模型发展。如google的TensorFlow以及TPU,华为的鲲鹏昇腾、CANN及Mindspore。

最后是一些小而美的AI芯片独角兽,如寒武纪、壁仞等。

英伟达占据80%以上中国加速卡市场份额,国产AI芯片亟待发展。根据IDC的数据显示,2021年中国加速卡的出货数量已经超过80万片,其中Nvidia占据了超过80%的市场份额。剩下的份额有AMD、百度、寒武纪、燧原科技、新华三、华为、Intel赛灵思等品牌。

446e045c-e3ce-11ed-ab56-dac502259ad0.png

1、英伟达:全球GPU龙头

英伟达占据芯片市场绝对优势。长期以来,英伟达在高端GPU市场占据绝对主导地位,现如今已量产的主流A100芯片相比前代产品V100,性能得到显著提高,代表当今高端芯片水平。最新一代H100芯片也已经亮相,即将量产。天数智芯数据显示,2021年英伟达在中国云端AI训练芯片市场的份额达到90%。据IDC,在2021年中国出货的80多万张加速卡中,英伟达占据超过80%份额。芯片的研发周期较长,英伟达具有绝对先行优势,虽然目前国内企业突破英伟达垄断仍然任重道远,但寒武纪、华为AI芯片快速发展,有望逐步进行国产替代。

448ab96c-e3ce-11ed-ab56-dac502259ad0.png

受制裁影响,英伟达对部分产品性能进行 “阉割”,推出“中国版芯片”A800、H800。2022年10月,美国发布了针对中国的先进计算与半导体产品的出口管制,限制美国企业向中国出口先进高端芯片设备。在新管制的限制下,英伟达的A100、H100被禁止售卖给中国,而采用12nm工艺、性能较低的V100 GPU芯片不在管控之列。针对此次制裁,英伟达对A100的部分性能进行“阉割”,推出A800。

相比于A100,A800在单卡计算性能上没有差别,但是互联带宽从600GB/s下降到了400GB/s,在一定程度上影响了如大模型训练等多卡互联场景的性能。目前,A800已实现量产,并在中国规模化落地应用。英伟达还推出了旗舰芯片H100的替代版H800,目前还未量产。

44ac04a0-e3ce-11ed-ab56-dac502259ad0.png

2、海光信息:国产高性能CPU和GPGPU领军企业

海光信息专注于研发、设计和销售高端处理器(CPU以及GPGPU),持续技术创新、产品迭代。海光信息的主要产品为应用于服务器和工作站等设备中的通用处理器(CPU)和协处理器(DCU,即GPGPU)。海光处理器性能出众,同时软硬件生态丰富、工具链完整、应用迁移成本低。另外,海光CPU与DCU虽脱胎于AMD,但经过多年独立自主研发迭代,已经实现自主可控、安全可靠,是***之光。目前,苏州昆山、成都等多地超算中心已经搭载海光CPU与DCU,为社会提供优质算力。

海光CPU一、二代均已商业化, 三代初亮相,四代有序研发中。海光DCU一代已商业化应用,二代研发中。公司持续技术创新和演进,坚持走“销售一代, 验证一代, 研发一代”的产品开发策略。公司建立了完善的高端处理器的研发环境和流程,持续开发多代产品,产品性能不断提高,同时功能不断完善丰富。海光CPU的四代产品中,海光一号和海光二号均实现了商业化应用,海光三号已亮相发布会,海光四号处于研发阶段。海光DCU于2018年启动DCU第一代产品深算一号的产品研发,于2020年1月启动了深算二号的研发,截至2022年6月,深算一号已实现商业化应用。

44caf8a6-e3ce-11ed-ab56-dac502259ad0.png

海光DCU某些硬件性能与英伟达的A100、AMD的MI100相近。海光DCU双精度计算能力突出。据北京大学高性能计算系统中标公告(HCZB-2021-ZB0364),海光信息的DCU Z100的通用计算核心达到8192个。其关键性能指标实现:FP64 10.8TFlops,显存32GB HBM2,对比全球芯片巨头的高端AI芯片不遑多让。英伟达A100的相关指标为:FP64 9.7 TFlops、显存40/80GB HBM2。AMD MI100的相关指标为:FP64 11.5 TFlops、显存32GB HBM2。

44f40ed0-e3ce-11ed-ab56-dac502259ad0.png

海光DCU生态丰富,工具链完整。海光的DCU脱胎于AMD,兼容主流生态——开源ROCmGPU计算生态,支持TensorFlow、Pytorch和PaddlePaddle等主流深度学习框架、适配主流应软件。ROCm又被称为类CUDA,现有CUDA上运行的应用可以低成本迁移到基于ROCm的海光平台上运行。

2022年,海光发布国内首个全精度(FP64)异构计算平台,该平台搭载CPU海光三号和DCU海光深算,涵盖数值模拟、AI训练、AI推理所需的多样算力,实现了智能计算与数值运算的深度融合。同时,此平台可全面支持TensorFlow、PyTorch、Caffe2等主流AI深度学习框架,目前已超过1000种应用软件部署在该平台上。

3、寒武纪:国产AI芯片先行者

寒武纪始终深耕芯片研发,不断推陈出新、实现技术进步。寒武纪成立于2016年,专注人工智能芯片产品的研发与创新。公司成立之初便开始了对AI芯片领域的探索创新。并在2016年年底成功研发出全球首款AI手机芯片——寒武纪1A。2017年,这款芯片被搭载于华为的高端系统级芯片麒麟970,应用于Mate10手机,并获得了广泛好评。芯片可以在功耗极低的前提下,涵盖人脸识别、语音识别、图像增强等多种功能。此后,寒武纪又陆续推出了多款AI芯片产品,包括云端训练芯片MLU100、边缘推理芯片MLU270、车载推理芯片MLU290等 。这些产品都具有高性能、低功耗、高集成度等特点,在图像识别、语音识别、自然语言处理等领域都有着优异的表现。

450900f6-e3ce-11ed-ab56-dac502259ad0.png

思元370是寒武纪的首款训练推理一体芯片,也是其云端产品的第三代。思元370采用了7nm制程工艺,并成为首款采用Chiplet技术的人工智能芯片。该芯片最大算力可达256TOPS(INT8),是上一代云端推理产品思元270算力的两倍,同时该芯片还支持LPDDR5内存,内存带宽是270的三倍,因此可以在板卡有限的功耗范围内为人工智能芯片分配更多的能源,从而输出更高的算力。思元370智能芯片还采用了先进的Chiplet技术,支持灵活的芯粒组合,仅用单次流片便可以实现多款智能加速卡产品的商用。目前,该公司已推出三款加速卡:MLU370-S4、MLU370-X4和MLU370-X8,包含应用于计算密度高的数据中心、针对专注人工智能推理相关业务的互联网厂商需求和应用于对算力带宽要求高的训练任务,满足用户的多样化需求。

新一代训练芯片寒武纪590还未量产,据悉训练能力突出。寒武纪最新一代云端智能训练芯片思元590还未正式发布,据寒武纪董事长在2022 WAIC上介绍,思元590采用全新的MLUarch05架构,实测训练性能较在售产品有了显著提升。思元590可提供更大的内存容量和更高的内存带宽,其PCIe接口也较上代实现了升级。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    460

    文章

    52624

    浏览量

    442816
  • AI
    AI
    +关注

    关注

    88

    文章

    35506

    浏览量

    281420
  • 人工智能
    +关注

    关注

    1809

    文章

    49164

    浏览量

    250754

原文标题:大模型AI兴起:新一轮芯片、服务器、智算等浪潮来袭

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新一轮的工业“智变”

    当下,全球产业链正面临供应链重构、个性化需求增长以及深度数字化与可持续发展的重要节点。工业需要经历新一轮的“智变”,从自动化升级到自主化,并向着柔性化、智能化、以及人机协同的工业5.0愿景迈进。
    的头像 发表于 05-15 13:46 ?597次阅读

    AI原生架构升级:RAKsmart服务器在超大规模模型训练中的力突破

    近年来,随着千亿级参数模型的崛起,AI训练对力的需求呈现指数级增长。传统服务器架构在应对分布式训练、高并发计算和显存优化场景时逐渐显露瓶
    的头像 发表于 04-24 09:27 ?350次阅读

    智能服务器应用领域

    智能服务器应用领域 、?金融行业? 智能风控与投顾?:通过力集群支撑AI模型训练,实现风
    的头像 发表于 04-21 09:09 ?382次阅读
    智能<b class='flag-5'>算</b>力<b class='flag-5'>服务器</b>应用领域

    RAKsmart服务器如何重塑AI高并发力格局

    AI模型参数量突破万亿级、实时推理需求激增的当下,传统服务器架构的并发处理能力已逼近物理极限。RAKsmart通过“硬件重构+软件定义”的双引擎创新,推出新
    的头像 发表于 04-03 10:37 ?357次阅读

    如何在RAKsmart服务器上实现企业AI模型部署

    AI模型的训练与部署需要强大的力支持、稳定的网络环境和专业的技术管理。RAKsmart作为全球领先的服务器托管与云计算服务提供商,已成为企
    的头像 发表于 03-27 09:46 ?539次阅读

    利用RAKsmart服务器托管AI模型训练的优势

    AI模型训练需要强大的计算资源、高效的存储和稳定的网络支持,这对服务器的性能提出了较高要求。而RAKsmart服务器凭借其核心优势,成为托管AI
    的头像 发表于 03-18 10:08 ?300次阅读

    海纳AI获5000万新一轮融资

    近日,国内领先的AI面试测评解决方案提供商海纳AI宣布成功获得5000万元人民币的新一轮融资。本轮融资由德同资本领投,求是资本跟投,共同为海纳AI的未来发展注入新的活力。 这笔资金将主
    的头像 发表于 02-19 10:10 ?459次阅读

    庆虹电子获新一轮融资,比亚迪参与投资

    ,广泛应用于通讯网络、计算机、服务器以及通信交换机多个领域。凭借卓越的产品质量和专业的技术服务,庆虹电子在市场上赢得了良好的口碑和广泛的认可。 此次获得新一轮融资,不仅是对庆虹电子过
    的头像 发表于 12-02 10:39 ?726次阅读

    字节跳动开启新一轮股权回购

    字节跳动近日向员工发布了新一轮股权回购的邮件通知。此次回购中,在职员工的税前回购价定为每股180.7美元,而离职员工的回购价则为153.6美元。
    的头像 发表于 10-11 15:46 ?778次阅读

    OpenAI新一轮融资66亿美元,巩固AI领先地位

    近日,美国人工智能领域的佼佼者OpenAI宣布,在最新一轮融资中成功筹集了高达66亿美元的资金。此次融资后,OpenAI的估值飙升至1570亿美元,再次彰显了其在全球AI领域的强劲实力。
    的头像 发表于 10-08 14:44 ?630次阅读

    Anthropic拟进行新一轮融资

    人工智能领域再掀波澜,初创公司Anthropic正紧锣密鼓地筹备新一轮融资,市场预计其估值将跃升至400亿美元大关。此次融资吸引了包括谷歌、亚马逊科技巨头的青睐,彰显了Anthropic在AI赛道上的强劲竞争力和市场潜力。目前
    的头像 发表于 09-24 15:19 ?635次阅读

    武汉敏声再获新一轮融资

    近日,武汉敏声新技术有限公司(简称“武汉敏声”)宣布成功完成新一轮融资,此次融资由中国互联网投资基金、长江产业集团、骆驼基金知名投资机构共同参与。这是自2019年成立以来,武汉敏声获得的第4融资,累计融资金额已接近10亿元,
    的头像 发表于 09-24 14:52 ?1371次阅读

    什么是AI服务器AI服务器的优势是什么?

    AI服务器种专门为人工智能应用设计的服务器,它采用异构形式的硬件架构,通常搭载GPU、FPGA、ASIC加速
    的头像 发表于 09-21 11:43 ?2113次阅读

    喆塔科技完成新一轮战略融资

    喆塔科技近日宣布圆满完成新一轮战略融资,此融资由光谷金控、张科垚坤及合肥产投三大国有及产业资本巨头携手完成。此次融资不仅彰显了市场对喆塔科技的高度认可,更为其未来发展注入了强劲动力。
    的头像 发表于 09-06 17:37 ?884次阅读

    摩尔线程GPU力底座助力大模型产业发展

    以大模型为代表的新代人工智能技术是引领新一轮科技革命和产业变革的战略性技术和重要驱动力量,随着对力需求的日益高涨,人工智能力底座公司日
    的头像 发表于 08-27 16:15 ?1056次阅读