0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产GPU分析,对标海外行业龙头缩小差距

智能计算芯世界 ? 来源:智能计算芯世界 ? 2023-05-29 09:43 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

国产GPU持续发力,对标行业龙头缩小差距。GPU有两条主要的发展路线:分别为传统的2D/3D图形渲染GPU和专注高性能计算的GP GPU,近年来,国产GPU厂商在图形渲染GPU和高性能计算GPGPU领域上均推出了较为成熟的产品,在性能上不断追赶行业主流产品,在特定领域达到业界一流水平。生态方面国产厂商大多兼容英伟达CUDA,融入大生态进而实现客户端导入。

22902a0c-fdb1-11ed-90ce-dac502259ad0.png

22b446bc-fdb1-11ed-90ce-dac502259ad0.png

22c9a714-fdb1-11ed-90ce-dac502259ad0.png

1、寒武纪

寒武纪自2016年成立以来一直专注于人工智能芯片产品研发与技术创新,致力于打造人工智能领域的核心处理器芯片。公司主要提供云端智能芯片及加速卡、训练整机、边缘智能芯片及加速卡、终端智能处理器IP及配套基础软件开发平台,产品广泛应用于消费电子、数据中心云计算等诸多场景。

2306d2ec-fdb1-11ed-90ce-dac502259ad0.png

2022年3月21日,公司正式发布新款训练加速卡MLU370-X8,搭载双芯片四芯粒思元370,集成寒武纪MLU-Link多芯互联技术,在业界广泛应用于YOLOv3、Transformer等训练任务中。

232a3598-fdb1-11ed-90ce-dac502259ad0.png

MLU 370-S4、MLU370-X4和MLU370-X均基于思元370智能芯片的技术,通过Chiplet技术灵活组合产品的特性,可满足更多市场需求。

2、海光信息

海光信息主要从事高端处理器、加速器等计算芯片产品和系统的研发、设计和销售。公司的产品包括海光通用处理器(CPU)和海光协处理器(DCU),具有成熟而丰富的应用生态环境,内置专用安全硬件,可满足互联网、金融、能源等行业的广泛应用需求。

23705fdc-fdb1-11ed-90ce-dac502259ad0.png

公司DCU系列产品海光8100采用先进的FinFET工艺,以GPGPU架构为基础,兼容通用的“类CUDA”环境以及国际主流商业计算软件和人工智能软件,可充分挖掘应用的并行性,发挥其大规模并行计算的能力。

23a51d08-fdb1-11ed-90ce-dac502259ad0.png

3、景嘉微

景嘉微致力于信息探测、处理与传递领域的技术和综合应用。公司产品涵盖集成电路设计、小型雷达系统、无线通信系统、电磁频谱应用系统等方向,广泛应用于有高可靠性要求的航空、航天、航海、车载等专业领域。

公司先后自研制成功JM5系列、JM7系列、JM9系列高性能GPU芯片,其中最新的JM9系列两款图形处理芯片皆已完成阶段性测试工作,并进入放量阶段。JM9系列芯片应用领域广泛,可满足个性化桌面办公、网络安全保护、轨交服务终端、多屏高清显示输出和人机交互等多样化需求。

23d6c13c-fdb1-11ed-90ce-dac502259ad0.png

4、芯原股份

芯原依托自主半导体IP,为客户提供平台化、全方位、一站式芯片定制服务和半导体IP授权服务,拥有独特的“芯片设计平台即服务”经营模式。公司可提供高清视频物联网连接、数据中心等多种一站式芯片定制解决方案,拥有自主可控的图形处理器IP、神经网络处理器IP等五类处理器IP及1400多个数模混合IP和射频IP,可快速打造出从定义到测试封装完成的半导体产品,业务范围覆盖消费电子、汽车电子、物联网等多种应用领域。据IPnest在2021年的统计,芯原的半导体IP销售收入排中国大陆第二,全球第七,其中公司的图形处理器IP排名全球前三。

23ff9f8a-fdb1-11ed-90ce-dac502259ad0.png

公司的GPU IP已被众多主流和高端的汽车品牌所采用,同时,公司基于约20年Vivante GPU的研发经验,所推出的Vivante 3D GPGPU IP还可提供从低功嵌入式设备到高性能服务器的计算能力,满足广泛的人工智能计算需求。

5、壁仞科技

壁仞科技创立于2019年,在GPU、DSA(专用加速器)和计算机体系结构等领域具有深厚的技术积累。公司致力于开发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。

24454738-fdb1-11ed-90ce-dac502259ad0.png

2022年8月公司发布的通用GPU芯片BR100创下全球通用GPU算力记录,峰值算力达到国际厂商在售旗舰产品3倍以上。BR100率先采用Chiplet技术、新一代主机接口PCIe 5.0、支持CXL互连协议,确立了公司在国内厂商间的技术领先地位。公司坚持自主研发,同步推出原创架构“壁立仞”和自研BIRENSUPA软件平台,实现了BR100性能的大幅提升。

以壁仞科技于2022年8月发布的首款GP GPU BR100为例,该芯片采用Chiplet技术,16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别,是国际厂商在售旗舰产品的3倍以上,创造了全球通用GPU的算力记录。

6、摩尔线程

摩尔线程专注于设计高性能通用GPU芯片,提供图形计算和AI计算的元计算平台的集成电路高科技公司。公司高管团队来自英伟达、AMDARM知名芯片公司,拥有丰富的GPU研究经验,致力于创新面向元计算应用的新一代GPU,构建融合视觉计算、3D图形计算、科学计算及人工智能计算的综合计算平台,建立基于云原生GPU计算的生态系统。

248c554c-fdb1-11ed-90ce-dac502259ad0.png

2022年11月,公司推出基于第二代MUSA架构的处理器“春晓”,并基于“春晓”GPU发布面向消费领域的***显卡MTT S80和面向服务器应用的MTTS3000显卡。同时,公司围绕MUSA发布了系列GPU软件栈与应用工具,包括MUSA开发者套件、云原生sGPU技术及元宇宙平台MTVERSE等。

7、芯动科技

芯动科技是国内一站式IP和芯片定制及GPU领军企业,聚焦计算、存储、连接等三大赛道,提供从55纳米到5纳米全套高速IP核以及高性能定制芯片解决方案。公司拥有经验丰富的技术团队,成立16年来已赋能全球数百家知名客户,授权逾80亿颗高端SoC芯片进入规模量产,拥有过十亿颗FinFET定制芯片成功量产经验。

24ae4bd4-fdb1-11ed-90ce-dac502259ad0.png

公司瞄准商用市场推出芯动风华系列GPU。该系列GPU性能强劲、跑分领先、功耗低、自带智能计算能力,且全面支持国内外CPU/OS和生态,包括Linux、Windows和Android

8、兆芯

兆芯成立于2013年,提供高效、兼容、安全的自主通用处理器和芯片组等产品,公司掌握自主通用处理器及其系统平台芯片研发设计的核心技术,全面覆盖其微架构与实现技术等关键领域,拥有较为完整的知识产权体系,截至目前已获权约1300件专利。

24d4cc1e-fdb1-11ed-90ce-dac502259ad0.png

2020年,兆芯将自身GPU业务进行切分独立,建立了格兰菲智能科技有限公司。公司目前已推出Arise-GT10C0芯片及Glenfly Arise-GT-10C0显卡。芯片内置完全独立自主研发的新一代图形图像处理引擎,兼容银河麒麟KOS、统信软件UOS、Windows等主流操作系统,同时可在X86、ARM、MIPS等主流硬件台操作运行,支持多种图形和图像的API接口标准。

9、天数智芯

天数智芯致力于开发自主可控、国际领先的高性能通用GPU产品并提供解决方案,是国内头部通用GPU高端芯片及超级算力系统提供商。公司以“成为智能社会的赋能者”为使命,立足客户、市场的需求,加速AI计算与图形渲染融合,探索通用GPU赶超发展道路,产品广泛应用于智算重心、智慧医疗、互联网、智能制造等领域。

24f646fa-fdb1-11ed-90ce-dac502259ad0.png

12月20日,天数智芯推出通用GPU推理产品“智铠100”及其丰富的AI应用案例。智铠100计算性能高、应用覆盖广、使用成本低,支持FP32、FP16、INT8多精度混合计算,可提供最高384TFlops@int8、96TFlops@FP16、24TFlops@FP32的峰值算力,800GB/s的理论峰值带宽以及128路并发的多种视频规格解码能力。

10、沐曦

沐曦于2020年9月成立于上海,致力于为异构计算提供全栈GPU芯片及解决方案,可广泛应用于人工智能、智慧城市、自动驾驶、数字孪生、元宇宙等前沿领域。公司拥有技术完备、设计和产业化经验丰富的团队,核心成员平均拥有近20年高性能GPU产品端到端研发经验。

25142bc0-fdb1-11ed-90ce-dac502259ad0.png

公司拥有完全自主研发的GPU IP、指令集和架构,以及兼容主流GPU生态的完整软件栈(MXMACA),产品具备高能效、高通用性。目前已推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI训练及通用计算,以及MXG系列GPU(曦彩)用于图形渲染,可满足数据中心对高能效和高通用性的算力需求。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    460

    文章

    52736

    浏览量

    444079
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4980

    浏览量

    132090
  • 人工智能
    +关注

    关注

    1810

    文章

    49221

    浏览量

    251504

原文标题:国产GPU分析,对标海外行业龙头缩小差距

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CPU\GPU引领,国产AI PC进阶

    电子发烧友网报道(文/黄晶晶)当前AI PC已经成为PC产业的下一个浪潮,国产CPU、GPU厂商在PC市场一直处于追赶态势,AI PC给了大家新的机遇,在这个赛道国产厂商加速了布局与渗透。 首款
    的头像 发表于 09-01 02:15 ?5785次阅读
    CPU\<b class='flag-5'>GPU</b>引领,<b class='flag-5'>国产</b>AI PC进阶

    国产 vs 进口贴片固态电容:技术差距缩小,本土化替代加速

    差异、市场表现及未来趋势,探讨国产替代的机遇与挑战。 ? 1.性能对比:国产技术迎头赶上 ? (1)关键参数差距缩小 ? - ESR(等效串联电阻):早期
    的头像 发表于 05-27 16:25 ?498次阅读
    <b class='flag-5'>国产</b> vs 进口贴片固态电容:技术<b class='flag-5'>差距</b><b class='flag-5'>缩小</b>,本土化替代加速

    国产电压基准源对REF34XX/ADR34XX的模拟I/O模块替换方案

    国产电压基准源对REF34XX/ADR34XX的模拟I/O模块替换方案
    的头像 发表于 04-03 09:49 ?511次阅读
    <b class='flag-5'>国产</b>电压基准源对<b class='flag-5'>标</b>REF34XX/ADR34XX的模拟I/O模块替换方案

    可以手动构建imx-gpu-viv吗?

    所需的库版本。但是当我尝试运行应用程序时,它导致了分段错误。 有没有办法在 Debian 10 中自己构建 imx-gpu 库,这样它们就不需要 glibc 2.28 版本了? 如果我的理解有任何差距,请告诉我。谢谢!感谢所有回复。
    发表于 03-28 06:35

    深度对比:全国产电脑替代方案VS进口设备,性能差距缩小至15%的真相

    在工业、金融、能源等领域,进口电脑设备长期占据主导地位,但高昂的成本和技术依赖风险成为企业痛点。如今,以华颉工控机为代表的全国产电脑替代方案,通过CPU、操作系统、芯片组的全面国产化,将性能差距从过去的50%以上
    的头像 发表于 03-27 13:43 ?1467次阅读
    深度对比:全<b class='flag-5'>国产</b>电脑替代方案VS进口设备,性能<b class='flag-5'>差距</b><b class='flag-5'>缩小</b>至15%的真相

    国产AI芯片破局:国产TCB设备首次完成CoWoS封装工艺测试

    DeepSeek的突破性进展,让中国在AI产业领域似乎迅速缩小了和美国的差距,然而整个国产大模型的运行仍高度依赖英伟达的芯片支持。尽管国产GPU
    的头像 发表于 03-14 11:09 ?923次阅读
    <b class='flag-5'>国产</b>AI芯片破局:<b class='flag-5'>国产</b>TCB设备首次完成CoWoS封装工艺测试

    AD4115,国产ADC满足工程车辆信号采集替换方案

    AD4115,国产ADC满足工程车辆信号采集替换方案
    的头像 发表于 03-14 10:01 ?371次阅读
    对<b class='flag-5'>标</b>AD4115,<b class='flag-5'>国产</b>ADC满足工程车辆信号采集替换方案

    国产SiC碳化硅MOSFET行业乱象的深度分析

    国产碳化硅MOSFET行业乱象的深度分析,产品乱象本质上是技术追赶期“速度”与“质量”失衡的产物。唯有通过技术深耕、标准完善与生态重构,才能实现从“低端内卷”向“高端引领”的跨越。从“唯参数论”转向“全生命周期质量评估”,鼓励长
    的头像 发表于 03-01 08:21 ?611次阅读

    海外大带宽云服务器适合哪些行业

    海外大带宽云服务器因其高速的数据传输能力、全球访问的便捷性以及灵活的资源扩展性,非常适合多个需要跨国业务、大流量处理或高性能计算的行业。以下是一些主要适用行业,主机推荐小编为您整理发布海外
    的头像 发表于 02-20 10:23 ?429次阅读

    国产变频器与国外品牌存在的差距分析

    近日有网友问到:国产低压变频器跟合资低压变频器的差距到底在哪里?不是说低压的变频器其实国内跟合资已经是差不了多少,只是品牌效应?是在芯片?算法?员工素质?高压变频器国产跟进口的是不是差距
    的头像 发表于 02-17 10:06 ?667次阅读
    <b class='flag-5'>国产</b>变频器与国外品牌存在的<b class='flag-5'>差距</b><b class='flag-5'>分析</b>

    国产GPU独角兽格兰菲启动IPO

    近日,国产GPU领域的又一独角兽企业——格兰菲智能科技股份有限公司宣布其上市辅导备案已获得受理,辅导机构为海通证券。这是继燧原科技、壁仞科技和沐曦之后,上海在一年内第四家进行辅导备案的GPU企业。
    的头像 发表于 02-12 17:07 ?689次阅读

    国产运算放大器SC7508对AD8009产品优势及应用介绍

    国产运算放大器SC7508对AD8009产品优势及应用介绍
    的头像 发表于 02-11 09:57 ?600次阅读
    <b class='flag-5'>国产</b>运算放大器SC7508对<b class='flag-5'>标</b>AD8009产品优势及应用介绍

    国产纯硅振荡器对SiTime在SSD中的应用方案

    国产纯硅振荡器对SiTime在SSD中的应用方案
    的头像 发表于 01-08 10:02 ?557次阅读
    <b class='flag-5'>国产</b>纯硅振荡器对<b class='flag-5'>标</b>SiTime在SSD中的应用方案

    国产舜铭存储SF25C20对MB85RS2MT性能、优势全面解析

    国产舜铭存储SF25C20对MB85RS2MT性能、优势全面解析
    的头像 发表于 01-06 10:20 ?616次阅读
    <b class='flag-5'>国产</b>舜铭存储SF25C20对<b class='flag-5'>标</b>MB85RS2MT性能、优势全面解析

    HTTP海外趋势洞察:未来网络发展的风向

    HTTP海外趋势洞察为我们揭示了未来网络发展的风向
    的头像 发表于 10-15 07:50 ?585次阅读