0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

曙光已现!通用GPU芯片加速破局,国内企业突破量产瓶颈

Monika观察 ? 来源:电子发烧友网 ? 作者:莫婷婷 ? 2022-03-08 07:23 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/莫婷婷)当下,英伟达AMD两大巨头占据全球超过80%的通用GPU市场。在算力需求激增的情况下,多家国内企业选择加入通用GPU赛道,例如天数智芯、沐曦、壁仞科技、登临科技等。就在2021年3月,天数智芯发布全自研云端训练通用GPU芯片——天垓100芯片,这也是国内第一款全自研、GPU架构下的7nm制程通用GPU训练芯片。

电子发烧友网记者了解到,天数智芯的7nm 通用GPU训练芯片已经获得安防、人工智能、超算中心等多个应用领域的客户订单,未来将持续往5nm、3nm等更高级的制程发力。那么,国内通用GPU芯片量产的技术瓶颈在哪里,国内企业如何实现突围?记者就相关问题与天数智芯副总裁郭为进行了交流。

为什么国产通用GPU芯片量产难度大?

通用GPU即通用图形处理器,可用于人工智能模型训练与推理,以及高性能计算。与CPU相比,GPU的平行处理能力、处理速度都优于CPU,这也加强了GPU的通用性,而通用GPU的出现让GPU更加专注通用性。可以说,通用GPU就是GPU里的另一个快速发展的细分市场。

市场机构的数据显示,2019年我国通用GPU芯片的市场规模已达86亿元,预计到2025年将保持32%的年复合增长率,达458亿元。面对如此巨大的市场,国内企业涉足通用GPU市场,面临哪些挑战?郭为向记者表示,通用GPU芯片在设计上主要面临的是两大挑战,一是通用架构,二是软件生态。

在架构方面,通用架构需要适配各种各样的算法,包括基础计算;同时考虑到应用场景的特殊性,对芯片功耗也有要求,这就需要对芯片架构的优化和设计,实现低功耗高算力;另一方面,记者了解到国内在人才方面还面临较大的缺口,培养一位成熟的工程师需要10年的时间。

在软件生态方面,通用GPU不仅仅是一颗芯片硬件,还涉及到整个软件栈、编译器等一系列的软件生态系统。

为了突破技术瓶颈,天数智芯从2018年开始正式启动通用GPU芯片设计,历时三年最终量产国内首款全自研的7nm 通用GPU芯片。据了解,该芯片采用2.5D CoWoS晶圆封装技术,集成240亿晶体管,支持多精度数据类型支持标准/混合训练。在软件上,该芯片兼容主流生态系统,采用自主研发的软件栈,从多方面实现算力升级。

目前,一些国际巨头在GPU行业中仍处于领先位置,国内厂商需要突破重重挑战才能实现GPU突围。郭为也提到,英伟达经过十几年的发展,不仅有自主完善芯片架构,同样也有完善的软件生态,相对于软件生态,它具有丰富的软件接口、底层加速库,通用GPU芯片的入场门槛更高,这些都是国产企业需要追赶的。

正是因为通用GPU行业的高门槛,天数智芯的不易与成功也让国产企业看到了另一个可能性。

天数智芯推出7nm通用GPU芯片时便得到了业内人士的认可。中国工程院院士倪光南表示,该芯片在性能指标方面并不亚于国外主流产品。电子发烧友网了解到,天数智芯的“天垓100芯片”比业内同类芯片的面积小了一半,却实现单精FP32性能37TFlops,半精FP16/BF16性能147TFlops。

国产通用GPU芯片落地,深挖应用场景

国产通用GPU芯片在AI领域将打开大规模的应用市场,而这些都需要云端训练。以安防摄像头为例,摄像头在工作过程中,需要进行车辆识别、人脸识别等,这部分更重要的是依赖云端训练出的模型,进行大量推理。

郭为提到,通用GPU芯片还可以用于安检机,以及快递行业,对大量的物品进行识别,不管是安防还是快递行业,这些行业对模型训练以及模型推理的速度要求都非常高。在这方面,天数智芯已有客户带来了落地应用案例。

通用GPU芯片最典型的应用场景是在人工智能,但随着技术的成熟,通用GPU芯片在5G自动驾驶、大数据等领域的应用不断扩增。

自动驾驶最重要的是安全性,车上有大量的传感器获取路面情况,这些数据将被整合,再通过预先训练的模型预测路况,可以迅速作出决定。郭为指出,在这个过程中,需要大量的算力,同时考虑到汽车空间、电池功耗等问题,将大功耗或者大算力系统放在汽车内部也不太适合,最值得考虑的解决方案是将系统放在边缘侧,同时因为它需要迅速作出决定,要求边缘侧和汽车之间的通讯尽量地做到低时延,5G恰好可以实现这样的低时延。

在这些处理过程中,都需要用到通用GPU芯片。郭为认为,在达到理想的高算力低功耗的技术下,未来可以把高端的高算力的芯片直接放在汽车上面,应用场景也就更广了,这也是未来几年业内的研究方向。

对于未来的发展战略,天数智芯副总裁郭为提到了三大方面:

一是更强的算力。任何一个AI应用的模型都会越来越复杂,要求提供更高的算力,同时芯片制成提升会带来边际效应收窄,这时该如何进一步提升算力,实际上是任何一个通用GPU芯片都会面临的技术挑战。另一方面,自动驾驶、智慧医疗等各个行业的算法也在不断演进,此时,对于训练芯片来讲,更高的算力才能支持相应的算法运行。

二是更高的通用性。由于技术的快速迭代,云端训练芯片一定要有更高的通用性才能跟上智能驾驶、智慧医疗等高端市场需求。

三是隐私计算。智慧医疗场景涉及到患者,甚至医院的医疗数据隐私。而任何一个AI模型都需要大量的数据做训练,这时需要用到隐私计算,通过隐私加解密的方式,让这些敏感的数据做到可用。

“对于医疗这样的场景,隐私保护是相当重要的。云端训练芯片关于隐私保护这部分的解决方案,以及通用计算,也应当是后面的发展趋势。”郭为表示,天数智芯在未来会深挖隐私保护的相关应用场景,并且推出解决方案。

小结

如今,国内企业不断发力通用GPU芯片市场,随着技术的成熟也将给更多的应用场景带来多样化的可能性。当然,国内企业还需正视与国际企业的差距,并且在追赶的过程中,不断缩小差距,让国内的通用GPU芯片打开真正的用武之地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35506

    浏览量

    281420
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6221
  • 天数智芯
    +关注

    关注

    0

    文章

    99

    浏览量

    6228
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    车规MCU架构变革加速,芯科集成生态适配

    车规MCU架构变革加速,芯科集成生态适配 进入2025年,RISC-V领域呈现出热闹非凡的景象。 在2月的玄铁RISC-V生态大会上,面向服务器应用的玄铁C930亮相,Cadence和西门子
    的头像 发表于 04-10 09:40 ?1.1w次阅读
    车规MCU架构变革<b class='flag-5'>加速</b>,芯科集成<b class='flag-5'>破</b><b class='flag-5'>局</b>生态适配

    燧原科技加速国产智算

    7月27日上午,燧原科技与中国电子信息产业发展研究院、人工智能产业工作委员会、上海市集成电路行业协会、上海市算力网络协会、上海赛西科技发展有限责任公司共同举办“芯节点·新突破——协同创新聚力 加速
    的头像 发表于 08-01 16:12 ?195次阅读

    RISC-V如何盈利?本土企业率先

    7月16日,第五届RISC-V中国峰会在上海盛大开幕,规模和全球影响力远超历届。去年峰会圆桌讨论如何盈利,今年就有本土企业率先。据峰会现场消息,沁恒青稞RISC-V商用五年并持续
    的头像 发表于 07-18 11:32 ?1458次阅读
    RISC-V如何盈利?本土<b class='flag-5'>企业</b>率先<b class='flag-5'>破</b><b class='flag-5'>局</b>

    吐槽国内芯片资料

    国内企业的技术文档和欧美企业的文档,差距不是一点半点,欧美文档唯恐给你说不明白,国内文档唯恐给你说明白,这说明国内半导体
    发表于 06-02 15:17

    国内地首家!奕丞科技实现高端MEMS探针自主量产加速国产化突围

    探针和探针卡是半导体制造中晶圆测试环节的关键组件,可以筛选不良芯片,避免无效封装、降低成本,是半导体测试的“质量守门员”,技术壁垒高且国产化空间大。国内企业在中低端市场实现
    的头像 发表于 05-08 18:14 ?711次阅读
    中<b class='flag-5'>国内</b>地首家!奕丞科技实现高端MEMS探针自主<b class='flag-5'>量产</b>,<b class='flag-5'>加速</b>国产化突围

    硬核技术人形机器人量产瓶颈!世强硬创慕展创新方案引行业关注

    能力,成为展会现场关注的焦点,也为行业提供了人形机器人规模化量产的可行技术路线。 机器人整体解决方案 技术:机器人量产的三大核心挑战 当前,人形机器人行业正面临导航避障、灵巧手设计
    发表于 04-27 16:19 ?259次阅读
    硬核技术<b class='flag-5'>破</b><b class='flag-5'>局</b>人形机器人<b class='flag-5'>量产</b><b class='flag-5'>瓶颈</b>!世强硬创慕展创新方案引行业关注

    芯驰科技分享本土车规芯片之路

    发展趋势。芯驰科技创始人仇雨菁女士受邀出席并发表主题演讲,深入剖析智能汽车时代下国产芯片面临的机遇、挑战与之路。
    的头像 发表于 04-03 10:08 ?524次阅读

    北京市最值得去的十家半导体芯片公司

    座舱与车控芯片,出货量超700万片,覆盖国内90%车企及国际品牌,2024年估值超140亿元,计划2026年科创板上市。其产品打入欧洲OEM市场,是国产车规芯片的标杆
    发表于 03-05 19:37

    8002D音频功放芯片:国产芯片之选

    新冠疫情冲击芯片行业格局,国内芯片制造业寻求突破。8002D芯片在性能上不断提升,如输出功率、信噪比等方面表现良好,工作电压范围适应多种场景
    的头像 发表于 02-17 17:04 ?1361次阅读

    GPU 加速计算:突破传统算力瓶颈的利刃

    在数字化时代,数据呈爆炸式增长,传统的算力难以满足复杂计算任务的需求。无论是人工智能的深度学习、大数据的分析处理,还是科学研究中的模拟计算,都对算力提出了极高的要求。而云 GPU 加速计算的出现
    的头像 发表于 02-17 10:36 ?311次阅读

    中科曙光助力浙江精准医疗实验室突破算力瓶颈

    水平具有重要意义。 然而,在冷冻电镜等应用场景中,算力瓶颈一直是制约科研进展的关键因素之一。为了突破这一瓶颈,实验室引入了中科曙光的高端计算解决方案。中科
    的头像 发表于 02-13 14:42 ?648次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    许可证模型的加速令牌或SIMULIA统一许可证模型的SimUnit令牌或积分授权。 4. GPU计算的启用 - 交互式模拟:通过加速对话框启用,打开求解器对话框,点击“加速”按钮,打
    发表于 12-16 14:25

    《算力芯片 高性能 CPUGPUNPU 微架构分析》第3篇阅读心得:GPU革命:从图形引擎到AI加速器的蜕变

    CPU、GPU的演进历程,AI专用芯片或将引领未来计算平台的新方向。正如爱因斯坦所说:\"想象力比知识更重要\" —— 在芯片设计领域,创新思维带来的突破往往令人惊叹。
    发表于 11-24 17:12

    GPU加速计算平台是什么

    GPU加速计算平台,简而言之,是利用图形处理器(GPU)的强大并行计算能力来加速科学计算、数据分析、机器学习等复杂计算任务的软硬件结合系统。
    的头像 发表于 10-25 09:23 ?623次阅读

    国产芯片原厂的出路:从风潮到现实的之路

    国产芯片原厂的出路:从风潮到现实的之路
    的头像 发表于 08-12 17:54 ?1401次阅读