0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

强强联手!爱丁堡大学与算能破局:RISC-V进军高性能计算,SG2044多核性能飙涨近5倍

算能开发者社区 ? 2025-08-26 16:31 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

RISC-V 架构的普及浪潮中,嵌入式领域的成功早已众人皆知,但高性能计算(HPC)始终是其难以突破的 “高地”。算能SOPHON SG2044的出现打破了僵局, 其 64 核高性能 CPU 不仅在爱丁堡大学的权威测试中展现出颠覆性实力,更以实打实的数据证明:RISC-V 终于能在 HPC 赛场与 x86、ARM 同台竞技。

多核算力突破性跃升:HPC 基准测试数据碾压前代

作为专为工作站与服务器级 HPC 负载设计的芯片,SG2044 最核心的突破在于多核并行算力的指数级跃升。爱丁堡大学 Nick Brown 教授在《Is RISC-V ready for High Performance Computing? An evaluation of the Sophon SG2044》中明确指出:“We find that the SG2044 is most advantageous when running at higher core counts, delivering up to 4.91 greater performance than the SG2042 over 64-cores.”(在 64 核配置下,SG2044 性能较前代 SG2042 提升高达4.91倍)。

1fdd3444-8257-11f0-9080-92fbcf53809c.png

这一数据并非孤立存在,通过 NASA NAS 并行基准测试(NPB)的实测验证:

在内存延迟敏感型的 IS(整数排序)基准中,SG2044 64 核性能达 3038.14 Mop/s,而 SG2042 仅为 618.50 Mop/s,前者是后者的 4.91 倍,彻底解决了 SG2042 在多核心下性能 “卡顿” 的问题;即便是对计算效率要求极高的FT(快速傅里叶变换)基准,SG2044 64 核性能也达 22582.2 Mop/s,较 SG2042 的 8317.91 Mop/s 提升 2.71 倍;

20056ca2-8257-11f0-9080-92fbcf53809c.png

更关键的是,当核心数超过 8 核后,SG2042 的内存带宽便进入 “平台期”,而 SG2044 能持续线性增长,在 64 核时通过 STREAM 基准测试实现3 倍于 SG2042 的内存带宽,完美适配 HPC 场景下 “多核心满负载” 的需求。

20188c38-8257-11f0-9080-92fbcf53809c.png

双关键升级破局 HPC 瓶颈:数据实测缩小架构代差

SG2044 的性能飞跃,源于对前代SG2042 两大瓶颈的精准突破 ——RVV v1.0 向量指令集支持与增强型内存子系统,这也是 HPC 场景最核心的技术需求。

RVV v1.0:让 RISC-V 向量计算 “能用、好用”

不同于 SG2042 仅支持 RVV v0.7.1(需定制编译器,无法兼容主流工具链),SG2044 的 C920v2 核心直接兼容 RVV v1.0 标准,可直接使用 GCC 15.2、LLVM 等主流编译器实现自动向量化。实测数据显示:

在MG(多重网格)向量密集型基准中,SG2044 单核心性能达 1382.91 Mop/s,较 SG2042 的 1175.69 Mop/s 提升 18%;更重要的是,借助 RVV v1.0 的 128 位向量单元,SG2044 在EP(并行计算)基准(纯计算密集型)中,单核心性能达 40.76 Mop/s,较 SG2042 提升 30%,成为单核心场景下性能提升最显著的 HPC 负载。

202b6844-8257-11f0-9080-92fbcf53809c.png

这意味着,开发者无需再为适配 RISC-V 向量计算修改代码,直接沿用主流 HPC 软件栈即可发挥 SG2044 的算力优势,大幅降低了 RISC-V 进入 HPC 领域的门槛。

通道内存 + DDR5,突破瓶颈

SG2042 的最大痛点 —— 内存 subsystem 瓶颈,在 SG2044 上被彻底重构。内存控制器从 4 个增至 32 个,内存通道从 4 条扩至 32 条,同时升级至 DDR5-4266 内存,带来了颠覆性的内存性能:

  • 内存带宽方面,SG2044 在 64 核时通过 STREAM 基准实现超 3 倍于 SG2042 的带宽,且核心数越多,优势越明显(8 核内两者带宽相近,64 核时 SG2044 彻底拉开差距);
  • 内存延迟从 SG2042 的 98ns 降至 68ns,降幅达 35%,在CG(共轭梯度)基准(不规则内存访问)中,64 核性能达 7728.80 Mop/s,较 SG2042 的 3508.95 Mop/s 提升 2.2 倍;

更关键的是,SG2044 所有核心处于单一 NUMA 区域,避免了多 NUMA 节点间的数据传输延迟,在数据密集型 HPC 场景中,降低了内存瓶颈导致的性能损耗。

对标 x86/ARM:64 核满负载,RISC-V实现性能突破

过去,RISC-V HPC 芯片面对 x86、ARM 总是 “单核心差距大,多核心追不上”,但 SG2044 用实测数据打破了这一局面。

通过与 HPC 领域主流芯片的对比(AMD EPYC 7742、Intel Xeon Platinum 8170、Marvell ThunderX2): 在MG(内存带宽敏感)基准中,SG2044 64 核性能达 32457.83 Mop/s,虽不及 AMD EPYC 的 10 万级 Mop/s,但已与 26 核 Intel Skylake(约 3 万 Mop/s)、32 核 Marvell ThunderX2(约 2.8 万 Mop/s)基本持平,远超 SG2042 的 14397.69 Mop/s;

2040fc2c-8257-11f0-9080-92fbcf53809c.png

在EP(纯计算)基准中,SG2044 单核心性能与 Intel Skylake 差距仅 30%,64 核时性能达 2538.38 Mop/s,较 SG2042 提升 52%,且核心数超过 26 核后,性能曲线与 AMD EPYC 基本平行,展现出优秀的多核扩展性;

207ddfd4-8257-11f0-9080-92fbcf53809c.png

即便是复杂的BT/LU/SP 伪应用(模拟真实 HPC 流体力学、数值模拟场景),SG2044 在 64 核时也实现了对 SG2042 的 2 倍以上性能碾压,其中 BT 基准性能是 SG2042 的 2.22 倍,SP 基准是 2.08 倍。

更值得关注的是,SG2044 的定位是 “工作站 / 服务器级”,而非顶级超算芯片,但在价格更低、功耗更优的前提下,能在 64 核满负载场景下追平入门级 x86/ARM HPC 芯片,已足以证明 RISC-V 在 HPC 领域的性价比优势。

RISC-V 架构的发展为处理器领域带来了新的活力,算能 SG2044 的意义不仅是一款高性能芯片,更在于它验证了 RISC-V 的技术潜力 —— 通过解决 “向量计算兼容性” 和 “内存带宽” 两大核心痛点,RISC-V 终于能从嵌入式领域走向 HPC 这一 “高端战场”。

Nick Brown简介

Nick Brown教授是英国爱丁堡大学EPCC(爱丁堡并行计算中心)的研究员,在国际高性能计算(HPC)领域具有重要影响力。他的研究聚焦于并行编程模型、高性能计算系统优化及能效提升,致力于推动大规模科学计算应用的发展。

作为HPC社区活跃的学术代表,他多次主导国际合作项目,并在顶级会议发表多项突破性成果,特别是在混合编程与性能可移植性方面贡献突出。Nick Brown的工作显著提升了超级计算机在气候科学、计算流体力学等领域的应用效率,是当代高性能计算领域的关键推动者之一。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 测试
    +关注

    关注

    8

    文章

    5810

    浏览量

    129679
  • HPC
    HPC
    +关注

    关注

    0

    文章

    335

    浏览量

    24518
  • RISC-V
    +关注

    关注

    46

    文章

    2660

    浏览量

    49638
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    知合计算RISC-V架构创新,阿基米德系列剑指高性能计算

    在于更高的性能。这主要取决于单位性能的提升,以及先进工艺带来的PPA优化。只有出现标杆性的产品才能真正引领整个RISC-V高性能
    的头像 发表于 07-18 14:17 ?1910次阅读
    知合<b class='flag-5'>计算</b>:<b class='flag-5'>RISC-V</b>架构创新,阿基米德系列剑指<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    RISC-V如何盈利?本土企业率先

    7月16日,第五届RISC-V中国峰会在上海盛大开幕,规模和全球影响力远超历届。去年峰会圆桌讨论如何盈利,今年就有本土企业率先。据峰会现场消息,沁恒青稞RISC-V已商用五年并持续
    的头像 发表于 07-18 11:32 ?2803次阅读
    <b class='flag-5'>RISC-V</b>如何盈利?本土企业率先<b class='flag-5'>破</b><b class='flag-5'>局</b>

    孟建熠:攀登 RISC-V 高性能高峰,打造标杆产品

    RISC-V高性能计算领域的崛起,是近年来全球芯片架构竞争的重要趋势之一。其开源、灵活、可扩展的特性,使其在高性能处理器设计、人工智能
    发表于 07-17 15:56 ?4660次阅读

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    AMDROCm6.2.4版本已成功移植到SG2044平台!这一重大突破为SG2044带来了强大的GPU计算能力,为
    的头像 发表于 07-14 17:04 ?717次阅读
    ROCm 6.2.4 成功移植至 <b class='flag-5'>SG2044</b>: 大模型部署速率飙升,<b class='flag-5'>RISC-V</b> + AI 新纪元!代码已经开源,一起来试试!

    智芯公司RISC-V高性能CPU芯片获得权威认可

    近日,智芯公司自主研发的RISC-V高性能CPU芯片通过工信部直属中国电子技术标准化研究院赛西实验室检测,标志着智芯公司在RISC-V高性能CPU芯片领域取得关键突破,自主研发实力获得
    的头像 发表于 06-16 17:32 ?959次阅读

    香橙派发布RISC-V高性能智能网关解决方案OrangePi R2S,赋智能家居和工业互联网

    随着5G、云计算等技术的快速发展,RISC-V架构凭借其精简与开源的特性大幅降低了行业门槛,为物联网市场提供了低成本、高效率的处理器解决方案。香橙派日前推出RISC-V
    的头像 发表于 06-06 17:29 ?729次阅读
    香橙派发布<b class='flag-5'>RISC-V</b><b class='flag-5'>高性能</b>智能网关解决方案OrangePi R2S,赋<b class='flag-5'>能</b>智能家居和工业互联网

    Condor使用Cadence托管云服务开发高性能RISC-V微处理器

    Condor 是一家美国初创企业,致力于开发高性能 RISC-V 微处理器。公司的目标是通过创新技术彻底革新整个行业,打破高性能计算的极限。
    的头像 发表于 05-08 09:03 ?581次阅读

    大象机器人×进迭时空联合发布全球首款RISC-V全栈开源小六轴机械臂

    高性能RISC-V CPU核、RISC-V AI核、NoC总线、RISC-V AI CPU芯片、软件系统等全栈计算技术,提供软硬协同优化的完
    的头像 发表于 04-25 14:19 ?1056次阅读
    大象机器人×进迭时空联合发布全球首款<b class='flag-5'>RISC-V</b>全栈开源小六轴机械臂

    RISC-V生态崛起:政策落地与高性能芯片的崛起

    近期,RISC-V生态取得重要进展,包括高性能核心板的推出和在工业自动化、物联网等领域的广泛应用。其中,致远电子MR6450系列RISC-V核心板,凭借高性能和丰富的通信接口,成为工业
    的头像 发表于 03-06 11:35 ?895次阅读
    <b class='flag-5'>RISC-V</b>生态崛起:政策落地与<b class='flag-5'>高性能</b>芯片的崛起

    关于RISC-V芯片的应用学习总结

    RISC-V凭借其开源性、可扩展性和高性能特性,正在逐步渗透到这一领域。例如,美国国家航空航天(NASA)就计划基于RISC-V架构打造下一代高性
    发表于 01-29 08:38

    risc-v芯片在电机领域的应用展望

    活、更定制化的解决方案。 在电机控制领域,RISC-V芯片的高性能、低功耗和可定制性等特点尤为突出。传统的电机控制芯片往往采用固定的指令集架构,难以满足日益增长的多样化需求。而RISC-V芯片则可以根据
    发表于 12-28 17:20

    圣诞特辑 |开源芯片系列讲座第25期:RISC-V架构在高性能领域的进展与挑战

    报告简介随着以AI应用为代表的高性能力芯片应用场景不断产生多样化需求,RISC-V架构正依靠其开放开源的优势,成为力芯片架构创新的主要技术基础。目前,包括RIS
    的头像 发表于 12-24 08:03 ?985次阅读
    圣诞特辑 |开源芯片系列讲座第25期:<b class='flag-5'>RISC-V</b>架构在<b class='flag-5'>高性能</b>领域的进展与挑战

    SiFive 推出高性能 Risc-V CPU 开发板 HiFive Premier P550

    “ ?HiFive Premier P550:世界上性能最高的 RISC-V CPU 开发板,以 Mini-DTX 外形提供高性能 Linux 开发平台,支持下一波 RISC-V 开发
    的头像 发表于 12-16 11:16 ?2176次阅读
    SiFive 推出<b class='flag-5'>高性能</b> <b class='flag-5'>Risc-V</b> CPU 开发板 HiFive Premier P550

    直播预约 |开源芯片系列讲座第25期:RISC-V架构在高性能领域的进展与挑战

    与挑战报告简介随着以AI应用为代表的高性能力芯片应用场景不断产生多样化需求,RISC-V架构正依靠其开放开源的优势,成为力芯片架构创新的主要技术基础。目前,包括
    的头像 发表于 12-13 17:01 ?611次阅读
    直播预约 |开源芯片系列讲座第25期:<b class='flag-5'>RISC-V</b>架构在<b class='flag-5'>高性能</b>领域的进展与挑战

    希姆计算与开芯院签署生态合作伙伴协议,共同打造高性能RISC-V AI大力芯片

    姆下一代RISC-V力芯片中。这一合作旨在共同打造国内最权威、高性能RISC-VAI力芯片,推进R
    的头像 发表于 10-19 08:11 ?1269次阅读
    希姆<b class='flag-5'>计算</b>与开芯院签署生态合作伙伴协议,共同打造<b class='flag-5'>高性能</b><b class='flag-5'>RISC-V</b> AI大<b class='flag-5'>算</b>力芯片