0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中科曙光发布国内首个开放架构AI超集群系统

中科曙光 ? 来源:中科曙光 ? 2025-09-06 09:11 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9月5日,在2025重庆世界智能产业博览会上,中科曙光发布了国内首个基于AI计算开放架构设计的产品——曙光AI超集群系统。该系统以GPU为核心,实现了“算、存、网、电、冷、管、软”一体化紧耦合设计,具备“超高性能、超高效率、超高可靠、全面开放”四大特点,可为万亿参数大模型训练推理、行业大模型微调、多模态大模型开发、AI4S等场景提供高效算力底座。

相比封闭系统,曙光AI超集群系统除了通过紧耦合设计像一台计算机般高效工作外,还支持多品牌AI加速卡以及兼容CUDA等主流软件生态,为用户提供更多开放性选择,并大幅降低硬件成本和软件开发适配成本,保护前期投资。

当前,伴随AI大模型快速演进以及全球IT产业生态体系调整,国内AI算力领域面临高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等严峻挑战。

而发展更大规模、更高效智算集群来弥补国产单卡算力差距以突破算力瓶颈,打造开放式、标准化、高效率的算力集群,以实现智算集群的易用与可控成本,已经成为产业界共识。

“中科曙光拥有30年高性能计算技术积累,可携手产业伙伴一起突破当下算力瓶颈,共建开放、普惠的智算产业生态。”中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示,克服国内AI算力多维挑战,需汇聚芯片、计算系统、大模型等产业链多方力量,构建开放AI计算架构并拉通产业间跨层协作,以打破“技术墙”与“生态墙”。

而作为开放式、标准化、高效率算力集群的样板,曙光AI超集群系统具有如下技术特点:

超高性能:单机柜可搭载96张GPU卡、算力规模达百P级、访存总带宽超180TB/s;支持多精度、混合精度运算;支持百万卡超大集群扩展。

超高效率:千卡集群大模型训练推理性能达到业界主流水平2.3倍、开发效率提升4倍、人天投入减少70%;存算传协同,提升GPU计算效率55%;先进冷板液冷,394项节能设计PUE低于1.12。

超高可靠:121项设备和链路RAS可靠性设计;平均无故障时间(MTBF)提高2.1倍;平均故障修复时间(MTTR)降低47%;超30天长稳运行集群可靠性测试;实现百万级部件故障自动分析与秒级隔离。

全面开放:基于AI计算开放架构设计;硬件适配多品牌AI加速卡;软件兼容主流AI计算生态;多项技术能力开放与共享。

杜夏威介绍,曙光AI超集群系统不仅是产品,更是面向产业界的开放创新平台。依托AI超集群系统,中科曙光将开放AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈等三项技术能力,助力合作伙伴、重点用户在AI应用存储性能加速、液冷超节点系统设计、GPU开发统一开发框架等方面获得高级别技术共享、深度定制优化与专业技术支持。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    36272

    浏览量

    284742
  • 中科曙光
    +关注

    关注

    5

    文章

    422

    浏览量

    18536
  • 大模型
    +关注

    关注

    2

    文章

    3280

    浏览量

    4374

原文标题:可支持百万卡扩展!中科曙光发布国内首个开放架构AI超集群系统

文章出处:【微信号:sugoncn,微信公众号:中科曙光】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    琶洲实验室与中科曙光达成多项合作共识

    近日,一场关乎AI算力突破与产业落地的重要座谈在中科曙光落下帷幕。中国科学院院士、琶洲实验室(黄埔)主任徐宗本,实验室副主任张海教授带领核心团队专程到访,与中科
    的头像 发表于 08-28 11:27 ?1014次阅读

    中科曙光发布国内首个行业标准化智融合算力平台:Nebula800

    8月15日,2025CCF全国高性能计算学术大会(HPC China2025)期间,中科曙光发布国内首个行业标准化
    的头像 发表于 08-16 10:51 ?2266次阅读

    中科曙光助力中国首部智融合行业标准发布

    8月14日,我国高性能计算领域首部智融合行业标准《智融合集群能力要求》在2025CCF全国高性能计算学术大会正式发布
    的头像 发表于 08-15 15:00 ?535次阅读

    中科曙光打造中部首个液冷气象高性能系统

    面对长江流域暴雨预报的挑战,近期,曙光依托“智融合”技术,成功为某省气象单位打造了中部地区首个全液冷气象高性能计算系统—“暴雨强对流天气预测”平台。
    的头像 发表于 07-07 18:06 ?735次阅读

    中科曙光当选信通院ICCPA专项组长

    近日,智算集群服务推进方阵(ICCPA)年中总结交流会上传来重磅消息:中科曙光成功当选ICCPA“智融合”工作组组长。
    的头像 发表于 07-03 16:16 ?464次阅读

    瑞风协同与中科曙光达成深度合作

    近日,瑞风协同与中科曙光达成深度合作,双方将围绕aiEF大模型一体机展开全方位联合研发,旨在打造“AI+工业”领域标杆解决方案。此次合作依托中科曙光
    的头像 发表于 05-12 18:07 ?718次阅读

    中科曙光获评2025中国人工智能百强企业

    近日,中科曙光受邀出席“2025IT市场年会”并发表主题演讲。会上,赛迪顾问发布《中国人工智能企业竞争力研究(2025)》,中科曙光凭借在
    的头像 发表于 04-27 18:59 ?679次阅读

    中国银河证券携手中科曙光AI技术全面赋能业务发展

    作为国内分支机构数量领先、服务1700万客户的国有头部券商,中国银河证券积极拥抱AI,携手中科曙光A
    的头像 发表于 04-27 14:38 ?649次阅读

    中科曙光智融合解决方案加速量子材料研发

    近期,国内某985高校量子材料实验室成功部署了中科曙光智融合” 解决方案,为长期困扰科研人员的算力不足和操作复杂等难题,找到了解决途径。
    的头像 发表于 04-24 09:20 ?732次阅读

    中科曙光联合成立行业AI智能体开放生态联盟

    近日,行业AI智能体开放生态联盟在北京正式成立。该联盟由中科曙光发起,联合百度、立思辰、高教社、中科天玑、中教云等多家企业创立。
    的头像 发表于 04-17 09:28 ?903次阅读

    中科曙光参与编写智融合集群能力要求行业标准

    近日,由中国信息通信研究院、中国智能计算产业联盟和中科曙光共同牵头的《智融合集群能力要求》行业标准,在北京启动编写。
    的头像 发表于 04-10 14:58 ?666次阅读

    中科曙光旗下中科天玑推出全要素AI舆情系统

    近日,中科曙光旗下中科天玑正式推出实现全数据要素覆盖的AI舆情系统。该系统运用DeepSeek、
    的头像 发表于 02-28 16:13 ?1242次阅读

    中科曙光发布DeepAI深算智能引擎

    今天,在2025全球开发者先锋大会上,中科曙光正式发布DeepAI深算智能引擎,通过打造端到端全栈AI加速套件,助力各行各业AI应用开发与落
    的头像 发表于 02-24 17:03 ?1322次阅读

    中科曙光AI加速智能计算服务千行万业

    近年来,中科曙光AI为中心,全面重构底层芯片、液冷、计算、存储、智算集群、基础软件栈、管理平台,并与AI场景有机适配、融合,加速智能计算服
    的头像 发表于 02-10 17:45 ?1041次阅读

    中科曙光的“数智化”领跑实力

    近日,《咬文嚼字》编辑部发布2024年“十大流行语”引爆全网,其中,“数智化”、“水灵灵地”、“硬控”等,与中科曙光2024年取得的成果不谋而合,让我们一同看看中科
    的头像 发表于 12-27 15:44 ?1008次阅读