0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程与无问芯穹宣布完成基于GPU千卡集群的3B规模大模型实训

摩尔线程 ? 来源:摩尔线程 ? 2024-05-27 10:44 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摩尔线程联合无问芯穹宣布,双方已在本周正式完成基于国产全功能GPU千卡集群的3B规模大模型实训。该模型名为“MT-infini-3B”,在摩尔线程夸娥(KUAE)千卡智算集群与无问芯穹AIStudio PaaS平台上完成了高效稳定的训练。

本次实训充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与国产GPU千卡智算集群深度合作的新范式。

MT-infini-3B模型训练总用时13.2天,经过精度调试,实现全程稳定训练不中断,集群训练稳定性达到100%,千卡训练和单机相比扩展效率超过90%。目前,实训出来的MT-infini-3B性能在同规模模型中跻身前列,相比在国际主流硬件上训练而成的其他模型,在C-Eval,MMLU,CMMLU等3个测试集上均实现性能领先。

0bb4d878-1a48-11ef-b74b-92fbcf53809c.png

MT-infini-3B性能表现

无问芯穹联合创始人兼CEO夏立雪表示:“国内大模型与国产芯片的软硬件协同发展,最终目标是构建一个成熟的生态系统。无问芯穹正在打造‘M种模型’和‘N种芯片’间的‘M×N’中间层产品,实现多种大模型算法在多元芯片上的高效、统一部署。摩尔线程是第一家接入无问芯穹并进行千卡级别大模型训练的国产GPU公司,而‘MT-infini-3B’的训练是行业内首次实现基于国产GPU芯片从0到1的端到端大模型实训案例。”

摩尔线程创始人兼CEO张建中表示:“无问芯穹在夸娥千卡智算集群上实现的从零开始的大模型训练,不仅是对摩尔线程技术实力的有力认证,更是实现了国内大模型训练的国产化闭环。摩尔线程夸娥千卡智算集群以全功能GPU为底座,提供软硬一体化的全栈解决方案,具备高兼容性、高稳定性、高扩展性等综合优势,我们致力于成为AGI时代大模型训练坚实可靠的先进基础设施。”

此前,摩尔线程与无问芯穹已达成深度战略合作。无问芯穹大模型开发与服务平台“无穹Infini-AI”和摩尔线程大模型智算千卡集群夸娥已完成系统级融合适配,该平台可以灵活调用夸娥的集群能力以完成大模型的训练、微调与推理任务。未来,双方还将开展更多适配与测试,推动国产大模型技术的快速发展与应用普及,为中国人工智能产业的蓬勃发展贡献力量。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6235
  • 摩尔线程
    +关注

    关注

    2

    文章

    243

    浏览量

    5594
  • 大模型
    +关注

    关注

    2

    文章

    3250

    浏览量

    4249

原文标题:摩尔线程携手无问芯穹:基于夸娥千卡智算集群的“MT-infini-3B”大模型实训已完成

文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型摩尔线程团队在模型发布当天,率先完成
    的头像 发表于 05-07 15:24 ?619次阅读

    摩尔线程GPU成功适配Deepseek-V3-0324大模型

    架构和全功能GPU的强大技术实力,摩尔线程迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署,充分展
    的头像 发表于 03-31 11:34 ?750次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>GPU</b>成功适配Deepseek-V<b class='flag-5'>3</b>-0324大<b class='flag-5'>模型</b>

    摩尔线程支持阿里云通义QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义QwQ-32B摩尔线程在该
    的头像 发表于 03-07 17:48 ?861次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>支持阿里云通义<b class='flag-5'>千</b><b class='flag-5'>问</b>QwQ-32<b class='flag-5'>B</b>开源<b class='flag-5'>模型</b>

    实现七家国产芯片DeepSeek适配

    近日,宣布了一个重大进展:其DeepSeek-R1、V3系列
    的头像 发表于 02-13 16:04 ?802次阅读

    摩尔线程宣布成功部署DeepSeek蒸馏模型推理服务

    近日,摩尔线程智能科技(北京)有限责任公司在其官方渠道发布了一则重要消息,宣布公司已经成功实现了对DeepSeek蒸馏模型推理服务的部署。这一技术突破,标志着
    的头像 发表于 02-06 13:49 ?919次阅读

    天数智合作突破千卡集群训练优化

    近日,天数智宣布达成深度合作,并在千卡
    的头像 发表于 01-21 14:31 ?1028次阅读

    阿里通义代码模型全系列开源

    近日,阿里云通义大模型团队宣布了一项重大决策:将通义代码模型全系列正式开源。此次开源的模型
    的头像 发表于 11-14 15:26 ?1182次阅读

    性能提升近一倍!壁仞科技携手,在千卡训练集群等领域取得技术新突破

    随着智能算力需求的倍增,到2024年,千卡算力集群已成为国内大模型训练的必备场景。壁仞科技,作为国内少数拥有原创推一体架构的高端算力芯片厂商之一,与在AI算力市场具有重要影响力的
    发表于 11-05 18:45 ?1761次阅读
    性能提升近一倍!壁仞科技携手<b class='flag-5'>无</b><b class='flag-5'>问</b><b class='flag-5'>芯</b><b class='flag-5'>穹</b>,在<b class='flag-5'>千卡</b>训练<b class='flag-5'>集群</b>等领域取得技术新突破

    摩尔线程成立摩尔学院,赋能GPU开发者

    近日,摩尔线程宣布正式成立摩尔学院,为GPU开发者生态建设揭开新篇章。摩尔学院作为一个专业的
    的头像 发表于 10-28 17:03 ?1174次阅读

    摩尔线程GPU与超图软件大模型适配:共筑国产地理空间AI新生态

    10月24日,摩尔线程公司宣布与超图软件达成重要合作里程碑。经过双方的严格测试,摩尔线程的MTT S/X系列全功能
    的头像 发表于 10-24 11:29 ?1580次阅读

    摩尔线程与超图软件完成产品兼容认证

    10月24日,摩尔线程官方正式对外宣布,其MTT S/X系列全功能GPU已成功与超图软件最新发布的大模型系列产品
    的头像 发表于 10-24 10:25 ?1127次阅读

    完成5亿元A轮融资

    近日,大模型基础设施领域的创新企业宣布成功完成
    的头像 发表于 09-03 15:41 ?691次阅读

    摩尔线程与羽人科技完成大语言模型训练测试

    近日,摩尔线程与羽人科技携手宣布,双方已成功实现夸娥(KUAE)千卡智算集群与羽人系列模型解决方
    的头像 发表于 08-27 16:19 ?908次阅读

    摩尔线程夸娥智算中心解决方案重磅升级

    摩尔线程重磅宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡
    的头像 发表于 08-27 16:09 ?1212次阅读

    摩尔线程正式开源音频理解大模型MooER

    近日,国内领先的GPU创新企业摩尔线程宣布了一项重大技术突破——正式开源其自主研发的音频理解大模型MooER(摩耳)。这一举动标志着我国在音
    的头像 发表于 08-27 15:24 ?1023次阅读