0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程和滴普科技完成大模型训练与推理适配

CHANBAEK ? 来源:网络整理 ? 2024-05-30 10:14 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,摩尔线程与滴普科技宣布了一项重要合作成果。摩尔线程的夸娥(KUAE)千卡智算集群与滴普科技的企业大模型Deepexi已完成训练及推理适配,共同实现了700亿参数LLaMA2大语言模型的预训练测试。

在测试过程中,摩尔线程的夸娥千卡智算集群展现了其卓越的性能。全程77小时的无故障连续运行,集群训练稳定性高达100%,训练效率和兼容性均达到预期。这一成果得益于摩尔线程夸娥千卡智算集群的全栈方案,其模型覆盖、推理加速、CUDA兼容、断点续训、分布式训练、集群可靠性等8大核心能力,为训练提供了强大支持。

此次合作不仅彰显了摩尔线程在智能计算领域的领先地位,也标志着双方在推动国产化数智赋能底座构建上取得了实质性进展。展望未来,摩尔线程与滴普科技将继续深化合作,共同推动人工智能技术的创新与发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摩尔线程
    +关注

    关注

    2

    文章

    243

    浏览量

    5594
  • 大模型
    +关注

    关注

    2

    文章

    3250

    浏览量

    4249
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企
    的头像 发表于 08-14 11:34 ?539次阅读

    摩尔线程“AI工厂”:五大核心技术支撑,打造大模型训练超级工厂

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打
    的头像 发表于 07-28 11:28 ?727次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>“AI工厂”:五大核心技术支撑,打造大<b class='flag-5'>模型</b><b class='flag-5'>训练</b>超级工厂

    摩尔线程“AI工厂”:以系统级创新定义新一代AI基础设施

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打
    发表于 07-28 10:34 ?1605次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>“AI工厂”:以系统级创新定义新一代AI基础设施

    壁仞科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,壁仞科技宣布完成旗舰版Qwen3-235B-A22B模型训练
    的头像 发表于 05-16 16:23 ?525次阅读

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型摩尔线程团队在模型发布当天,率先完成了Qwen3全系列
    的头像 发表于 05-07 15:24 ?619次阅读

    摩尔线程GPU成功适配Deepseek-V3-0324大模型

    架构和全功能GPU的强大技术实力,摩尔线程迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署,充分展现了摩尔
    的头像 发表于 03-31 11:34 ?750次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>GPU成功<b class='flag-5'>适配</b>Deepseek-V3-0324大<b class='flag-5'>模型</b>

    摩尔线程GPU原生FP8计算助力AI训练

    并行训练推理,显著提升了训练效率与稳定性。摩尔线程是国内率先原生支持FP8计算精度的国产GPU企业,此次开源不仅为AI
    的头像 发表于 03-17 17:05 ?882次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>GPU原生FP8计算助力AI<b class='flag-5'>训练</b>

    摩尔线程支持阿里云通义千问QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义千问QwQ-32B。摩尔线程在该模型发布后2小时内,迅速且高效完成了对千问QwQ-32B的支持。
    的头像 发表于 03-07 17:48 ?861次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>支持阿里云通义千问QwQ-32B开源<b class='flag-5'>模型</b>

    摩尔线程完成DeepSeek开源库FlashMLA和DeepGEMM适配

    MUTLASS,快速支持了FlashMLA。不仅如此,摩尔线程还基于MUTLASS在全新GPU架构上优化实现了FP8矩阵乘法,支持DeepGEMM的相应功能,充分展示了摩尔线程MUSA
    的头像 发表于 02-27 14:40 ?706次阅读

    昆仑芯率先完成Deepseek训练推理全版本适配

    本文是昆仑芯适配DeepSeek系列推文第一篇,将于近期分别推出在昆仑芯P800上进行DeepSeek-V3/R1推理训练的深度文章,干货满满、持续关注!
    的头像 发表于 02-06 15:13 ?1650次阅读
    昆仑芯率先<b class='flag-5'>完成</b>Deepseek<b class='flag-5'>训练</b><b class='flag-5'>推理</b>全版本<b class='flag-5'>适配</b>

    摩尔线程宣布成功部署DeepSeek蒸馏模型推理服务

    近日,摩尔线程智能科技(北京)有限责任公司在其官方渠道发布了一则重要消息,宣布公司已经成功实现了对DeepSeek蒸馏模型推理服务的部署。这一技术突破,标志着
    的头像 发表于 02-06 13:49 ?919次阅读

    摩尔线程完成股改,筹备上市

    近日,摩尔线程智能科技(北京)股份有限公司(简称“摩尔线程”)宣布已完成股改,并正积极筹备上市。据国家企业信用信息公示系统最新查询结果显示,
    的头像 发表于 11-12 14:15 ?1359次阅读

    摩尔线程GPU与超图软件大模型适配:共筑国产地理空间AI新生态

    10月24日,摩尔线程公司宣布与超图软件达成重要合作里程碑。经过双方的严格测试,摩尔线程的MTT S/X系列全功能GPU已成功与超图软件最新发布的大
    的头像 发表于 10-24 11:29 ?1580次阅读

    摩尔线程与超图软件完成产品兼容认证

    10月24日,摩尔线程官方正式对外宣布,其MTT S/X系列全功能GPU已成功与超图软件最新发布的大模型系列产品完成产品兼容认证。这一消息的发布标志着双方在GPU与软件
    的头像 发表于 10-24 10:25 ?1127次阅读

    摩尔线程与羽人科技完成大语言模型训练测试

    近日,摩尔线程与羽人科技携手宣布,双方已成功实现夸娥(KUAE)千卡智算集群与羽人系列模型解决方案的训练兼容适配。在本次测试中,羽人科技通过
    的头像 发表于 08-27 16:19 ?908次阅读