0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云分布式深度学习框架帮助千亿多模态训练模型快速迭代训练

科技绿洲 ? 来源:阿里云 ? 作者:阿里云 ? 2022-06-23 16:53 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

日前,国际权威研究机构Gartner发布2022年《云AI开发者服务魔力象限》。

凭借达摩院领先的AI算法和阿里云丰富的产品体系,继2021年入围远见者象限之后,阿里云进一步跃升至挑战者象限,且成为报告中执行能力最强的中国企业。

Gartner报告显示:

到2025年,AI软件市场规模将达到1348亿美元,届时,企业研发的70%的新应用将集成AI模型。

报告进一步指出,“尽管 ModelOps 实践日趋成熟,但大多数软件工程团队需要更便捷的AI服务来开发应用。因此,云AI开发者服务是软件工程团队必不可少的工具”。

当前,AI已逐步成为各类应用的基础能力,云上AI服务可大幅降低AI开发的门槛,中小企业既可以借助阿里云的算力进行AI算法的训练推理,也可以通过阿里云的机器学习平台、语音语义和视觉算法模型开发属于自己的AI应用。

2022年《云AI开发者服务魔力象限》报告从执行能力、愿景完整性两大维度对全球厂商的云AI开发者服务能力进行全面考察分析,考核范围语音语义、视觉、机器学习三大领域的AI模型。

过去几年,阿里云与达摩院的AI算法能力逐步深度融合,构建了一套完整的AI云服务产品体系:

Gartner报告显示,阿里云在该领域为开发者提供了1600多种模型服务,涵盖语言、视觉和机器学习服务,尤其在大规模预训练语言模型的实力强劲,并在数字人、手语翻译等领域取得了一系列进展。

2021年云栖大会,阿里云发布大数据+AI一体化产品体系“阿里灵杰”,包含机器学习平台PAI、云原生大数据计算服务MaxCompute等产品,其中PAI自研的Whale分布式深度学习训练框架,可以帮助千亿多模态预训练模型快速迭代训练。

基于阿里灵杰的分布式优化技术,达摩院成功研发多模态大模型、多语言大模型,其中,多模态大模型M6是全球首个实现10万亿参数的AI预训练模型,规模超越谷歌、微软万亿级模型。

目前,阿里AI每天被调用超1万亿次,服务全球10亿人;阿里还积极拥抱开源,已开源深度语言模型体系AliceMind、通用多模态预训练框架M6-OFA等AI能力。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里云
    +关注

    关注

    3

    文章

    1017

    浏览量

    44421
  • 大数据
    +关注

    关注

    64

    文章

    8966

    浏览量

    140881
  • 深度学习
    +关注

    关注

    73

    文章

    5569

    浏览量

    123093
  • AI算法
    +关注

    关注

    0

    文章

    263

    浏览量

    12747
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    龙芯中科与文心系列模型开展深度技术合作

    ”解决方案。 强强联合!自主架构赋能大模型训练 文心大模型 文心4.5系列模型均使用飞桨深度学习
    的头像 发表于 07-02 16:53 ?829次阅读

    润和软件StackRUNS异构分布式推理框架的应用案例

    江苏润和软件股份有限公司(以下简称“润和软件”)自主研发的StackRUNS异构分布式推理框架已在实际场景中取得显著成效,成功应用于大型园区模态
    的头像 发表于 06-13 09:11 ?629次阅读
    润和软件StackRUNS异构<b class='flag-5'>分布式</b>推理<b class='flag-5'>框架</b>的应用案例

    润和软件发布StackRUNS异构分布式推理框架

    当下,AI模型规模持续膨胀、模态应用场景日益复杂,企业正面临异构算力资源碎片化带来的严峻挑战。为应对行业痛点,江苏润和软件股份有限公司(以下简称“润和软件”)正式发布自主研发的StackRUNS异构
    的头像 发表于 06-13 09:10 ?617次阅读
    润和软件发布StackRUNS异构<b class='flag-5'>分布式</b>推理<b class='flag-5'>框架</b>

    阿里PAI上快速部署NVIDIA Cosmos Reason-1模型

    NVIDIA 近期发布了 Cosmos Reason-1 的 7B 和 56B 两款模态大语言模型 (MLLM),它们经过了“物理 AI 监督微调”和“物理 AI 强化学习”两个阶段
    的头像 发表于 06-04 13:43 ?401次阅读

    海思SD3403边缘计算AI数据训练概述

    模型,将模型转化为嵌入AI模型模型升级AI摄像机,进行AI识别应用。 AI训练
    发表于 04-28 11:11

    AI原生架构升级:RAKsmart服务器在超大规模模型训练中的算力突破

    近年来,随着千亿级参数模型的崛起,AI训练对算力的需求呈现指数级增长。传统服务器架构在应对分布式训练、高并发计算和显存优化等场景时逐渐显露瓶
    的头像 发表于 04-24 09:27 ?385次阅读

    阵列训练到推理

    场景下,阵列分布式计算集群)从模型训练到推理的完整技术流程可结构化分解如下: 一、训练
    的头像 发表于 03-28 08:32 ?380次阅读

    分布式化数据库有哪些类型

    分布式化数据库有哪些类型?分布式化数据库主要类型包括:关系型分布式数据库、非关系型分布式数据
    的头像 发表于 01-15 09:43 ?563次阅读

    模型训练框架(五)之Accelerate

    Hugging Face 的 Accelerate1是一个用于简化和加速深度学习模型训练的库,它支持在多种硬件配置上进行分布式
    的头像 发表于 01-14 14:24 ?878次阅读

    KerasHub统一、全面的预训练模型

    深度学习领域正在迅速发展,在处理各种类型的任务中,预训练模型变得越来越重要。Keras 以其用户友好型 API 和对易用性的重视而闻名,始终处于这一动向的前沿。Keras 拥有专用的内
    的头像 发表于 12-20 10:32 ?560次阅读

    分布式通信的原理和实现高效分布式通信背后的技术NVLink的演进

    的大小已经超出了单个 GPU 的范围。所以就需要实现跨多个 GPU 的模型训练,这种训练方式就涉及到了分布式通信和 NVLink。 当谈及分布式
    的头像 发表于 11-18 09:39 ?1449次阅读
    <b class='flag-5'>分布式</b>通信的原理和实现高效<b class='flag-5'>分布式</b>通信背后的技术NVLink的演进

    PyTorch GPU 加速训练模型方法

    深度学习领域,GPU加速训练模型已经成为提高训练效率和缩短训练时间的重要手段。PyTorch作
    的头像 发表于 11-05 17:43 ?1551次阅读

    Pytorch深度学习训练的方法

    掌握这 17 种方法,用最省力的方式,加速你的 Pytorch 深度学习训练
    的头像 发表于 10-28 14:05 ?745次阅读
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>训练</b>的方法

    端到端InfiniBand网络解决LLM训练瓶颈

    ChatGPT对技术的影响引发了对人工智能未来的预测,尤其是模态技术的关注。OpenAI推出了具有突破性的模态模型GPT-4,使各个领域
    的头像 发表于 10-23 11:26 ?4024次阅读
    端到端InfiniBand网络解决LLM<b class='flag-5'>训练</b>瓶颈

    直播预约 |数据智能系列讲座第4期:预训练的基础模型下的持续学习

    神经网络,特别是预训练的基础模型研究得到了广泛的应用,但其仍然主要依赖于在大量样本上的批量训练。本报告将探讨实现模型的增量
    的头像 发表于 10-18 08:09 ?693次阅读
    直播预约 |数据智能系列讲座第4期:预<b class='flag-5'>训练</b>的基础<b class='flag-5'>模型</b>下的持续<b class='flag-5'>学习</b>