0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为盘古大模型3.0 发布:不开源,现阶段谈投入和收益为时尚早

jf_WZTOguxH ? 来源:AI前线 ? 2023-07-10 14:19 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023 年 7 日 -9 日,华为开发者大会 2023(Cloud)期间,华为发布盘古大模型 3.0。华为盘古大模型最早在 2021 年发布,发展到今天,盘古大模型已经在金融、制造、医药研发、煤矿、铁路等诸多行业发挥作用。

华为云 CTO 张宇昕在接受 InfoQ 采访时表示,华为盘古大模型全栈技术均由华为自主创新,从算力到基础的算子、基础的框架到盘古的开发平台以及模型均没有采用任何开源技术。另外,由于华为云盘古大模型的定位是“AI for Industries”,这些行业大模型里沉淀了客户的知识经验,所以华为不会、也不可能把客户的资产开放出来,也就是说盘古大模型不会开源,而是走商业闭源的道路。

据华为常务董事、华为云 CEO 张平安介绍,盘古大模型 3.0 是面向行业的大模型系列,包括“5+N+X”三层架构:L0 层是 5 个基础大模型,包括自然语言、视觉、多模态、预测、科学计算,提供满足行业场景中的多种技能需求。

盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。

L1 层是 N 个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练自己的专有大模型。

L2 层是为客户提供 X 个细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。

盘古大模型采用完全的分层解耦设计,一方面是为了快速适配、快速满足行业的多变需求,背后更是华为希望借此构筑出良好的商业模式的考虑。

在解耦的三层设计之上,客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,可以单独升级能力集。在 L0 和 L1 大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

张平安强调,盘古大模型的路标图价值将更注重于行业应用的深化和扩展。团队已经在铁路、煤矿、金融和政府等行业开展了大模型的应用,并且还有许多行业需要大模型的支持。未来,团队将加快行业大模型的开发速度,并且在行业垂直领域深化应用。

算力是训练大模型的基础。本次大会上,张平安还宣布单集群 2000P Flops 算力的昇腾 AI 云服务在华为云的乌兰察布和贵安 AI 算力中心同时上线。昇腾 AI 云服务除了支持华为全场景 AI 框架昇思 MindSpore 外,还支持 Pytorch、Tensorflow 等主流 AI 框架。

毫无疑问,大模型的投入是巨大的。不过张平安亦坦言,现阶段讨论盘古大模型的成本与收益还为时尚早,华为在贵阳和乌兰察布投入了大量昇腾 AI 算力,并相信把昇腾 AI 算力做好之后,中国的许多行业以及重塑将会采用盘古大模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    216

    文章

    35291

    浏览量

    256943
  • 数据集
    +关注

    关注

    4

    文章

    1225

    浏览量

    25631
  • 大模型
    +关注

    关注

    2

    文章

    3230

    浏览量

    4223
  • 盘古大模型
    +关注

    关注

    1

    文章

    112

    浏览量

    793

原文标题:华为盘古大模型 3.0 发布:不开源,现阶段谈投入和收益为时尚早

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为CANN与智谱GLM端侧模型完成适配

    已于7月28日正式开源其新一代基座模型GLM-4.5,其GLM端侧模型已完成与CANN的适配。这标志着国产大模型与计算架构在端云协同方向实现关键突破,国产AI生态正加速迈入深度融合
    的头像 发表于 08-11 11:00 ?1299次阅读

    OpenAI发布2款开源模型

    OpenAI开源了两款高性能权重语言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 发布了!我们做了一个开放模型
    的头像 发表于 08-06 14:25 ?448次阅读

    华为宣布开源盘古7B稠密和72B混合专家模型

    电子发烧友网综合报道 2025年6月30日,华为正式宣布开源盘古70亿参数的稠密模型盘古Pro MoE 720亿参数的混合专家
    的头像 发表于 07-06 05:51 ?6505次阅读

    瑞金医院携手华为开源RuiPath病理模型

    近日,由上海交通大学医学院附属瑞金医院(以下简称“瑞金医院”)主办、华为技术有限公司协办的“瑞金医院RuiPath病理模型开源及成果发布会”在上海举行。瑞金医院联合
    的头像 发表于 07-02 14:57 ?515次阅读

    华为正式开源盘古7B稠密和72B混合专家模型

    [中国,深圳,2025年6月30日] 今日,华为正式宣布开源盘古70亿参数的稠密模型盘古Pro MoE 720亿参数的混合专家
    的头像 发表于 06-30 11:19 ?684次阅读

    华为云联合中国农科院打造农业科学发现大模型

    近日,华为开发者大会2025(HDC 2025)于东莞举办。在主题演讲中,华为常务董事、华为云计算BU CEO张平安宣布盘古模型5.5正式
    的头像 发表于 06-26 11:51 ?520次阅读

    华为开发者大会2025(HDC 2025)亮点:华为发布盘古模型5.5 宣布新一代昇腾AI云服务上线

    HarmonyOS、昇腾AI云服务、盘古模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix384 超节点的新一代昇腾AI云服务
    的头像 发表于 06-20 20:19 ?2655次阅读
    <b class='flag-5'>华为</b>开发者大会2025(HDC 2025)亮点:<b class='flag-5'>华为</b>云<b class='flag-5'>发布</b><b class='flag-5'>盘古</b>大<b class='flag-5'>模型</b>5.5 宣布新一代昇腾AI云服务上线

    华为亮相2025开源鸿蒙开发者大会

    by OpenHarmony”生态的阶段性进展和成果。开源鸿蒙项目群工作委员会委员、华为终端BG软件部副总裁章晓峰出席大会并发表了题为《乘风破浪 共创开源鸿蒙未来》的主旨报告,全面回
    的头像 发表于 05-29 09:07 ?691次阅读

    百度飞桨框架3.0正式版发布

    模型训练成本高?推理效率低?硬件适配难? 4月1日,百度发布 飞桨框架3.0正式版 !五大特性专为大模型设计。 作为大模型时代的Infra
    的头像 发表于 04-02 19:03 ?805次阅读
    百度飞桨框架<b class='flag-5'>3.0</b>正式版<b class='flag-5'>发布</b>

    Samtec 技术漫谈 | PCIe? 7.0,为时尚早?还是仍不够快?

    AI加速了技术迭代 许多技术专家似乎在一件事上达成了共识:创新的速度从未如此之快。为什么呢? 很显然,这是因为人工智能(AI)。如今,各方都在竞相提供差异化的硬件解决方案,以便在边缘端和数据中心实现优化的人工智能性能。 数据科学家、人工智能系统架构师、集成电路设计师、光学工程师、像Samtec这样的互连供应商以及其他解决方案提供商,都在重新思考系统拓扑结构。GPU集群、分解式计算、缓存一致性内存、光互连和 200 Gbps 通道等,
    发表于 03-05 11:35 ?289次阅读
    Samtec 技术漫谈 | PCIe? 7.0,<b class='flag-5'>为时尚早</b>?还是仍不够快?

    数据大屏开发用 AI 效率翻倍!华为云 Astro 大屏应用盘古助手,这波操作太震撼了!

    Hey,开发者们!发布一则最新消息,那就是华为云 Astro 大屏应用盘古助手的版本发布了!? 想不想让自己的数据大屏项目变得更快、更智能、更有趣?现在,
    的头像 发表于 02-26 11:44 ?1831次阅读
    数据大屏开发用 AI 效率翻倍!<b class='flag-5'>华为</b>云 Astro 大屏应用<b class='flag-5'>盘古</b>助手,这波操作太震撼了!

    Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑

    ?在人工智能领域,Meta的最新动作再次引起了全球的关注。今天,我们见证了Meta发布的 Llama 3.3 70B 模型,这是一个开源的人工智能模型,它不仅令人印象深刻,而且在性能上
    的头像 发表于 12-18 16:46 ?664次阅读
    Meta重磅<b class='flag-5'>发布</b>Llama 3.3 70B:<b class='flag-5'>开源</b>AI<b class='flag-5'>模型</b>的新里程碑

    IBM发布Granite 3.0 AI模型家族

    IBM在近日举行的年度TechXchange大会上,正式推出了其迄今为止最先进的AI模型家族——Granite 3.0。这一系列的发布标志着IBM在人工智能技术领域的又一次重大突破。
    的头像 发表于 10-23 17:09 ?823次阅读

    IBM发布面向企业的人工智能模型新版本

    近日,IBM正式发布了其面向企业的人工智能模型——Granite 3.0的最新版本,旨在抓住当前企业纷纷拥抱生成式AI技术的热潮。与IBM Granite系列中的其他AI模型一样,Gr
    的头像 发表于 10-22 17:32 ?850次阅读

    Matepad pro12.2 为什么不开源

    Matepad pro12.2 为什么不开源呀,是不是有点违背开源精神了
    发表于 08-27 17:27