0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA AI Enterprise助力九州未来构建MaaS平台

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 2024-01-10 17:24 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

借助 NVIDIA AI Enterprise

构建 MaaS 平台

本案例中,九州未来的团队基于NVIDIA AI Enterprise的全栈软件套件,构建其 MaaS 大模型一体化开发及部署平台,该平台同时支持云端部署和私有化部署,通过九州未来开发的算力调度平台软件,实现云端资源与大模型一体机的算力协调和开发协同。

兼顾企业级的

安全性、可靠性和性能

随着大模型的持续发展,特别是垂直领域大模型,对于数据安全性及私密性、模型工具链及平台的通用性和可靠性、模型上线部署的易用性及推理性能等诸多方面提出了更多的诉求。面对快速增长的市场及客户需求,九州未来基于 NVIDIA AI Enterprise 自主开发了其大模型 MaaS 平台,不仅支持端到端的垂直领域大模型的开发全流程,同时支持线下一体机部署与云端资源协调模式,在最大化保护企业数据安全性的同时,兼顾灵活的算力调度与协调供给。

九州未来创始人兼 CEO 张淳先生表示,“AIGC 促进智能算力爆发式增长,并正加速迈入全面应用时代,今后一定不是裸算力简单的资源管理方式,一定需要用软件定义精算力来多元化地管理并提升 GPU 的附加价值,助力加速垂直模型和应用落地的效率。”

为构建自定义

生成式 AI 应用提供支持

NVIDIA AI Enterprise 是一个为企业提供生产就绪型全栈的软件解决方案,提供并保证其可靠的 AI 正常运行和不间断的 AI 卓越表现,实现利用生成式 AI 进行创新的企业加速开发。

九州未来通过 10 余年云边自主研发软件的技术积累,结合近年来赋能智算中心的不断落地,通过 NVIDIA AI Enterprise 深度的技术整合,以大模型为基础、轻量化微调的 MaaS 服务作为其核心服务能力之一,基于基础模型训练后的行业大模型,使用相关行业数据进行微调或知识检索能力的导入,再通过NVIDIA TensorRT-LLM及NVIDIA Triton推理服务器的推理优化和实现一键部署后,可以为特定行业提供高质量高性能的大模型 AI 应用。

上图的大模型 MaaS 平台,端到端包含 Animbus PaaS 平台(集成NVIDIA GPU Operator和Network Operator)、NVIDIA AI Enterprise 软件套件(包括NeMo Framework– Training Container 和 Inference Container)、MaaS 大模型服务及应用 UI 交互界面,以上所有的软件以及对应的操作系统镜像会打包到一个 U 盘里面,实现一个 U 盘即可快速启动大模型一体机的服务。

NVIDIA NeMo Framework

加速行业大模型开发

LLM(大型语言模型)的全面解决方案

在 MaaS 平台的二次开发和深度整合的过程中,九州未来团队使用 NVIDIA AI Enterprise 中的 NeMo Framework,一款端到端面向企业级交付、云原生大模型的框架,可以灵活地构建、定制和部署生成式 AI 模型。

该平台承载了诸多优质的大模型精选体验,结合特有的行业知识快速导入能力,用户能够很好地训练、微调、评估、优化及部署模型。对于选择好基础模型的用户,提供全流程的向导式服务,训练过程中的训练数据实时可查,用户可轻松基于数据集、使用最好的超参数完成微调任务,在模型完成评估后,实现大模型的一键优化部署。

主要支持训练及优化功能:

基础大模型仓库

SFT/PEFT/提示词工程

推理优化及一键部署

知识导入及向量数据库服务

通过 NVIDIA AI Enterprise 整体软件栈的加速,大模型微调和推理性能相比开源推理框架有大幅提升。

线形图代表在不同 Batch 的情况下完成每次推理请求的平均时延,越低代表越好;

柱状图代表在不同 Batch 情况下的每秒钟生成的 Token 数量,越高代表越好

准备好开始了吗?

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5324

    浏览量

    106656
  • AI
    AI
    +关注

    关注

    88

    文章

    35506

    浏览量

    281394
  • 大模型
    +关注

    关注

    2

    文章

    3193

    浏览量

    4152

原文标题:NVIDIA AI Enterprise 助力九州未来构建 MaaS 平台 加速行业大模型开发与部署

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为助力湖北移动打造“九州”算力互联网区域标杆

    地”的使命,基于AI集群路由器,成功打造“九州”算力互联网区域标杆,实现了网络架构的智能化升级,显著提升算力连接、算力调度、算力保障等关键能力,为智能制造、智慧城市、智慧家庭等提供数智化支撑,推动实体经济和新质生产力的发展,为湖北数字经济发展注入新动能。
    的头像 发表于 05-13 16:11 ?450次阅读

    云南移动携手华为打造“九州”算力互联网创新标杆

    AI时代浪潮下,数智化正在加速赋能千行百业,中国移动“九州”算力互联网深度契合国家“以网强算”战略,为发展新质生产力和推动数字经济高质量发展提供了关键支撑。云南移动作为集团在西南重要的枢纽节点
    的头像 发表于 05-07 09:48 ?306次阅读

    企业使用NVIDIA NeMo微服务构建AI智能体平台

    已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能体的构建模块,使用商业智能与强大的逻辑推理模型 (包括 NVIDIA Llama Nemotron) 处理更多任务。
    的头像 发表于 04-27 15:05 ?597次阅读

    华为助力中国移动全面升级“九州”算力互联网

    在中国移动云智算大会期间,以“智算启新,安全筑基“为主题的智算基础设施及安全峰会成功举办。会上,中国移动联合华为等重磅发布了《“九州”算力互联网(MATRIXES)“AI+”时代目标架构白皮书》,标志着中国移动算力互联网能力全面升级,面向客户提供更加灵活、可靠、安全、绿色
    的头像 发表于 04-14 16:46 ?643次阅读

    NVIDIA AI Enterprise助力AI智能体重构工作模式

    无论是为人道主义援助、客户服务还是医疗健康而开发,基于NVIDIA AI Enterprise软件平台构建
    的头像 发表于 03-25 14:59 ?550次阅读

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    Oracle Cloud Infrastructure (OCI) 与 NVIDIA AI Enterprise 软件平台之间的集成,将使 160 多个
    发表于 03-19 15:24 ?375次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作<b class='flag-5'>助力</b>企业加速代理式 <b class='flag-5'>AI</b> 推理

    NVIDIA 推出开放推理 AI 模型系列,助力开发者和企业构建代理式 AI 平台

    月 18 日 —— ?NVIDIA 今日发布具有推理功能的开源 Llama Nemotron 模型系列,旨在为开发者和企业提供业务就绪型基础,助力构建能够独立工作或以团队形式完成复杂任务的高级
    发表于 03-19 09:31 ?249次阅读
    <b class='flag-5'>NVIDIA</b> 推出开放推理 <b class='flag-5'>AI</b> 模型系列,<b class='flag-5'>助力</b>开发者和企业<b class='flag-5'>构建</b>代理式 <b class='flag-5'>AI</b> <b class='flag-5'>平台</b>

    赣锋锂电亮相2025九州汽车生态博览会

    2025年2月28日-3月3日,一场汽车行业的年度盛会——2025九州汽车生态博览会在深圳国际会展中心盛大开启!赣锋锂电在此次展会上精彩亮相,向市场展示我们的前沿技术与创新产品,下面就为大家揭秘本次参展的亮点!
    的头像 发表于 03-04 17:32 ?691次阅读

    轩辕智驾亮相2025深圳九州汽车生态博览会

    2月28日-3月3日,2025深圳九州汽车生态博览会(简称“九州展”)在深圳宝安国际会展中心举行。作为国内负有盛名的汽车行业盛会,本届展会覆盖乘用车和商用车市场,集合全球整车发布、汽车科技、汽车
    的头像 发表于 03-04 16:35 ?673次阅读

    纳雷科技亮相2025九州汽车生态博览会

    近日,亚洲第一个汽车全产业生态展贸平台——2025九州汽车生态博览会在深圳宝安国际会展中心正式开幕。
    的头像 发表于 03-04 09:36 ?491次阅读

    纳雷科技即将亮相2025九州汽车生态博览会

    2月28日-3月3日,2025九州汽车生态博览会将在深圳国际会展中心(宝安)举行,纳雷科技将携带多款汽车雷达产品及方案重磅亮相。
    的头像 发表于 02-26 17:14 ?839次阅读

    纳雷科技邀您相约2025九州汽车生态博览会

    纳雷科技诚邀您莅临2025深圳九州汽车生态博览会。该展会是国内首个以汽车生态为主题的展览会。我们将携多款车载雷达亮相,包括专为商用车、低速车打造的毫米波避障雷达产品及解决方案,与您共话未来汽车科技!
    的头像 发表于 02-24 17:40 ?701次阅读

    NVIDIA加速AI在日本各行各业的应用

    企业借助基于 NVIDIA AI Enterprise 与 Omniverse 工业 AI 构建的创新中心和服务加速
    的头像 发表于 11-19 15:45 ?830次阅读

    赖耶科技通过NVIDIA AI Enterprise平台打造超级AI工厂

    NVIDIA 技术团队保持合作。赖耶科技通过NVIDIA AI Enterprise平台打造的超级
    的头像 发表于 11-19 14:55 ?1178次阅读

    NVIDIA 携手全球合作伙伴推出 NIM Agent Blueprints,助力企业打造属于自己的 AI

    NVIDIA AI Enterprise 平台中的 NIM 微服务与 NeMo 框架构建和运行他们的
    发表于 08-28 10:10 ?405次阅读
    <b class='flag-5'>NVIDIA</b> 携手全球合作伙伴推出 NIM Agent Blueprints,<b class='flag-5'>助力</b>企业打造属于自己的 <b class='flag-5'>AI</b>