0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC 2023看点:深度学习系统Colossal-AI试图解决什么问题

西西 ? 来源:GTC 2023直播 ? 作者:GTC 2023直播 ? 2023-03-23 16:03 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在GTC 2023 | NVIDIA开发者大会上,加州伯克利数学与计算机科学的教授向我们介绍了关于深度学习系统Colossal-AI的相关内容。

深度学习系统Colossal-AI使用户能够以大幅降低成本的方式最大限度地提高AI训练和推理的效率。它集成了高效的多维并行、异构内存管理、自适应任务调度等先进技术。

Colossal-AI将更好地了解大型模型训练和推理背后的并行性和内存优化技术,学习深度学习系统的实际应用(包括自然语言处理、计算机视觉、生物信息学等),并能够为未来的大型 AI 模型时代做出贡献。

Colossal-AI系统试图解决什么问题呢?

pYYBAGQcCh-AK0ObAAJWHKaquW4641.png

主流AI模型大小增长的图表,它显示了AI模型在短短几年内增长的速度,每18个月增长40倍,这超过了摩尔定律在其具盛时期的最佳表现。

小型和中型企业( SMEs )在尽可能地在采用它们,Colossal-Al系统在2026年时可以帮你节省的成本的估计训练175B参数GPT-3模型,利用所有这些硬件特性和变化,估计训练成本从300降至73000美元,约为41倍。

强调大规模并行是必不可少的,使用单个A 100 GPU训练具有540B参数的Pal M语言模型的时间和成本,需要300年并且花费920万美元。

随着新数据的不断出现,他们需要反复的新训练以避免像2019年的GPT-2一样无法识别COVID-19等概念。

训练完成之后,仅使用模型进行推理也是项挑战,因为模型的大小需要并行技术,单个服务器的内存可能无法容纳大模型。除了设备成本之外,还有人力成本支付需要解决所有这些问题的专家团队,这就限制了一些公司特别是无法承受这些团队的中小企业使用这些大型模型。

因此Colossal-AI的作用出现了:

对特定底层硬件架构进行优化,左侧(硬件层)可以是CPU、 GPU、TPU或FPGAl,右侧是你的用于AI模型编写的框架,如TensorFlow、 Py Torch或其他框架。Colossal-AI可以高效地将大模型部署到目标架构,实现底部显示的所有目标,最小化运行时间,最小化通信(移动数据)在当前架构是最昂贵的操作,最小化用户需要改动代码的数量,即重构。使模型能够动态地适应机器的规模变化,并减少内存占用,一边能运行大模型。

Colossal-AI提供了三个层次:

高效的内存系统,可最大程度利用可用内存。

多维并行,即如何最好地将复杂的模型映射到可用的硬件上,以最大程度地使并行处理并最小化通信。

大规模优化,也就是如何自动调整影响准确度收敛的众多超参数,因为这些值通常取决子如何进行并行处理。

因此Colossal-AI的目标是将复杂且相互作用的决策从用户角度隐藏起来,并自动完成所有操作。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3973

    浏览量

    94350
  • 深度学习
    +关注

    关注

    73

    文章

    5569

    浏览量

    123086
  • gtc
    gtc
    +关注

    关注

    0

    文章

    73

    浏览量

    4634
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    在神经网络的计算中广泛应用,理解矩阵乘法、特征值和特征向量等概念有助于深入掌握深度学习模型的工作原理。 掌握编程语言,如Python和R。Python有丰富的AI库,如NumPy、Pandas用于数据处理
    发表于 07-08 17:44

    英伟达GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代

    英伟达GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代
    的头像 发表于 03-20 15:35 ?850次阅读

    NVIDIA GTC 2025精华一文读完 黄仁勋在GTC上的主题演讲

    来自 NVIDIA 年度最大活动 GTC 的精华新闻,内容涵盖最新服务和硬件、技术演示以及 AI 的未来发展趋势。 GTC 2025 将揭示 AI 的最新发展趋势。这里不仅有最新技术,
    的头像 发表于 03-20 14:54 ?1174次阅读
    NVIDIA <b class='flag-5'>GTC</b> 2025精华一文读完 黄仁勋在<b class='flag-5'>GTC</b>上的主题演讲

    行业首创:基于深度学习视觉平台的AI驱动轮胎检测自动化

    全球领先的轮胎制造商 NEXEN TIRE 在其轮胎生产检测过程中使用了基于友思特伙伴Neurocle开发的AI深度学习视觉平台,实现缺陷检测率高达99.96%,是该行业首个使用AI
    的头像 发表于 03-19 16:51 ?514次阅读
    行业首创:基于<b class='flag-5'>深度</b><b class='flag-5'>学习</b>视觉平台的<b class='flag-5'>AI</b>驱动轮胎检测自动化

    NVIDIA GTC 2025大会即将启幕

    NVIDIA 宣布,全球顶尖的 AI 盛会 GTC 2025 将于 3 月 17 至 21 日重返美国加州圣何塞,届时 AI 领域的精英人士将齐聚 GTC,展示当前物理
    的头像 发表于 03-10 17:19 ?1178次阅读

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发一个视频应用。AI Agent是一种智能应用,能够根据用户需求和环境变化做出相应响应。通常基于
    发表于 03-05 19:52

    AI智能质检系统 工业AI视觉检测

    AI质检系统通过结合机器学习深度学习、计算机视觉等先进技术,能够比较准确的、地完成产品质量检测任务。本文将从多个角度详细探讨
    的头像 发表于 02-26 17:36 ?665次阅读
    <b class='flag-5'>AI</b>智能质检<b class='flag-5'>系统</b> 工业<b class='flag-5'>AI</b>视觉检测

    AI自动化生产:深度学习在质量控制中的应用

    随着科技的飞速发展,人工智能(AI)与深度学习技术正逐步渗透到各个行业,特别是在自动化生产中,其潜力与价值愈发凸显。深度学习软件不仅使人工和
    的头像 发表于 01-17 16:35 ?788次阅读
    <b class='flag-5'>AI</b>自动化生产:<b class='flag-5'>深度</b><b class='flag-5'>学习</b>在质量控制中的应用

    NPU在深度学习中的应用

    随着人工智能技术的飞速发展,深度学习作为其核心驱动力之一,已经在众多领域展现出了巨大的潜力和价值。NPU(Neural Processing Unit,神经网络处理单元)是专门为深度学习
    的头像 发表于 11-14 15:17 ?2161次阅读

    AI干货补给站 | 深度学习与机器视觉的融合探索

    ,帮助从业者积累行业知识,推动工业视觉应用的快速落地。本期亮点预告本期将以“深度学习与机器视觉的融合探索”为主题,通过讲解深度学习定义、传统机器视觉与
    的头像 发表于 10-29 08:04 ?617次阅读
    <b class='flag-5'>AI</b>干货补给站 | <b class='flag-5'>深度</b><b class='flag-5'>学习</b>与机器视觉的融合探索

    GPU深度学习应用案例

    GPU在深度学习中的应用广泛且重要,以下是一些GPU深度学习应用案例: 一、图像识别 图像识别是深度学习
    的头像 发表于 10-27 11:13 ?1597次阅读

    AI大模型与深度学习的关系

    AI大模型与深度学习之间存在着密不可分的关系,它们互为促进,相辅相成。以下是对两者关系的介绍: 一、深度学习
    的头像 发表于 10-23 15:25 ?3064次阅读

    AI深度噪音抑制技术

    AI深度噪音抑制技术通过深度学习算法实现了对音频中噪声的智能消除,它在音频清晰度提升、环境适应性、实时性和自然音质保留等方面展现了巨大的优势。随着A
    的头像 发表于 10-17 10:45 ?1659次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>深度</b>噪音抑制技术

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    人工智能在科学研究中的核心技术,包括机器学习深度学习、神经网络等。这些技术构成了AI for Science的基石,使得AI能够处理和分析
    发表于 10-14 09:16

    FPGA做深度学习能走多远?

    。例如,在数据中心中,可以将 FPGA 与 CPU 或 GPU 结合使用,根据不同的任务需求进行灵活的资源分配和协同计算,提高整个系统的性能和效率。 ? 算法优化和创新:随着深度学习算法的不断发展和优化
    发表于 09-27 20:53