0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习并行化的自适应、可组合与自动化问题

人工智能与大数据技术 ? 来源:机器之心 ? 作者:机器之心 ? 2020-11-23 11:30 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

CMU 机器人研究所张昊(Hao Zhang)博士论文新鲜出炉,主要围绕着机器学习并行化的自适应、可组合与自动化问题展开。

随着近年来,机器学习领域的创新不断加速,SysML 的研究者已经创建了在多个设备或计算节点上并行机器学习训练的算法和系统。机器学习模型在结构上变得越来越复杂,许多系统都试图提供全面的性能。尤其是,机器学习扩展通常会低估从一个适当的分布策略映射到模型所需要的知识与时间。此外,将并行训练系统应用于复杂模型更是增加了非常规的开发成本,且性能通常低于预期。 近日,CMU 机器人研究所博士张昊公布了自己的博士学位论文《机器学习并行化的自适应、可组合与自动化》,旨在找出并解决并行 ML 技术和系统实现在可用性和性能方面的研究挑战。 具体而言,该论文从可编程性、并行化表示、性能优化、系统架构和自动并行化技术等几方面对分布式并行 ML 展开了研究,并认为分布式并行机器学习可以同时实现简洁性和高效性。此外,该论文表明,并行 ML 的性能可以通过生成自适应 ML 模型结构和集群资源范式的策略实现大幅度提升,同时通过将「如何并行化」这一核心问题形式化为端到端优化目标以及构建可组合分布式 ML 系统来自动优化这类自适应、自定义策略,进而可以解决可用性挑战。

论文链接:https://www.cs.cmu.edu/~hzhang2/files/hao_zhang_doctoral_dissertation.pdf 机器之心对该论文的核心内容进行了简要介绍,感兴趣的读者可以阅读原论文。 论文内容介绍 这篇论文主要由三部分组成,如下图所示,第 1 部分(第三章 - 第五章):在单个机器学习并行化层面,使用自适应并行化理解和优化并行机器学习性能;第 2 部分(第六章 - 第七章):为机器学习并行开发统一的表示和可组合系统;第 3 部分(第八章):机器学习并行化的自动化。

论文结构概览 论文第一部分提出了一个简单的设计原则自适应并行(adaptive parallelism),根据模型构建要素(比如层)的特定 ML 属性,将合适的并行化技术应用于模型组成要素中。作者以 BERT 为例,总结出了实现这种自适应的基本原理和三个核心概念,分别是子模型策略组合、多个并行化方面的系统优化和资源感知。此外,作者推导出了一系列优化和实现方法,从不同层面去提升 ML 并行化。研究结果表明其显著提高了 ML 训练在集群上的效率和可扩展性。 第二部分对这种方法进行了概述,并且面向机器学习并行化任务的两个常见范式:单节点动态批处理和分布式机器学习并行,作者将机器学习的并行化表述为端到端的优化问题,并寻找其自动化的解决方法。作者提出了原则表征来表示两类机器学习并行,以及可组合的系统架构 Cavs 与 AutoDist。它们能够快速组合不可见模型的并行化策略,提升并行化表现,并简化并行机器学习程序。

Facebook AI 提出的 DETR 的架构图 在此基础上,论文第三部分提出一个自动并行化框架 AutoSync,用于自动优化数据并行分布训练中的同步策略。它实现了「开箱即用」的高性能,可以通过提出的表征进行空间导航,并自动识别同步策略,这些策略比现有的手工优化系统的速度提高了 1.2-1.6 倍,降低了分布式 ML 的技术障碍,并帮助更大范围的用户访问它。总结来说,这篇论文提出的相关技术和系统验证了分布式环境下面向大规模机器学习训练的端到端编译系统的概念与原型实现。

AutoSync 策略的自动优化流程算法

AutoSync 中的策略空间包含了现有系统中的很多高级策略 语言模型的分布式预训练示例 预训练语言表征已成为 NLP 系统中最普遍、最关键的部分。使用与任务无关的语言模型框架,可以对从 web 抓取的未标记文本进行无监督的训练,只需预测下一个单词或句子。预训练表征可以灵活地应用于下游任务,针对特定任务的损失和数据集进行微调,或是通过少量上下文学习。 近年来,人们在开发更强大的任务无关 LM 架构方面取得了巨大进展,从单层词向量表征到递归神经网络的多层表征和上下文状态,以及最新的基于递归 transformer 的架构。 下图展示了一个著名的例子——双深度 Transformer(BERT)——属于第三类。不管网络架构如何,语言模型通常包含许多参数,而这些参数是在大规模文本语料库上训练出来的,这是因为它们的建模能力随其大小以及文本扫描量成正比。

假设我们对训练 BERT 感兴趣,在基于 AWS 的 GPU 集群上使用 TensorFlow 等框架实现。我们可以使用最先进的开源训练系统——Horovod,开始数据并行训练。 应用 Horovod 转换单机 BERT 训练代码,涉及将原始的框架内置优化器与 Horovod 修补的优化器包装在一起。然后 Horovod 会在集群节点上使用 collective allreduce 或 allgather 来平均和应用梯度。

这些 TensorFlow+Horovod 代码片段展示了 Horovod 如何给优化器打补丁,以及如何为分布式训练进行非常小的代码改变。 虽然可能会在目标集群上部署训练,但获得的扩展不太可能随着添加更多资源而成比例增长(理想情况下,线性扩展与加速器的数量成比例增长):所有的语言模型都有嵌入层,这些层拥有很多模型参数,但在每个设备上的每次训练迭代中访问很少,减少或聚集其梯度都会导致不必要的网络运作;BERT 中的 transformer 是矩阵参数化、计算密集型的,与 Horovod 中的常规做法一样,将梯度分组在一个缩减环(reduction ring)中,很容易使以太网带宽或异构集群 (如 AWS) 的设备 Flops 饱和。 在这两种情况下,设置都容易出现通信或计算混乱的情况,即训练时间的缩短无法令人满意,花费在训练上的计算资源成本在经济上也不能接受。这表明,并行化的常规目标并没有实现。 所以,本文提出的这种自适应并行策略,能够为并行化性能进行适当的优化。 作者介绍 张昊在今年 9 月 2 日完成了博士学位的论文答辩,导师为 CMU 教授、Petuum 创始人邢波(Eric Xing)。获得 CMU 机器人研究所的博士学位后,他将以博士后身份进入 UC 伯克利的 RISE 实验室,与计算机科学系教授 Ion Stoica 共同工作。

他的研究兴趣包括可扩展的机器学习、深度学习以及计算机视觉和自然语言处理领域的大规模机器学习应用。他还协同设计了一系列模型、算法和系统,在更大规模数据、问题、应用中进行机器学习扩展,以简化复杂机器学习模型和算法的原型开发,使机器学习程序分布自动化。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1711

    浏览量

    46958
  • 机器学习
    +关注

    关注

    66

    文章

    8514

    浏览量

    135115
  • 自然语言处理

    关注

    1

    文章

    628

    浏览量

    14249

原文标题:229页,CMU博士张昊毕业论文公布,探索机器学习并行化的奥秘

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    贸泽推出全新自动化资源中心

    新技术。借助这些资源,该领域的专业工程师将能够了解控制系统、机器人和先进自动化软件的新进展。 ? 工业自动化的核心在于提高效率和生产力、增强系统可靠性,同时降低营运成本并强化安全协议。通过该资源中心,专业人员可以获取深度文章,包
    的头像 发表于 08-01 16:26 ?243次阅读
    贸泽推出全新<b class='flag-5'>自动化</b>资源中心

    耐达讯自动化EtherCAT转RS232:示波器连接的“开挂秘籍”

    ,很多示波器都采用它。耐达讯自动化EtherCAT转RS232网关就像个“神奇翻译官”,把EtherCAT的语言“翻译”成RS232能懂的,让它们能携手合作。 我认识的一位工程师就碰到了难题。他们在做
    发表于 07-23 15:31

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业
    的头像 发表于 07-15 16:32 ?259次阅读
    <b class='flag-5'>自动化</b>计算机的功能与用途

    机器人和自动化的未来(2)

    本文是第二届电力电子科普征文大赛的获奖作品,来自西南交通大学黄雯珂的投稿。3机器人与自动化的未来展望随着机器人和自动化技术的不断进步,未来的世界将会是一个高度
    的头像 发表于 04-26 08:33 ?371次阅读
    <b class='flag-5'>机器</b>人和<b class='flag-5'>自动化</b>的未来(2)

    智能舵机:AI融合下的自动化新纪元

    自动化的浪潮中,智能舵机以其独特的魅力和卓越的性能,正引领着自动化产业迈向新的高度。今天,让我们一起走进智能舵机的世界,感受AI技术为其带来的无限可能。 一、智能舵机:自适应控制的先锋 智能舵机
    的头像 发表于 03-28 15:44 ?392次阅读
    智能舵机:AI融合下的<b class='flag-5'>自动化</b>新纪元

    传感器在机器人和自动化领域的应用

    环境适应性的要求日益提升,而磁编码器和磁位置传感器凭借其高分辨率、非接触测量以及抗干扰能力,成为实现这些应用的核心技术。本文将为您探讨这两种关键传感器在机器人与自动化技术中的应用,以及Melexis(迈来芯)的相关解决方案。
    的头像 发表于 03-06 16:17 ?819次阅读

    HFSS 自动化建模工具

    因工作需求,自己写的HFSS参数自动化建模工具,目前只实现了常用的四种模型,可定制,如需可联系 qq:1300038043 附件下载链接:https://pan.baidu.com/s/1TVeTTFiJw-pxSyT1AT8IQA 提取码: kxup
    发表于 02-27 17:44

    自动化设备装车机器人给饲料行业带来哪些优势

    ?自动化设备装车机器人:饲料行业的髙效变革 ?在饲料行业,传统的装车作业依赖大量人力,不仅效率低下,还容易出现人为误差和咹全隐患。随着科技的发展,自动化设备装车机器人的出现,为饲料行业
    的头像 发表于 02-07 15:53 ?460次阅读
    <b class='flag-5'>自动化</b>设备装车<b class='flag-5'>机器</b>人给饲料行业带来哪些优势

    罗克韦尔自动化推出DataReady智能机器

    作为工业自动化、信息和数字转型领域的全球领先企业之一, 罗克韦尔自动化宣布旗下 FactoryTalk Optix 产品组合再添新兵 -
    的头像 发表于 12-31 14:42 ?806次阅读

    自动化创建UI并解析数据

    *附件:32960_auto.rar备注:Main.vi是ui自动化2.1.vi,配置文件为32960.B.ini。 目前可以实现根据配置文件自动化创建控件并布局,且可以自动解析接收到的数据内容写入
    发表于 12-10 08:41

    自动化创建UI并解析数据

    Labview实现动态增加控件效果 - *附件:32960_auto.rar 备注:Main.vi是ui自动化2.1.vi,配置文件为32960.B.ini。 目前可以实现根据配置文件自动化创建控件
    发表于 11-29 11:26

    自动化系统中传感器的应用实例

    自动化 1.1 机器人技术 在工业自动化中,机器人技术是一个重要的应用领域。传感器使机器人能够感知周围环境,执行精确的操作。例如,力/扭矩传
    的头像 发表于 11-19 15:26 ?2280次阅读

    下一代机器人技术:工业自动化的五大趋势

    随着人工智能(AI)技术的迅猛发展和全球制造业的转型升级,下一代机器人技术正在引领工业自动化领域的新一轮变革。这些变革不仅深刻影响着生产模式,还为企业带来了前所未有的机遇和挑战。 一、智能
    的头像 发表于 10-23 15:52 ?1384次阅读

    步进电机如何自适应控制?步进电机如何细分驱动控制?

    步进电机是一种将电脉冲信号转换为角位移或线位移的电机,广泛应用于各种自动化控制系统中。为了提高步进电机的性能,自适应控制和细分驱动控制是两种重要的技术手段。 一、步进电机的自适应控制 自适应
    的头像 发表于 10-23 10:04 ?1726次阅读

    开关电源自动化测试设备:如何实现自动化测试?

    开关电源自动化测试设备是将测试软件和测试硬件集成在一个电源测试柜中的ate自动测试设备,其测试原理是通过计算机操控测试仪器,从而减少人工干预,完成开关电源的自动化测试,旨在解放人力,提高测试效率,让测试更便捷。
    的头像 发表于 08-30 18:19 ?1905次阅读
    开关电源<b class='flag-5'>自动化</b>测试设备:如何实现<b class='flag-5'>自动化</b>测试?