0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

LinkedIn机器学习解决方案

汽车玩家 ? 来源:今日头条 ? 作者:闻数起舞 ? 2020-05-03 18:37 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

LinkedIn已实现了非常先进的体系结构,可大规模开发机器学习解决方案。

对于大多数组织而言,构建基础结构来管理机器学习模型的生命周期仍然是一个挑战。 尽管我们已经看到了机器/深度学习框架的巨大进步,但对于大多数开始机器学习之旅的团队来说,大规模开发,部署和管理模型的架构最佳实践仍然有些障碍。 为了掌握其中的一些架构最佳实践,我们应该看看机器学习创新正在发生什么。 那是在大型技术公司内部。 微软,谷歌,Facebook,优步,LinkedIn和Netflix已经开发了一些市场上最先进的机器学习基础设施。 今天,我想在LinkedIn上探索支持某些关键任务机器学习工作流程的架构。

LinkedIn是将机器学习应用于大规模场景多年的公司之一,但对该软件巨头使用的特定方法和技术知之甚少。 最近,LinkedIn工程团队发布了一系列博客文章,提供了有关其机器学习基础结构和实践的一些非常有趣的见解。 尽管许多情况都是特定于LinkedIn的,但是这些技术和最佳实践适用于许多大规模的机器学习解决方案。

人与人之间的机器学习

LinkedIn机器学习架构最有趣的方面之一是他们如何利用人作为机器学习工作流程的一部分。 例如,假设一个场景发现了不同标题之间的关系,例如" 高级软件工程师"或"首席开发人员"来改善搜索体验。 LinkedIn使用人类分类学家来标记标题之间的关系,以便可以将它们用于机器学习模型(例如长时记忆网络)中,以帮助发现标题之间的其他关系。 机器学习架构是LinkedIn知识图的基础。

大规模的机器学习基础架构

LinkedIn机器学习基础架构的核心是一个称为Pro-ML的专有系统。 从概念上讲,Pro-ML控制着机器学习模型从训练到监视的整个生命周期。 为了扩展Pro-ML,LinkedIn建立了一个架构,该架构将其一些开源技术(例如Kafka或Samza)与基础结构构建块(例如Spark或Hadoop YARN)相结合。

LinkedIn机器学习解决方案

尽管LinkedIn机器学习堆栈中使用的大多数技术都是众所周知的,但还有一些新的贡献值得进一步探索:

·Ambry:LinkedIn的Ambry是一个分布式的不可变blob存储系统,具有高可用性,易于扩展,经过优化,可以以高吞吐量和低延迟为大小从几个KB到多个GB的不可变对象提供服务,并能够从客户端进行端到端流传输到存储层,反之亦然。 该系统旨在跨多个数据中心在主动-主动设置下工作,并提供非常便宜的存储。

·TonY:YARN上的TensorFlow(TonY)是一个框架,可在Apache Hadoop上本地运行TensorFlow。 TonY支持将单个节点或分布式TensorFlow训练作为Hadoop应用程序运行。

·PhotonML:PhotonML是基于Apache Spark的机器学习库。 当前,Photon ML支持训练不同类型的广义线性模型(GLM)和广义线性混合模型(GLMMs / GLMix模型):逻辑,线性和泊松。

Hadoop上的TensorFlow

上个月,LinkedIn工程团队在YARN(TonY)框架上开源了其TensorFlow的第一版。 该版本的目标是使TensorFlow程序能够在分布式YARN群集上运行。 尽管TensorFlow工作流在诸如Apache Spark之类的基础架构上得到广泛支持,但YARN在很大程度上仍被机器学习社区所忽略。 一流的支持,可通过处理诸如资源协商和容器环境设置之类的任务在Hadoop上运行TensorFlow作业。

LinkedIn机器学习解决方案

TonY的核心是使用TensorFlow程序并将其拆分为可以在YARN集群上执行的多个并行任务。 这样做是在完全支持TensorFlow的计算图的同时,这意味着TensorBoard之类的工具可以在TonY上使用,而无需进行任何修改。

LinkedIn机器学习解决方案

TonY是对TensorFlow生态系统的有趣贡献,可以改善TensorFlow应用程序大规模运行的体验。 此外,TonY可以从YARN生态系统中可用的大量工具和库中受益,从而为训练和运行TensorFlow应用程序提供高度可扩展的运行时。

测试

LinkedIn运行着数以千计的并发机器学习模型,这些模型正在不断发展和版本化。 在这些情况下,开发健壮的测试方法对于优化运行时机器学习模型的性能至关重要。 就LinkedIn而言,工程团队已将A / B测试作为其Pro-ML架构的一等公民,使机器学习工程师可以针对特定情况部署竞争算法并评估产生最佳结果的算法。

像LinkedIn这样的互联网巨头站在大规模机器学习解决方案实施的最前沿,他们对这一主题的见解对于开始他们的机器学习之旅的公司来说具有不可思议的价值。 LinkedIn的工作清楚地表明,大规模开发机器学习是一项永无止境的练习,它将流行的开源库和平台与专有框架和方法相结合。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8513

    浏览量

    135107
  • LinkedIn
    +关注

    关注

    0

    文章

    18

    浏览量

    14787
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    扫地机器人EMC整改:传统方法VS新技术的高效解决方案

    南柯电子|扫地机器人EMC整改:传统方法VS新技术的高效解决方案
    的头像 发表于 06-10 11:00 ?407次阅读
    扫地<b class='flag-5'>机器</b>人EMC整改:传统方法VS新技术的高效<b class='flag-5'>解决方案</b>

    泰克科技全链路测试解决方案助力人形机器人发展

    在刚刚举办的人形机器人科技创新大会中,泰克科技(Tektronix)作为测试、测量和监测解决方案的创新者,展示了其全链路测试解决方案,为与会者提供了深入了解其在人形机器人研发领域的最新
    的头像 发表于 05-21 14:56 ?670次阅读

    纳芯微电子工业控制、机器解决方案器件选型概述

    纳芯微电子工业控制、机器解决方案器件选型概述
    的头像 发表于 05-15 14:40 ?452次阅读
    纳芯微电子工业控制、<b class='flag-5'>机器</b>人<b class='flag-5'>解决方案</b>器件选型概述

    新余赣锋电子推出智能全地形机器人电池解决方案

    近日,赣锋旗下新余赣锋电子研发的智能全地形机器人电池解决方案正式推出,方案搭载赣锋在机器人动力技术领域的多项创新应用。
    的头像 发表于 04-02 14:45 ?544次阅读

    启明智显AI服务机器解决方案:智能硬件方案的佼佼者

    启明智显AI服务机器解决方案,以多模态感知+全栈AI能力,打造真正“会思考、能办事”的服务伙伴,让机器人在家用与商用场景中真正“活”起来!
    的头像 发表于 03-11 17:15 ?826次阅读
    启明智显AI服务<b class='flag-5'>机器</b>人<b class='flag-5'>解决方案</b>:智能硬件<b class='flag-5'>方案</b>的佼佼者

    安川机器人数据采集物联网解决方案

    能力和更高的智能水平,以及实现互联互通与信息共享。 对此,物通博联提供工业智能网关实现工业机器人的解决方案,能够接入ABB、发那科、埃斯顿、安川、现代、雅马哈、固高等工业机器人,实时采集设备状态、急停、报警、工
    的头像 发表于 02-06 16:04 ?527次阅读
    安川<b class='flag-5'>机器</b>人数据采集物联网<b class='flag-5'>解决方案</b>

    广和通正式推出AI玩具大模型解决方案

    ,即可实现音视频及图像的实时传输、语音识别、自然语言处理以及机器学习等多种功能。这意味着玩具能够与用户进行更加丰富的互动,通过拟人、拟动物或拟IP的形式,以视、听、触等多维度的方式与用户进行交流。 广和通的AI玩具大模型解决方案
    的头像 发表于 01-24 10:36 ?1304次阅读

    广和通发布AI玩具大模型解决方案

    玩具行业的新篇章。 这一解决方案的最大亮点在于其高度的集成性和智能化。无需外接MCU,即可轻松实现音视频及图像的实时传输、精准的语音识别、流畅的自然语言处理以及强大的机器学习功能。通过拟人、拟动物或拟IP的生动形式,该
    的头像 发表于 01-21 14:45 ?1280次阅读

    广和通推出AI玩具大模型解决方案

    广和通推出AI玩具大模型解决方案,该方案深度融合豆包等AI大模型、内置广和通Cat.1模组,助力智能玩具实现AI化升级。该解决方案无需外接MCU,即可实现音视频及图像传输、语音识别、自然语言处理
    的头像 发表于 01-21 10:27 ?909次阅读

    传统机器学习方法和应用指导

    在上一篇文章中,我们介绍了机器学习的关键概念术语。在本文中,我们会介绍传统机器学习的基础知识和多种算法特征,供各位老师选择。 01 传统机器
    的头像 发表于 12-30 09:16 ?1300次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 ?510次阅读

    如何在低功耗MCU上实现人工智能和机器学习

    人工智能 (AI) 和机器学习 (ML) 的技术不仅正在快速发展,还逐渐被创新性地应用于低功耗的微控制器 (MCU) 中,从而实现边缘AI/ML的解决方案
    的头像 发表于 12-17 16:06 ?979次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 ?1072次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习机器
    的头像 发表于 11-15 09:19 ?1429次阅读

    解决方案】智慧用电解决方案

    解决方案】智慧用电解决方案
    的头像 发表于 11-11 01:00 ?456次阅读
    【<b class='flag-5'>解决方案</b>】智慧用电<b class='flag-5'>解决方案</b>