0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT背后的开源AI框架Ray,现在值10亿美元

人工智能与大数据技术 ? 来源:机器之心 ? 2023-04-14 11:03 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近一段时间,文本生成的人工智能在互联网上掀起了一阵风暴:ChatGPT 因为可以对人们能想到的几乎任何问题提供非常详细、近乎逼真的回答而受到追捧。大模型应用的出现让人们对于 AI 技术突破充满了信心,不过很少有人知道在其背后,一个分布式机器学习框架正为这场生成式 AI 革命提供动力。

分布式计算框架 Ray 来自 A16z 支持的初创公司 Anyscale,它是使 OpenAI 能够强化其训练 ChatGPT 等模型的关键。在 OpenAI 最近的所有大型语言模型背后都有 Ray 的身影 —— 它可能也会是 OpenAI 备受期待的 GPT-4 背后的框架。随着大模型技术的不断落地,业内人士认为通过生成接近人类的内容,一个价值数十亿美元的产业正在形成。

在这一领域,Ray 是影响力最大的框架。在它出现之前,OpenAI 使用自定义工具集合来开发大模型。但 OpenAI 总裁 Greg Brockman 在今年早些时候的 Ray 峰会上就表示,随着面临的挑战增多,该公司已转而使用 Ray。

5c74616c-da65-11ed-bfe3-dac502259ad0.png

软件公司 Weights & Biases 的 CEO Lukas Biewald 认为,Ray 已是 AI 世界中炙手可热的后起之秀。「因为新工具出现,你可以在笔记本电脑和大型分布式服务器上运行相同代码。这是巨大的改变,随着模型变得更大,它的重要性也会随之增加,」Biewald 表示。

十亿美元的赌注

随着技术的成熟,Ray 引来了资本市场的关注。Anyscale 的股权成为了一种稀缺的商品,据 Business Insider 报道,有知情人士称,其最近一轮融资是 C 轮融资的延伸,估值超过 10 亿美元,几天内就结束了。

一些投资者将 Anyscale 描述为 Horowitz 充满希望的「下一个 Databricks」—— 这个描述看来不无道理,因为这家初创公司的创始人之一 Ion Stoica 是市值 310 亿美元的数据巨头 Databricks 的联合创始人。

「人工智能的发展速度令人难以置信,人们一直在尝试新方法,」Anyscale 首席执行官 Robert Nishihara 表示。「ChatGPT 结合了此前大语言模型上的大量工作。在此基础上,你需要拥有能够实现灵活性、快速创新,并扩展不同算法和方法的基础设施。」

由于像 ChatGPT 这样热门的新工具背后是越来越大的模型,科技公司不得不重新考虑从头开始开发 AI 的方式。Ray 应运而生,使训练这些庞大的模型变得更加容易,并且可以包含数千亿个数据点,让每个响应都具有准栩栩如生的感觉。

Ray 如何成为机器学习的首选工具

Ray 是一个基于内存共享的分布式计算框架,适用于细粒度的并行计算和异构计算,其提供了一个底层基础架构,用于管理分配机器学习模型训练工作的复杂任务。

在 2017 年,UC Berkeley 的研究人员首次提交了 Ray 的论文《 Ray: A Distributed Framework for Emerging AI Applications 》:

5c8c45ca-da65-11ed-bfe3-dac502259ad0.jpg

论文链接:https://arxiv.org/abs/1712.05889

GitHub:https://github.com/ray-project/ray

在该工作中,研究人员预测了下一代 AI 应用程序的形态:与环境存在连续的交互,并从交互动作中进行学习。这些应用必然越来越多地在动态环境中来完成任务,根据环境的变化作出反应,并执行一系列的动作来达到长期目标。这些特性对于运行环境性能和灵活性等方面提出了全新且苛刻的系统要求,因此研究者提出了基于分布式的 Ray 框架。

Ray 实现了统一接口,可以表达任务并行和基于参与者的计算,由单个动态执行引擎支持。为了满足性能要求,Ray 采用分布式调度程序和分布式容错存储来管理系统的控制状态。它是首个将训练、仿真和服务统一起来的分布式计算框架,基于动态任务执行引擎统一了角色并行(actor)和任务并行(task)的计算,并保障了框架的高可扩展性和高容错性。

5ca30b8e-da65-11ed-bfe3-dac502259ad0.jpg

Ray 的架构。

基于该工作,2019 年 12 月,UC Berkeley 的 Robert Nishihara、Philipp Moritz 和 Ion Stoica 以及伯克利教授 Michael I. Jordan 创立了 Anyscale,迄今为止该公司已融资 2.6 亿美元。

机器学习从业者通常可以在自己的笔记本电脑上运行使用有限数据集的小型模型,例如预测用户购买产品的简单模型。然而,像 ChatGPT 这样的超大型模型,笔记本电脑是行不通的,这些模型需要大量服务器来训练。

使用大量设备训练一个模型要面对一个重要挑战 —— 在不同硬件上协调训练。而 Ray 恰好解决了这个难题,它为从业者提供了一种将不同硬件作为一个单元来管理的机制,用于确定什么数据去哪里,处理故障等等,硬件种类横跨谷歌云、AWS 和其他处理相同问题的产品组合。此外,Ray 还将其他语言中的一个关键编程概念「actor」扩展到 Python,众所周知 Python 是机器学习程序的首选语言。

5cc3a9b6-da65-11ed-bfe3-dac502259ad0.gif

作为一个分布式计算框架,Ray 有两个关键优势,分别是位置感知(Locality-aware)和任务分配(task placement)。如下图所示,Ray 能够横向扩展系统,以支持高吞吐量的细粒度任务,同时保持容错和低延迟任务调度。

5cda964e-da65-11ed-bfe3-dac502259ad0.png

Ray 为 OpenAI 训练大模型消除了巨大的复杂性,为该公司腾出更多时间和精力专注于模型的关键能力。

新一代 AI 需要新的开发工具,Ray 只是一系列迅速兴起的下一代机器学习工具中的一个,这些工具正在迅速颠覆 AI 的开发方式。例如,Google 的 JAX 框架也获得了巨大关注,JAX 有望成为谷歌核心机器学习工具的支柱,已经在 DeepMind 和 Google Brain 被广泛采用。

类似地,由 FirstMark Capital 和 Bessemer Venture Partners 支持的初创公司 Coiled 开发了一个名为 Dask 的并行计算框架。

近来大型语言模型正在释放更多潜力,这些新型机器学习工具将为业内科技巨头和初创公司构建更强大的语言模型。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1810

    文章

    49221

    浏览量

    251533
  • 机器学习
    +关注

    关注

    66

    文章

    8513

    浏览量

    135102
  • OpenAI
    +关注

    关注

    9

    文章

    1220

    浏览量

    9087

原文标题:ChatGPT背后的开源AI框架Ray,现在值10亿美元

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌再投10亿美元于Anthropic,加强AI领域布局

    近日,Alphabet Inc.旗下的谷歌公司宣布,将向人工智能(AI)开发商Anthropic进一步投资10亿美元。这一举动表明,谷歌正在加大对这家颇具潜力的
    的头像 发表于 01-23 15:20 ?618次阅读

    谷歌拟向Anthropic投资10亿美元

    近日,据外媒最新报道,谷歌正计划向人工智能(AI)领域的初创公司Anthropic进行新一轮投资,投资金额预计超过10亿美元。此举将使谷歌成为Anthropic的重要股东,并加强双方在
    的头像 发表于 01-23 14:38 ?674次阅读

    Luma AI Ray 2视频模型即将发布

    能够在短短10秒内,根据用户提供的文本和图像提示,生成高质量的视频内容。 Luma AI Ray 2视频模型是Luma AI为视频创作者量身打造的“视觉思维合作伙伴”。与前代模型相比,
    的头像 发表于 12-20 11:37 ?762次阅读

    ChatGPT日均消息量破10亿,周活跃用户超3亿

    近日,OpenAI公司首席执行官山姆?阿尔特曼(Sam Altman)宣布了一个令人振奋的消息:ChatGPT聊天机器人的日均消息发送量已经突破了10亿条大关,同时其周活跃用户数量也超过了3亿
    的头像 发表于 12-05 11:19 ?1302次阅读

    Tenstorrent获7亿美元融资,贝索斯参投挑战英伟达

    AI芯片初创公司Tenstorrent近日宣布获得高达7亿美元的融资,公司估也随之攀升至26亿美元
    的头像 发表于 12-03 11:07 ?869次阅读

    字节跳动估跃升至3000亿美元

    TikTok的母公司字节跳动近期发布了一项回购要约,其自我估已达到约3000亿美元,这一数字接近其历史最高估,并预示着未来估的进一步增
    的头像 发表于 11-19 16:41 ?966次阅读

    AMD发布10亿参数开源AI模型OLMo

    AMD公司近日宣布了一项重大进展,推出了首个完全开放的10亿参数语言模型系列——AMD OLMo。这一举措为开发者和研究人员提供了强大的AI研究工具,有助于推动AI技术的进一步发展。
    的头像 发表于 11-12 18:08 ?819次阅读

    万物皆AI 基于联发科科技 MTK Genio 130 结合 ChatGPT 功能的解决方案

    AIChatGPT
    大大通
    发布于 :2024年11月12日 14:20:21

    AI初创公司SandboxAQ寻求超50亿美元融资

    AI初创公司SandboxAQ近日宣布,正寻求按超过50亿美元的估进行新一轮股权融资。这家融合了AI与量子物理学技术的创新企业,专注于开发
    的头像 发表于 10-21 15:44 ?798次阅读

    ChatGPT背后AI背景、技术门道和商业应用

    ,但是当一篇篇文章/报告不断推送到我的眼前,我后知后觉地发现这次真的不一样。 很直接的一点是,ChatGPT已经影响到非AI、非互联网、非计算机的每一个人了。 你会看到,众多科技界大佬,马斯克、纳德拉、李开复、李彦宏、周鸿祎等,都在发声称
    的头像 发表于 10-18 15:42 ?5932次阅读
    <b class='flag-5'>ChatGPT</b><b class='flag-5'>背后</b>的<b class='flag-5'>AI</b>背景、技术门道和商业应用

    AI初创Sierra获数亿美元融资,估跃升至超40亿美元

    Bret Taylor,现任OpenAI董事会主席,同时也是Sierra公司的创始人之一,正积极与投资者协商新一轮融资,据悉,Sierra的估已攀升至超过40亿美元。一位知情人士透露,尽管市场普遍
    的头像 发表于 10-10 15:34 ?2205次阅读

    OpenAI新一轮融资66亿美元,巩固AI领先地位

    近日,美国人工智能领域的佼佼者OpenAI宣布,在最新一轮融资中成功筹集了高达66亿美元的资金。此次融资后,OpenAI的估飙升至1570亿美元
    的头像 发表于 10-08 14:44 ?648次阅读

    AI初创公司Anthropic寻求400亿美元融资

    人工智能领域再掀波澜,OpenAI的强劲对手Anthropic在新一轮融资谈判中,提出了高达400亿美元的估目标,彰显了其市场潜力与投资者的高度认可。这家初创公司以其前沿的AI技术著
    的头像 发表于 09-25 15:43 ?520次阅读

    OpenAI融资谈判升温,估剑指1500亿美元

    OpenAI正加速推进其新一轮融资计划,市场估有望飙升至惊人的1500亿美元。据可靠消息,该公司已向潜在投资者设定了高门槛,要求单笔投资至少达到2.5亿
    的头像 发表于 09-20 16:45 ?948次阅读

    OpenAI以1500亿美元洽谈新一轮融资

    据可靠消息,人工智能领域的佼佼者OpenAI正积极筹备新一轮融资,目标估高达1500亿美元,较其年初的860亿美元
    的头像 发表于 09-12 16:32 ?777次阅读