0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3.2万美元造成的斯坦福双臂机器人爆红后,项目负责人亲自发翻车视频

AI科技大本营 ? 来源:CSDN ? 2024-01-08 16:29 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

过去几年间,随着 AI 的发展,一个属于机器人的万亿级赛道正在火热开启,无论是 Google 、特斯拉,还是国内的达闼、追觅、以及稚晖君创业的「智元机器人(AGIBot)」公司均投身其中。

不过,对于普通用户而言,机器人最为重要的并不是设计得多么好看,而是实用性。在当代年轻人的“精致懒”之吃饭要人弄、家务要人做状态下,如果有一款集做饭、收纳、保洁等多个才艺于一身的机器人,岂不美哉!

近日,斯坦福大学 3 位研究人员让许多用户的美梦成真了,其发布了一款名为Mobile Aloha的 AI 机器人。一经展示之后,这款机器人便迅速在网络上走红,成为不少人想人手一个的大热门产品。

只因为它,不仅可以煎大虾,亲自端上桌:

529bf5d0-adfd-11ee-8b88-92fbcf53809c.gif

也能收拾不小心洒出来的水渍:

52ad0366-adfd-11ee-8b88-92fbcf53809c.gif

还能打开柜门,归纳整理:

52c7aa4a-adfd-11ee-8b88-92fbcf53809c.gif

刷碗:

530ceab0-adfd-11ee-8b88-92fbcf53809c.gif

简单来看,Mobile Aloha 是一种用于双手遥控操作的低成本开源硬件系统,解决了训练需要人类操作员仔细指导的移动双手机器人的高成本和技术挑战。

值得一提的是,Mobile Aloha 能实现以上操作,并非完全自主,其全身也支持远程操作。

得益于生成模型的成功,MobileAloha 可以快速从人类演示中学习,而且它可以只通过 50 次的演示就能学会一件事,合作训练可以提高成功率高达 90%。

同时,整个机器人机载电源和计算在内的成本为3.2 万美元,远远低于市场现有的系统及硬件。更让人兴奋的是,Mobile Aloha 的软硬件均是开源的,也方便所有的 AI 爱好者、开发者深入学习与共建。

5366daf2-adfd-11ee-8b88-92fbcf53809c.png

左:用户通过遥控操作从冰箱中获取食物;右图:Mobile ALOHA 可以通过模仿学习完成复杂的长时间任务

硬件代码:https://github.com/MarkFzp/mobile-aloha

软件代码:https://github.com/MarkFzp/act-plus-plus

项目地址:https://mobile-aloha.github.io/

研究 5 年,以低成本打破传统机器人系统的局限性

项目的负责人之一 Tony Z.Zhao 表示,“这个我过去 5 年里最努力的项目之一!”

而之所以会萌生开发这样一款会做饭的 AI 机器人,是因为该研究团队发现,大多数机器人操纵任务都侧重于桌面操纵。这包括最近基于 Transformer 和 Diffusion 模型(广泛应用于生成式人工智能的架构)建立的一系列模型。

然而,日常环境中的许多任务都需要全身协调的流动性和灵巧的操作。譬如,把一个罐子放进厨房的柜子里,那么,机器人需要首先导航到柜子边上,这就需要机器人底座可以移动;进而为了打开橱柜,机器人需要后退,同时牢牢抓住两个门把手,激发全身控制;随后双臂需要抓住锅柄,一起将锅放入橱柜,双手也要协调好。

在研究人员来看,过去有两个主要因素阻碍了模仿学习在双臂移动操作中的广泛应用:

缺乏可访问的、即插即用的全身远程控制硬件。当然并不是说市面上没有这种硬件,而是如果购买现成的机械手,成本会很高。像 PR2 和 TIA GO 这样的机器人价格可能超过 20万美元,这让很多研究实验室无法负担。此外,要在这些平台上实现远程控制操作,还需要额外的硬件和校准。

以前的机器人学习工作没有表现出高性能的双臂移动操作复杂的任务。随着自由度的增加,手臂和基础动作之间的交互可能会变得复杂,基础姿势的微小偏差可能会导致手臂末端执行器姿势的大幅偏移。

在论文中,研究员表示,“立足于硬件和学习的角度,以前的工作还没有为双臂移动操作提供一个实用而有说服力的解决方案。”

现如今随着 AI 的发展,机器人到底可以不可以做到移动并实现协调全身去完成任务。研究人员研究了将模仿学习扩展到需要双臂移动机器人全身控制的任务可行性。

537d4544-adfd-11ee-8b88-92fbcf53809c.png

https://mobile-aloha.github.io/resources/mobile-aloha.pdf

MobileALOHA 的研发

在硬件维度,研究人员提出了 MobileALOHA,扩展了原始ALOHA的功能,这是一种低成本和全身远程控制系统,用于收集双臂移动操作数据。

在硬件设计时,研究人员主要从四个维度切入考虑:

移动速度要快:与人类的行走速度相媲美,约为 1.42 米/秒。

稳定性:在拿起沉重的家居物品时,如锅、吸尘器时,它是稳定的。

支持全身远程控制:所有的自由度可以同时远程操作,包括双臂和移动底座。

不受限制:板载电源和计算。

要想实现 MobileALOHA 的灵活性,研究员在它的下方安装了一个专为仓库设计的轮子底座——Tracer AGV,它可以承载 100kg,移动速度高达 1.6m/s,而成本只有 7000 美元。

为了使 Mobile ALOHA 不受限制,研究人员配备了一个 1.26 千瓦时的电池,重量在 14 公斤,这样还可以压住机器人,防止不平衡摔倒。此外,整个装置还包括网络摄像头和一个搭载消费级 GPU 的笔记本电脑,成本共计约为 3.2 万美元,比现成的双臂机器人便宜得多。

研究员在论文中介绍道,Mobile ALOHA 可同时遥控所有自由度。人类操作员的腰部被用物理的方式拴在系统上,并反向驱动车轮,在工作环境中驾驶系统,同时用控制器控制机器人手臂。同时,研究人员记录基本速度数据和手臂操纵数据,形成一个全身远程控制操作系统

538bfbc0-adfd-11ee-8b88-92fbcf53809c.png

这样,机器人控制系统就能同时学习动作和其他控制指令。一旦收集到足够的信息,模型就能自主地重复一系列任务。

在模仿学习方面,Mobile ALOHA 利用了 Transformer(大型语言模型中使用的架构)。最初的 ALOHA 系统使用了一种名为 Action Chunking with Transformers (ACT) 的架构,它将来自多个视点和关节位置的图像作为输入并预测一系列动作。

53972d4c-adfd-11ee-8b88-92fbcf53809c.png

MobileALOHA 将运动信号添加到输入向量中,从而扩展了该系统。这种方法可以让 Mobile ALOHA 重复使用以前的深度模仿学习算法,而只需做最小的改动。

在论文中,研究人员写道:“我们观察到,简单地将底座和手臂动作连接起来,然后通过直接模仿学习进行训练,就可以产生出色的表现。具体来说,我们将 ALOHA 的 14-DoF 关节位置与移动底座的线速度和角速度连接起来,形成 16 维动作向量。”

与此同时,研究人员汲取了近期业界在预训练和不同机器人数据集上取得的成功经验,并利用静态双臂数据集的信息,逐步提高模仿学习的性能。

在演示中,研究员展示了训练有素的机器人烹饪三道菜,并执行了一些精细的任务,例如打碎鸡蛋、切碎大蒜、倒液体、拆开蔬菜包装以及在煎锅中翻转鸡肉。

53a1a18c-adfd-11ee-8b88-92fbcf53809c.gif

此外,Mobile ALOHA 还可以执行各种家务任务,包括给植物浇水、使用真空吸尘器、装卸洗碗机、从冰箱中取出饮料、操作洗衣机。

53cd18b2-adfd-11ee-8b88-92fbcf53809c.png

53db9996-adfd-11ee-8b88-92fbcf53809c.png

研究人员表示:“通过协同训练,我们只需对每项任务进行 50 次人类演示,就能在这些任务上取得超过 80% 的成功,与没有协同训练相比,平均绝对提高了 34%。”

53eb7230-adfd-11ee-8b88-92fbcf53809c.png

Mobile ALOHA 背后的研究员

Mobile ALOHA 的到来,不仅打破了很多传统机器人的局限性,也让我们看到了这个年轻人团队为 AI 带来的无限潜力。

正如文章伊始所述,Mobile ALOHA出自斯坦福大学 3 位研究人员之手,也是华人团队。

Zipeng Fu(项目联合负责人)

Zipeng Fu,是斯坦福人工智能实验室计算机科学专业的博士生,导师是Chelsea Finn。

同时,他还是 GoogleDeepMind 的学生研究员,与Google Brain Robotics机器人运动和安全团队的技术主管经理Jie Tan一起工作。

此前,ZipengFu在加州大学洛杉矶分校完成了计算机科学与应用数学学士学位,导师是Song-Chun Zhu,后来在CMU 攻读机器学习领域的硕士,并在机器人研究所担任学生研究员,导师是 Deepak Pathak 和 Jitendra Malik。

他的研究兴趣在于机器人学、机器学习和计算机视觉的交叉领域。重点关注机器人在非结构化开放世界中的强大性能和可部署机器人系统。

Tony Z. Zhao(项目联合负责人)

Tony Z. Zhao 是斯坦福大学计算机科学博士三年级学生,导师同是 Chelsea Finn。同时,他也是 Google Deepmind 的兼职学生研究员。

此前,Tony Z. Zhao 在特斯拉自动驾驶汽车公司和 Google X Intrinsic 实习。于 2021 年获得伯克利大学电子工程科学学士学位,导师是 Sergey Levine和 Dan Klein。

“我想让机器人能够执行复杂的精细操作任务。我对初创企业和自主机器人的未来感到兴奋”,Tony Z. Zhao 写道。

Chelsea Finn(顾问)

Chelsea Finn是斯坦福大学计算机科学与电子工程系助理教授。她的实验室 IRIS 主攻研究大规模机器人交互智能,隶属于 SAIL 和ML小组。

除了教授职位之外,Chelsea Finn 在 Google 任职,是 Google Brain 团队的一员。

此前,Chelsea Finn 在加州大学伯克利分校获得了计算机科学博士学位,并在麻省理工学院获得了电子工程和计算机科学学士学位。

项目负责人现身发布翻车视频:并未做好接管世界的准备!

随着研究人员将这一项目对外公开,不少网友开始期待:「感觉我以后养老可以靠它了,现在开始攒钱,然后让机器人给我打工!」

不过,这样的幻想还没有持续多久,该项目负责人之一的 Tony Z.Zhao 紧急在 Twitter 上又发布一则视频,为 Mobile ALOHA 泼了一盆冷水。其表示,“机器人还没有准备好接管世界!我刚刚制作了一个视频,记录了在自主模式下犯下的最愚蠢的错误 Mobile ALOHA。我们还计划在休息后组织一些现场演示。敬请关注!”

在视频中,Mobile ALOHA 在自主模式下,不仅手抖,将酒杯里的水洒出来了,还让它自由落体,变成了玻璃渣:

54118c9a-adfd-11ee-8b88-92fbcf53809c.png

弄翻了锅,研究员都来不及挽救:

541da21e-adfd-11ee-8b88-92fbcf53809c.gif

Tony Z.Zhao 对此说道,「老实说,这可能是迄今为止我最喜欢的视频,当它在你面前失败时就不那么有趣了」。同时,他还向 2015 年 DARPA 机器人挑战赛、波士顿机器人失败的案例致敬。

其实,Tony Z.Zhao在Mobile ALOHA 爆火一天后选择公布“幕后花絮”,实则也是希望更多的人保持理性,减少炒作。在 AI 快速发展背后,其实也依然存在很多的不足,我们应该正确对待 AI 的发展,也要勇于面对失败,毕竟失败是成功非常重要的一个过程。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    29939

    浏览量

    214419
  • AI
    AI
    +关注

    关注

    88

    文章

    35758

    浏览量

    282451
  • 模型
    +关注

    关注

    1

    文章

    3547

    浏览量

    50734

原文标题:3.2万美元造成的斯坦福双臂机器人爆红后,项目负责人亲自发翻车视频

文章出处:【微信号:AI科技大本营,微信公众号:AI科技大本营】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    机器人,复合型机器人该何去何从?

    电子发烧友网报道(文 / 吴子鹏) 近一段时间,乐聚公司发布了多台 “夸父” 人形机器人在一汽红旗工厂完成长时间循环作业的视频视频显示,“夸父” 人形机器人能够承担物流拣选与搬运任务
    的头像 发表于 04-16 09:32 ?1727次阅读

    斯坦福(Stanford)锁相放大器故障修复

    斯坦福锁相放大器是由斯坦福研究系统公司(Stanford Research Systems, SRS)研发的一款测量工具,主要用于微弱信号的测量和提取。它结合了高灵敏度、高精度、高稳定性和多功能性于一体,是科研和工业领域的重要设备。
    的头像 发表于 07-30 10:58 ?205次阅读
    <b class='flag-5'>斯坦福</b>(Stanford)锁相放大器故障修复

    人形机器人遇阻?特斯拉“擎天柱”项目负责人离职

    电子发烧友网报道(文/李弯弯)特斯拉“擎天柱”(Optimus)人形机器人项目负责人米兰·科瓦奇(Milan Kovac)周五表示,他将离开公司。 ? 科瓦奇在X平台上发文称,“我不得不做出一生中
    的头像 发表于 06-10 00:07 ?5638次阅读
    人形<b class='flag-5'>机器人</b>遇阻?特斯拉“擎天柱”<b class='flag-5'>项目负责人</b>离职

    特斯拉optimus人形机器人项目负责人离职

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2025年06月09日 11:52:24

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器人快速开发
    发表于 04-30 01:05

    详解《斯坦福 AI 报告 2025》:国产模型崛起、清华论文领先

    斯坦福AI指数报告这是一份影响力很大的报告,每年一期。该报告旨在追踪、整合、提炼并可视化与人工智能(AI)相关的各类数据。报告提供无偏见、经过严格审查、来源广泛的数据,帮助政策制定者、研究人员、高管
    的头像 发表于 04-17 18:05 ?1000次阅读
    详解《<b class='flag-5'>斯坦福</b> AI 报告 2025》:国产模型崛起、清华论文领先

    名单公布!【书籍评测活动NO.58】ROS 2智能机器人开发实践

    ”社区负责人李乔龙老师共同撰写了这本500页的机器人入门者案头手册——《ROS 2智能机器人开发实践》一书! 本书汇聚了作者过去十几年的机器人开发经验,基于稳定版ROS 2 Jazz
    发表于 03-03 14:18

    斯坦福STANFORD FS725铷钟

    斯坦福STANFORD FS725铷钟 SRS斯坦福FS725 10MHzRb频率标准 ? SRS斯坦福FS72510MHzRb频率标准FS725集成了一个铷振荡器(SRS模型PRS10),一个
    的头像 发表于 12-13 15:22 ?621次阅读

    乐聚机器人回应华为合作传闻

    近日,有关“华为特别选择乐聚机器人作为人形机器人领域的本地生态合作伙伴,并计划于2025年发布并实现一定规模量产”的消息在业界流传。针对这一传闻,乐聚机器人相关负责人近日进行了正式回应
    的头像 发表于 12-05 13:53 ?923次阅读

    乐聚机器人回应与华为合作传闻:未发布相关信息

    表示,公司并未发布过与华为在人形机器人领域合作的任何消息。对于传闻中提到的合作细节,如“2025年量产”等,该负责人表示无法确认其真实性。他强调,乐聚机器人在任何合作项目或计划上,都会
    的头像 发表于 12-04 11:21 ?1084次阅读

    鸿蒙机器人与鸿蒙开发板联动演示

    鸿蒙机器人与鸿蒙开发板联动演示,机器人的角色为迎宾机器人,开发板负责人宾客出现监听
    发表于 12-02 14:55

    三星芯片部门任命新负责人

    三星电子近期进行了一些管理层调整,三星芯片业务的负责人进行了调整: 以前负责半导体及设备解决方案(DS)部门的负责人、公司副董事长Jun Young-hyun将调任三星联合首席执行官,同时负责
    的头像 发表于 11-28 14:14 ?594次阅读

    原小鹏机器人设计负责人孙兆治创业项目获千万元天使轮融资

    11月5日消息,由原小鹏机器人(鹏行智能)产品设计负责人孙兆治创立的上海珞博智能科技有限公司,在年中成功完成了千万元级人民币的天使轮融资,投资方为产业相关方。
    的头像 发表于 11-05 16:30 ?1248次阅读

    开源项目!用ESP32做一个可爱的无用机器人

    简介 作者在完成硕士论文答辩,利用空闲时间制作了一个他一直想做的机器人——可爱无用机器人。 无用机器人原理是一个连接到开关的电机,通过逻辑门控制。当开关被推到“开”时,
    发表于 09-03 09:34

    OpenAI硬件负责人热议AI基础设施扩展与节能方案

    在近日于斯坦福大学举办的Hot Chips 2024大会上,OpenAI的硬件设施负责人Trevor Cai发表了一场深入人心的演讲,其核心聚焦于“构建可扩展的AI基础设施”。Trevor Cai
    的头像 发表于 09-02 16:20 ?961次阅读