10月27日消息,据外媒报道,约翰斯霍普金斯大学博士生安德鲁洪特(Andrew Hundt) 近日发布一篇新论文,指出应通过正强化法训练机器人学习新技能。
这篇论文的核心思想是,在训练机器人的过程中,应采用正强化法,即相比于在它做错时进行惩罚,更应在它做对时进行激励。而对于机器人来说,这种激励机制是以评分系统的形式呈现的,类似玩游戏一样,根据执行任务的情况获得积分。
安德鲁表示,这种方法能够大大缩短训练机器人执行任务的时间。“机器人希望能得到更高的分数,所以它们很快就可以完成相关任务。过去机器人需要一个月的练习才能达到100%的准确性,现在只用两天就能做到。”
不过他也指出,目前机器人执行的这些任务仍然是比较初级的,比如堆积木。但在未来,机器人有望通过正强化法完成更复杂和有意义的任务。
责任编辑:YYX
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
机器人
+关注
关注
213文章
29835浏览量
213735
发布评论请先 登录
相关推荐
热点推荐
海默智能喷涂机器人——为工业喷涂解锁新技能
在工业喷涂领域面临高精度与柔性化双重挑战的今天,传统方式受限于编程效率与复杂曲面适应性,而资深技师的宝贵经验亟待数字化传承。海默机器人依托技术积累,推出移动式惯导随动喷涂协作机器人,以“双核动态捕捉

NVIDIA展示机器人领域的研究成果
在今年的机器人科学与系统会议 (RSS) 上,NVIDIA 研究中心展示了一系列推动机器人学习的研究成果,展示了在仿真、现实世界迁移和决策制定领域的突破。
NVIDIA Isaac Lab可用环境与强化学习脚本使用指南
Lab 是一个适用于机器人学习的开源模块化框架,其模块化高保真仿真适用于各种训练环境,Isaac Lab 同时支持模仿学习(模仿人类)和强化学习(在尝试和错误中进行

NVIDIA Isaac Sim和Isaac Lab现已推出早期开发者预览版
NVIDIA 发布了机器人仿真参考应用 Isaac Sim 和机器人学习框架 Isaac Lab 的开发者预览版。开发者现在可以通过 GitHub 访问早期版本,抢先体验先进功能,用于在基于物理的仿真环境中构建、训练和测试 AI
NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新
在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以加速各种形态机器人的开发。
构建人形机器人学习的合成运动生成流程
通用人形机器人需要能够快速适应现有的以人类为中心的城市和工业工作空间,处理繁琐、重复或体力要求高的任务。这些移动机器人经过设计,能在以人类为中心的环境中有出色的表现,从工厂车间到医疗医疗机构,它们的价值日益凸显。

深度解读英伟达Newton机器人平台:技术革新与跨界生态构建
Newton是由NVIDIA、Google DeepMind和Disney Research开发的开源、可扩展的物理引擎,旨在推进机器人学习和开发。 Newton建立在 NVIDIA Warp

NVIDIA Isaac GR00T与Apple Vision Pro携手探索人形机器人训练新途径
日益凸显。 模仿学习是机器人学习的一个子集,它能让人形机器人通过观察和模仿人类专家的示范来获取新技能。在真实世界中收集这些广泛、高质量的数据集既繁琐又耗时,而且成本往往高得令人却步。从

构建人形机器人学习的合成运动生成管线
通用人形机器人旨在快速适应现有的以人类为中心的城市和工业工作空间,处理繁琐、重复或体力要求高的任务。这些移动机器人经过设计,能在以人类为中心的环境中有出色的表现,从工厂车间到医疗保健机构,它们的价值日益凸显。

【「具身智能机器人系统」阅读体验】1.初步理解具身智能
工智能
认知发展机器人学
进化机器人学
物理体现与互动
五、具身智能的现代技术方向
另外,随着GPT等大语言模型的发展,这些技术也在具身智能机器人领域掀起了一股浪潮,那就是基于大模型的具身智能技术
发表于 12-28 21:12
《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型
和经验积累,使机器人能够自主发现工艺规律,优化作业参数。家庭服务机器人则采用混合任务规划策略:将预训练的基础技能与实时规划相结合,灵活应对开放环境中的各种情况。
第9章深入探讨了元
发表于 12-24 15:03
【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值
100 倍 。此外,Sim2Real 技术的进步也促进了技能与知识从模拟环境到实际应用的转移。这项技术在虚拟空间中训练机器人和 AI 系统,使它们能够安全有效地学习任务,而不受现实世
发表于 12-24 00:33
【「具身智能机器人系统」阅读体验】+初品的体验
动态互动的。
该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、人工智能、机器人学、计算机视觉、自然语言处理及强化学
发表于 12-20 19:17
麻省理工学院推出新型机器人训练模型
近日,据TechCrunch报道,麻省理工学院的研究团队展示了一种创新的机器人训练模型,该模型突破了传统模仿学习方法的局限,不再依赖标准数据集,而是借鉴了大型语言模型(LLM)如GPT-4等所使用的大规模信息处理方式,为
评论