0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高明!OpenAI提出HER算法,人工智能可像人类一样认识错误汲取教训

DPVg_AI_era ? 来源:未知 ? 作者:伍文辉 ? 2018-05-01 16:35 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

失败是成功之母:HER有自我审视能力。

OpenAI的研究人员集中精力于构建具有更强的学习能力的人工智能。得益于他们的增强学习系统OpenAI baselines,机器学习算法可以进行自主学习。目前,这个新的算法保证人工智能可以像人类一样从自己的错误中汲取教训。

这个进步源于OpenAI的研究人员在近期公布的名为“后见之明经验复现(Hindsight Experience Reply, HER)”的开源算法。正如名字所示,HER帮助人工智能系统在完成一项任务后,具有自我审视的能力。OpenAI的博客中提到,人工智能认为失败乃成功之母。

研究人员写到:“构建HER的关键在于利用人类的直觉:在实现某个任务时,虽然我们没有成功,但是在这个过程中我们学到一些不一样的东西,既然如此,为何不能将我们最终学到的知识作为我们最初的目标呢?“

简而言之,这意味着每一次失败的尝试都是为了实现一个意想不到的“虚拟”目标,而非既定目标。

回想一下你学骑单车的经历,在最开始的几次尝试中,你无法掌握平衡。但是这些经验告诉了你怎么骑车是不正确的,怎么做不能保持平衡。就像在人类的学习过程中,每一次的失败让我们距离成功更进一步。

奖励每一次失败,并且失败也不沮丧

通过使用HER,OpenAI希望他们的人工智能系统可以利用上述的方法来学习。与此同时,这种算法也被作为增强学习模型中的奖励机制的替代算法。为了训练人工智能,使其具有独立的学习能力,它需要包含一个奖励机制:如果人工智能算法达到了预期目标,就可以得到一个小奖励,就像奖励给小孩子一块奶油饼干一样,否则就什么都得不到。另外一个系统根据人工智能距离预期目标的距离来给出奖励。

但是这两种算法并不是完美的。第一个算法会阻碍学习,因为一个人工智能算法在训练过程中要么得到奖励,要么没得到。另一方面,根据IEEE Spectrum报道的内容显示,第二系统在实现时,需要衡量与目标的距离并给出奖励,这个过程是很需要技巧的。如果把每一个任务都当作是后见之明的目标,即使人工智能系统没有完成指定的任务,HER也会提供一个奖励。这样帮助人工智能更快更好地学习。

OpenAI 在他的的博客中提到:“通过进行这种奖励机制的替换,强化学习算法在实现某些目标后会获得一个学习信号,即使这个学习任务不是它最初希望实现的。如果重复这个过程,系统最终可以实现任意的目标,包括最初的既定目标。

这种方法并不意味着使用HER方法可以完全简化人工智能系统学习某个任务的过程。研究者表示:“在机器人上使用HER进行学习仍然很难实现,因为这个过程需要大量的数据“。

无论如何,正如OpenAI的模型所显示的,HER有助于鼓励人工智能系统像人类一样从错误中学习,两者的主要区别在于人工智能在面对失败的时候不会像一些脆弱的人类那样伤心沮丧。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1810

    文章

    49185

    浏览量

    250944
  • 机器学习
    +关注

    关注

    66

    文章

    8511

    浏览量

    134959

原文标题:高明!OpenAI提出HER算法,AI系统学会从错误中学习

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!?(壹捌伍 柒零零玖 壹壹捌陆)
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!?(壹捌伍 柒零零玖 壹壹捌陆)
    发表于 08-07 14:23

    文速览:人工智能(AI)算法与GPU运行原理详解

    改变了人类生活的方方面面,并且在未来仍然会继续发挥越来越重要的影响力? “人工智能”这概念在1956年于美国达特茅斯学院举办的次学术集会上被首次
    的头像 发表于 02-14 10:28 ?827次阅读
    <b class='flag-5'>一</b>文速览:<b class='flag-5'>人工智能</b>(AI)<b class='flag-5'>算法</b>与GPU运行原理详解

    OpenAI公布2025年发展目标

    公布的目标中,AGI(通用人工智能)位列榜首。AGI作为人工智能领域的终极目标之,旨在创造出能够人类
    的头像 发表于 01-03 10:40 ?726次阅读

    OpenAI攻克Sora视频创建错误率高难题

    人工智能与多媒体技术的交叉领域,OpenAI近期宣布了项重要进展:成功解决了Sora视频创建过程中错误率高的问题。这突破不仅标志着
    的头像 发表于 12-31 10:37 ?598次阅读

    OpenAI投资道德算法研究

    近日,据外媒最新报道,人工智能领域的领军企业OpenAI正在积极投资学术研究,致力于开发种能够预测人类道德判断的算法。这
    的头像 发表于 11-26 10:20 ?663次阅读

    嵌入式和人工智能究竟是什么关系?

    领域,如工业控制、智能家居、医疗设备等。 人工智能是计算机科学的个分支,它研究如何使计算机具备人类
    发表于 11-14 16:39

    人工智能人类的影响有哪些

    人工智能(AI)作为现代科技的杰出代表,正在以前所未有的速度改变着人类的生活、工作和社会结构。这种影响是全方位的,既带来了显著的积极变化,也伴随着系列挑战和问题。 、积极影响 工作
    的头像 发表于 10-22 17:23 ?6224次阅读

    Vicor技术如何改进生成式人工智能的供电

    生成式人工智能(genAI)带来的文化革命可能互联网普及一样人类产生深远影响。从您的角度来看,目前情况如何?
    的头像 发表于 10-16 09:54 ?795次阅读
    Vicor技术如何改进生成式<b class='flag-5'>人工智能</b>的供电

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    和国际合作等多个层面。这些内容让我更加认识到,在推动人工智能与能源科学融合的过程中,需要不断探索和创新,以应对各种挑战和机遇。 最后,通过阅读这章,我深刻感受到人工智能对于能源科学的
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    农业、环保等,为人类社会的可持续发展做出贡献。 总结 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们展示了个充满希望和机遇的未来。在这个未来中,
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第人工智能驱动的科学创新学习心得

    深刻认识人工智能在推动科学进步中的核心价值。它不仅是科技进步的加速器,更是人类智慧拓展的催化剂,引领我们迈向个更加智慧、高效、持续的科
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    RISC-V在人工智能图像处理领域的应用前景十分广阔,这主要得益于其开源性、灵活性和低功耗等特点。以下是对RISC-V在人工智能图像处理应用前景的详细分析: 、RISC-V的基本特点 RISC-V
    发表于 09-28 11:00

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    ! 《AI for Science:人工智能驱动科学创新》 这本书便将为读者徐徐展开AI for Science的美丽图景,与大家起去了解: 人工智能究竟帮科学家做了什么? 人工智能
    发表于 09-09 13:54

    OpenAI人工智能领域发展势头强劲

    北京时间8月29日,彭博社援引知情人士消息,揭示了OpenAI即将完成其新轮融资的重要进展。本轮融资由知名投资机构兴盛资本(Thrive Capital)领衔,预计估值将突破千亿美元大关,标志着OpenAI
    的头像 发表于 08-29 15:37 ?799次阅读