0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能体如何应对训练中故意碰瓷儿的“弱”对手呢?

倩倩 ? 来源:大数据文摘 ? 2020-01-02 15:50 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人们通常会派出最强大的选手和场景训练人工智能,但是,智能体如何应对训练中故意碰瓷儿的“弱”对手呢?

来看看下边的两个场景:两个AI智能体正在“训练场“进行一场激烈的足球赛,一个守门、一个射门。当守门员忽然自己摔倒,攻方没有选择乘胜追击,也忽然不知所措了起来。

在相扑的规则下也一样,当其中一个队员开始不按套路出牌时,另一个对手也乱作一团,双方立刻开始毫无规则扭打在一起。

这样“人工智障”的场景可不是随意配置的游戏,而是一项对AI对抗训练的研究。

我们知道,通常情况下,智能体都是通过相互对抗来训练的,无论是下围棋的阿法狗还是玩星际争霸的AlphaStar,都是通过海量的对局来训练自己的模型,从而探索出获胜之道。

但是试想一下,如果给阿法狗的训练数据都是围棋小白乱下的对局,给AlphaStar提供的是小学生局,结果会是如何?

近期,来自伯克利的研究人员就进行了这样的实验。红色机器人与已经是专家级别的蓝色机器人进行对抗训练,红色机器人采取一定的对抗策略攻击蓝色机器人进行的深度学习。这项研究的论文作者也在NIPS大会上对该研究进行了展示。

论文链接:

https://arxiv.org/pdf/1905.10615.pdf

在实验中,红色机器人为了不让蓝色机器人继续从对抗中学习,没有按照应有的方式玩游戏,而是开始“乱舞”起来,结果,蓝色机器人开始玩得很糟糕,像喝醉了的海盗一样来回摇晃,输掉的游戏数量是正常情况下的两倍。

研究发现,在采取对抗性政策的对局中,获胜不是努力成为一般意义上的强者,而是采取迷惑对手的行动。研究人员通过对对手行为的定性观察来验证这一点,并发现当被欺骗的AI在对对手视而不见时,其表现会有所改善。

我们都知道,让人工智能变得更聪明的一个方法是让它从环境中学习,例如,未来的自动驾驶可能比人类更善于识别街道标志和避开行人,因为它们可以通过海量的视频获得更多的经验。

但是如果有人利用这一方式进行研究中所示的“对抗性攻击” ——通过巧妙而精确地修改图像,那么你就可以愚弄人工智能,让它对图像产生错误的理解。例如,在一个停车标志上贴上几个贴纸可能被视为限速标志,同时这项新的研究也表明,人工智能不仅会被愚弄,看到不该看到的东西,还会以不该看到的方式行事。

这给基于深度学习的人工智能应用敲响了一个警钟,这种对抗性的攻击可能会给自动驾驶、金融交易或产品推荐系统带来现实问题。

论文指出,在这些安全关键型的系统中,像这样的攻击最受关注,标准做法是验证模型,然后冻结它,以确保部署的模型不会因再训练而产生任何新问题。

因此,这项研究中的攻击行为也真实地反映了在现实环境中,例如在自动驾驶车辆中看到的深度学习训练策略,此外,即使被攻击目标使用持续学习,也会有针对固定攻击目标进行训练的策略,攻击者可以对目标使用模拟学习来生成攻击模型。

或者,在自动驾驶车辆,攻击者可以通过购买系统的副本并定期在工厂重置它,一旦针对目标训练出了敌对策略,攻击者就可以将此策略传输到目标,并利用它直到攻击成功为止。

研究也对今后的工作提出了一些方向:深度学习策略容易受到攻击,这突出了有效防御的必要性,因此在系统激活时可以使用密度模型检测到可能的对抗性攻击,在这种情况下,还可以及时退回到保守策略。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    29940

    浏览量

    214463
  • 智能体
    +关注

    关注

    1

    文章

    330

    浏览量

    11172
  • 深度学习
    +关注

    关注

    73

    文章

    5569

    浏览量

    123092
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    宗申命名“”智界和问界!三轮车龙头的电动化转型焦虑

    旗下高端汽车品牌“智界”“问界”高度重合,引发舆论质疑“营销”。尽管宗申迅速发布致歉声明,承诺整改命名并加强审核,但这场风波背后,折射出传统三轮车企业向新能源转型的迫切需求,也暴露出市场竞争白热化的现实。 ? 三轮车龙头
    的头像 发表于 07-12 00:14 ?1w次阅读

    奥比光助力支付宝一下落地电梯场景

    近日,支付宝与分众传媒宣布联合推出“一下抢红包”服务。作为创新交互方式,“支付宝一下”首次被引入至电梯场景,并已在全国20余个城市的电梯铺设。奥比光作为“支付宝一下”业务的核心
    的头像 发表于 08-12 11:32 ?386次阅读

    软国际入选中国信通院AI Agent智能产业图谱1.0

    ”四大核心维度,全面描绘了产业链关键环节与代表力量。软国际凭借在智能平台和医疗行业智能的领先实践,成功入选首批代表企业阵营,并成为少数
    的头像 发表于 07-14 14:55 ?705次阅读

    一下”支付终端应用在酒店:智能无卡入住与客房控制

    一下”支付终端和“一下”支付机具今年已在各种餐饮零售门店推广应用。就连天波小编家附近的村口小超市也用上了“一下”支付终端。近日,卤味龙头企业绝味食品宣布,全国门店将接入“支付宝
    的头像 发表于 07-04 09:57 ?303次阅读
    “<b class='flag-5'>碰</b>一下”支付终端应用在酒店:<b class='flag-5'>智能</b>无卡入住与客房控制

    【HarmonyOS NEXT】华为分享-开发分享

    注册监听事件,当目标设备与宿主设备进行操作后,宿主应用发现设备,调用分享事件回
    发表于 05-16 16:19

    (GUOCI)F系列贴片电容

    F系列防啸叫、低ESR贴片电容 国F系列产品采用特殊陶瓷材料设计,其由精确的介电材料和适当的导电浆料配制,自动化制程的稳定生产和严谨的质量精确管控了介电设计厚度、电极完整性以及端电极连接的良好特性,实现了最佳可靠度、失效开路的产品性能。
    发表于 05-09 15:14

    华为钱包,何以“”出未来?

    让一即达成为数字生活的新常态
    的头像 发表于 05-05 22:59 ?1643次阅读
    华为钱包,何以“<b class='flag-5'>碰</b>”出未来?

    硅基觉醒已至前夜,联发科携手生态加速智能化用户体验时代到来

    、适配与部署;Dimensity Profiler提供深层调试能力;而天玑AI开发套件2.0则在模型规模、训练性能与平台接口全面升级,为开发者打造从芯片到底层算法的闭环支持。 驶向AI下一站——智能
    发表于 04-13 19:51

    学习智能开发

    智能是大模型的应用落地,正在学习,这本书太及时了,非常想看看。
    发表于 03-27 15:48

    PRISEMI芯导科技推出新品–全面应对手机EOS问题

    PRISEMI芯导科技推出新品–全面应对手机EOS问题
    的头像 发表于 02-05 15:53 ?543次阅读
    PRISEMI芯导科技推出新品–全面<b class='flag-5'>应对手</b>机EOS问题

    一下”支付背后的4G技术

    不知道你是否有留意,近期,在线下支付场景,多了一个支付宝“一下”支付的设备,只需要“解锁手机—一下—确认”即可完成支付,对比打开付款码支付,步骤确实更加简洁。
    的头像 发表于 01-03 16:27 ?2492次阅读

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    和经验积累,使机器人能够自主发现工艺规律,优化作业参数。家庭服务机器人则采用混合任务规划策略:将预训练的基础技能与实时规划相结合,灵活应对开放环境的各种情况。 第9章深入探讨了元学习在具身
    发表于 12-24 15:03

    介电容器失效模式分析方法

    介电容器作为电子元件的重要组成部分,其失效模式分析对于保障电子设备的可靠性和稳定性具有重要意义。 一、引言 介电容器,即陶瓷介质电容器,因其高频特性好、温度系数小、耐高压等优点,在电子电路
    的头像 发表于 09-20 15:35 ?1446次阅读

    介电容器在性能上有哪些主要优缺点

    介电容器是一种使用陶瓷材料作为介质的电容器,广泛应用于电子电路,用于储存和释放电能、滤波、去耦、谐振等。由于陶瓷材料的介电常数较高,介电容器通常具有较小的体积和较高的电容值。然而,它们也有一些
    的头像 发表于 09-20 15:25 ?1692次阅读

    华岭申正式竣工投产!

    华岭股份全资子公司—上海华岭申集成电路有限责任公司(以下简称:华岭申)在上海临港举行开业仪式。上海自由贸易试验区临港新片区管委会高科处副处长吴海涛、临港集团副总经济师、临港科投公司董事长翁巍、临
    的头像 发表于 08-20 16:54 ?1348次阅读