0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind AI以总比分 2:0 分别战胜两位职业人类选手

电子工程师 ? 来源:lq ? 2019-01-28 09:30 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

刚刚,在更复杂的《星际争霸 II》游戏中,DeepMind AI 以总比分 2:0 分别战胜两位职业人类选手。这或许是自 2017 年 AlphaGo 在围棋上战胜人类后,再次让人类刷新 AI 认知的人机大战。

此次与人类对战的 AI 是 AlphaGo 兄弟:AlphaStar。开赛前几个小时,DeepMind CEO 在 Twitter 上公布了这一名字。而在开赛前一天,DeepMind 宣布 AI 将与人类在《星际争霸 II》中公开对战的消息,并表示在《星际争霸 II》游戏的疯狂难度模式下,其 AI 的胜率为 50%。

需要说明的是,正如之前打 Dota 的 OpenAI 受到的降低反应速度一样,DeepMind 此次将 AlphaStar 的反应速度“限制”到 APM 280,大致相当于星际中等职业玩家的水平。就 AlphaStar 的表现来看,虽然最终在现场 PK 时输了最后一局比赛,但整体上还是完虐人类。

比赛开始,与 AlphaStar 对战的第一个职业选手是 TLO,其世界排名为第 68 位。此次人机大战是五局三胜制,TLO 虽然不是顶级星际选手,但让人足够惊叹的是,AlphaStar 最终在约五十分钟内结束战斗,以 3:0 的成绩获胜,人类职业选手似乎毫无还手之力。

先来简单回顾下人机大战第一场:AlphaStar 第一局一开始就表现的很有全局观,在 PvP 两矿打一矿的情况下,TLO 很快被击败;第二局一度打得很焦灼,但 AlphaStar 依然以 2:0 再赢一局;十分钟后,TLO 溃败给 AlphaStar,有网友说选手太初级,批评 TLO 作为职业选手在瞎打,没有尊重熬夜看人机大赛的观众。不过,也有人说 AI 很可怕。

如果说第一回合 AlphaStar 战胜的是“初级”选手,那随后与其对战的职业选手是世界排名第 19 位的 MaNa ,其职业水平至少是中上游。

上图显示的是 AlphaStar 的决策过程,具体比赛过程就不说了,结果是 MaNa 在大约 45 分钟内连输五局被 AlphaStar 斩落马下。

前一个职业选手 TLO 在 MaNa 输掉比赛后称,“相信我, 和一个像 AlphaStar 这样的对手比赛是非常困难的, 它的打法和人类完全不同,是你以前从未有过的经验。 AlphaStar 给人留下了极深的印象, 这在游戏 AI 中也是前所未有的。"

AlphaStar 遇神杀神,干脆利落。这次应该没人责怪 MaNa 打得不好,他显然拼尽了全力,而网友发出的慨叹是希望终结者不会来那么快。

但最后一局让网友们为人类命运紧张的情绪稍稍放松,与 MaNa 现场对战的 AlphaStar 一着不慎,让 MaNa 扳回一局,但最终以 1:5 输掉比赛。

AlphaStar 的来历

早在 2016 年,谷歌 DeepMind 的 AI 研究人员已经开始关注暴雪娱乐的《星际争霸 II》。通过游戏来确定 AI 是否可以胜过人类相对简单的复杂任务是 DeepMind 的研究人员长期以来都在尝试的项目。同年 11 月,DeepMind 曾在暴雪嘉年华上宣布与暴雪达成合作协议,将在《星际争霸》系列游戏中进行合作,将在游戏平台中引入机器学习方法,进行人工智能研究。

2017 年 8 月,Deepmind 与暴雪共同发布了合作计划的首个成果:基于《星际争霸 II》的人工智能研究环境 SC2LE,它允许研究者在 Linux 系统中接入游戏 API,开放了 65000 场比赛的数据缓存用于训练 AI,并将添加 50 万场游戏数据到缓存中。

2018 年,同样在暴雪嘉年华上,他们分享了人工智能模型在《星际争霸》游戏中的突破。人工智能模型能执行基本的宏观战略,还能防御像 Tower Rush 这样的激进战术。而刚刚结束的“星际争霸”赛则是是一项“重大挑战”,因为这要求 AI 智能体“实现和平衡一些子目标”,以便最终击败人类选手。

例如,虽然游戏的目标是击败对手,但玩家还必须考虑平衡多个子目标,比如收集资源(水晶和气矿)或建筑。此外,一场比赛的时间通常为几分钟到一小时不等,这意味着游戏中提早执行的行动会在很长时间不见成效。最后,由于玩家智能看到部分地图,这意味着智能体必须结合记忆与规划才能成功。

AlphaStar 背后的 AI 技术

在围棋任务中,对手间可以看到整个棋盘,但《星际争霸 II》与此不同,我们通常无法看到整个地图,需要派小兵出去侦查。而且游戏是不间断进行的,整个游戏甚至会有超过 5000 步的操作。

DeepMind 科学家 Oriol Vinyals 曾在去年的一场以《AI 对战星际争霸胜算几何?》的演讲中提到,这个游戏基本上就是建造一些建筑物以及单位,在同一个地图里与不同的组织相互竞争。在这个游戏中,哪怕只是建造建筑物,也需要做出许多决策。除此之外,他们还要不断收集和利用资源、建造不同的建筑物、不断扩张,因此整个游戏非常具有挑战性。

他们在这个游戏中使用的方法依旧是强化学习。他们要让 AI 模仿人类玩这个游戏的方式,但即使是模仿人类点击鼠标和敲击键盘的行为也非常困难,需要收集整个《星际争霸》玩家的行为进行分析。为此还引入了一个游戏引擎。

DeepMind 还为游戏过程设计了不同的指令和模式,这使得整个玩《星际争霸》的过程变得独一无二。如今,我们看到的 AlphaStar 正是上述想法的结晶。

现在的 AlphaStar 还是刚出生的婴幼儿,不过以其极快的进化速度,你也能想到日后的进化版会是多么无可匹敌。到现在,或许还有很多人期待 2 月 15 日 AlphaStar 与世界排名第一的 Serral 进行终极对决,但最终的结果可想而知。正如柯洁输给 AlphaGo 时面临的绝望一样,人类可能不愿意面对这样的现实:在更多复杂的场景中,人类可能正以难以想象的速度输给 AI。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35863

    浏览量

    282784
  • 机器学习
    +关注

    关注

    66

    文章

    8516

    浏览量

    135127
  • DeepMind
    +关注

    关注

    0

    文章

    131

    浏览量

    11684

原文标题:2:0!谷歌 AI “AlphaStar“ 虐杀职业星际玩家

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    0.6 至 3.0 GHz 双通道 SPST (2xSPST) 并联开关(两位控制),采用 WLCSP 封装 skyworksinc

    电子发烧友网为你提供()0.6 至 3.0 GHz 双通道 SPST (2xSPST) 并联开关(两位控制),采用 WLCSP 封装相关产品参数、数据手册,更有0.6 至 3.0 GHz 双通道
    发表于 08-04 18:33
    0.6 至 3.0 GHz 双通道 SPST (<b class='flag-5'>2</b>xSPST) 并联开关(<b class='flag-5'>两位</b>控制),采用 WLCSP 封装 skyworksinc

    刚刚,英伟达任命两位新首席研究科学家!95 后,本科均来自清华

    ABSTRACT摘要英伟达黄仁勋亲自招揽两位95后华人AI大牛加入英伟达,为加速AI应用布局做准备。JAEALOT2025年7月1日最近,英伟达创始人兼CEO黄仁勋又有大动作,亲自招揽两位
    的头像 发表于 07-01 18:06 ?1057次阅读
    刚刚,英伟达任命<b class='flag-5'>两位</b>新首席研究科学家!95 后,本科均来自清华

    生成式人工智能认证:重构AI时代的人才培养与职业跃迁路径

    人类站在生成式人工智能(Generative AI)的技术奇点上回望,会发现这场革命早已超越了工具迭代的范畴——它正在重新定义人类与技术的协作模式,重塑职业世界的运行逻辑。生成式人工
    的头像 发表于 05-23 09:29 ?341次阅读

    生成式人工智能认证:重塑AI职业生态的底层逻辑

    在人工智能技术渗透至社会毛细血管的今天,生成式人工智能(Generative AI)的崛起正在改写人类与技术的协作范式。从ChatGPT引爆的全球热潮,到Sora模型推动的文生视频革命,这项技术不仅
    的头像 发表于 05-23 09:17 ?254次阅读

    AI时代:不可替代的“人类+”职业技能

    当生成式人工智能能够撰写报告、编写代码甚至设计产品时,一个根本性的焦虑开始蔓延:人类工作者是否正在被算法取代?这个问题的答案或许比简单的“是”或“否”更为复杂——AI确实在重塑职业版图,但真正的挑战
    的头像 发表于 05-20 16:13 ?247次阅读

    什么叫两位三通电磁阀,两位三通电磁阀在工业自动化的应用

    两位三通电磁阀是指具有个工作位置和三个通道的电磁阀。通常,这种电磁阀的工作位置包括常闭和常开种。当电磁阀处于常闭位置时,其中一个通道与另外个通道相连,而当电磁阀处于常开位置时
    的头像 发表于 01-17 14:30 ?3762次阅读
    什么叫<b class='flag-5'>两位</b>三通电磁阀,<b class='flag-5'>两位</b>三通电磁阀在工业自动化的应用

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    近日,谷歌正紧锣密鼓地推进其人工智能(AI)部门的整合工作。据谷歌AI Studio主管Logan Kilpatrick在领英页面上的透露,谷歌已将AI Studio团队整体转移至DeepMi
    的头像 发表于 01-13 14:40 ?837次阅读

    名单公布!【书籍评测活动NO.55】AI Agent应用与项目实战

    日程预测性地调整了今天的工作安排。 在近日的Agent OpenDay上,智谱AI展示了在AI Agent(智能体)方面最新成果,发布了用AI替代人类执行任务的三款智能体,
    发表于 01-13 11:04

    通过SPI向TLV5614输入数字信号,修改串行数据前两位去同时使用路输出管脚时只有一路管脚是正常的,为什么?

    数据前两位(输出通道选择)去同时使用路输出管脚时,却发现只有一路管脚是正常的,而另外一只管脚的信号完全是0。这个问题困扰我很长时间了,我测过从SPI出来的信号,是正确的;我把芯片的
    发表于 01-07 06:10

    2025年半导体市场销量有望超两位数增长,AI成重要推动力

    增长。在今年,这些新兴市场,也将继续推动半导体市场保持稳定增长态势。 ? 多家机构发布预测报告看好2025 年半导体市场 ? 2024年半导体市场呈现出复苏与增长态势,而2025年有望延续这一趋势,不少机构给出的预测更是指出其增长幅度将达到两位
    的头像 发表于 01-04 01:24 ?4807次阅读

    马斯克预言:AI将全面超越人类智力

    近日,科技巨头马斯克作出了一个关于人工智能(AI)的大胆预测。他断言,AI的发展速度将超乎人类的想象,并将在不久的将来全面超越人类的智力。 马斯克在X平台上明确表示,
    的头像 发表于 12-28 14:23 ?838次阅读

    ADC量化位数只有两位,将采样结果做FFT分析后,发现二次谐波的幅度最大,请教是什么原因造成的?

    如题,ADC量化位数只有两位,将采样结果做FFT分析后,发现二次谐波的幅度最大,请教是什么原因造成的?
    发表于 12-26 06:23

    INA226并联电压反馈的十六进驻数据后两位FF不会变化吗?

    来说是比25FF大一点的数据,比如26XX什么的,可是只有我设定值达到1.02A是才能得到26FF。换句话说,INA226并联电压反馈的十六进驻数据后两位FF不会变化吗?小弟表述的不是太好,请各位大侠见谅。
    发表于 12-18 08:21

    AI智能体逼真模拟人类行为

    近日,据外媒最新报道,斯坦福大学、华盛顿大学与Google DeepMind的科研团队携手合作,成功开发出一种能够高度逼真模拟人类行为的AI智能体。 该智能体的构建得益于研究团队将详细的访谈记录
    的头像 发表于 11-26 10:24 ?933次阅读

    2TB内置机械硬盘的适用场景有哪些

    给电脑加装内置硬盘,是实现电脑存储空间自由立竿见影的一步,尤其是2TB内置机械硬盘,以其充足容量和出色的性价比,是个人用户和职业人士储存海量数据的首选。
    的头像 发表于 08-30 10:26 ?1409次阅读