找回密码
 注册会员
查看: 144|回复: 0

征服围棋后,DeepMind为什么把星际争霸当成了下个目标

[复制链接]
online_member 发表于 2022-4-28 12:48:44 | 显示全部楼层 |阅读模式
征服围棋后,DeepMind为什么把星际争霸当成了下个目标是怎么回事,是真的吗?2016年11月21日是本文发布时间是这个时间。下面一起来看看到底怎么回事吧。
                                征服围棋后,DeepMind为什么把星际争霸当成了下个目标
                               
                                即时战略游戏会给AI带来截然不同的挑战,玩游戏需要的能力对于处理现实世界的问题来说也是必不可少的。
                               
                               

征服围棋后,DeepMind为什么把星际争霸当成了下个目标782 / 作者:UFO爱好者 / 帖子ID:86625


在亚洲古老的棋盘游戏——围棋上取得巨大成功后,DeepMind正计划研究下一款游戏,而他们的新目标与围棋截然不同。

这家伦敦的AI研发公司是Google的子公司,它正与加州的游戏公司暴雪(Blizzard)在一款名为星际争霸II(StarCraft II) 的实时战略游戏 (real-time strategy game, RTS) 上展开合作。

作为一款全球闻名的电子竞技游戏,星际争霸II满足了作为DeepMind一个有趣挑战的许多要求。不仅仅是因为在该游戏中一流游戏玩家能轻松击败顶级AI对手,更是因为这款游戏会将DeepMind团队引领到一个新的探索领域。

最重要的是,星际争霸II是一款充满各种隐藏信息的游戏。每个玩家会在地图的两边开始游戏,建立极低,训练士兵,然后找出他们的对手。但是他们仅能直接看到队伍周围的区域,剩下的的地图会隐藏在“战争迷雾”当中。

“玩家必须派出他们的队伍去侦察未知地图,以获取敌人的信息,并需要长时间记住获取到的信息。”DeepMind在博客上说道。“周围环境只有部分可见,这使得挑战更为复杂——这也是星际争霸和象棋和围棋这类有完整信息的游戏之间一个有趣的不同之处。这是一款实时战略游戏,双方玩家都同步进行游戏,因此必须快速高效地计算出每一个决定。”

“一个人或者AI要能玩星际争霸,就需要有效利用记忆力,具有进行长期规划并根据新的信息调整游戏策略的能力”

然而,AI确实具有天生的优势。顶级星际争霸玩家排名的一项统计数据是“每分钟动作”(actions per minutr, APM):实质上是每分钟点击的次数。因为没有手指,肌肉,或是患上肌腱炎的可能性,AI可以在点击上轻易超越人类玩家,这导致它可以不通过战略思维,而仅仅通过更快的反应速度获胜。因此,DeepMind会将AI限制在该公司的研究科学家Oriol Vinyals称之为“高级人类”的速度上限。这也有助于确保AI不将处理能力浪费在每分钟做出数千个无关紧要的决策上,并将注意力集中在关键的地方。

Vinyals在星际争霸中有着丰富的经验。 2010年,在加州大学伯克利分校读本科的他编写了一个游戏AI,可以在首次玩游戏就能表现得比内置的AI更好。但那个机器人只是一个简单的脚本系统,里面的每个规则都是设定好的,类似于DeepMind出现之前最好的围棋AI。和在围棋中一样,在星际争霸II中, DeepMind想要专注于机器学习,设计一个可以教会自己玩游戏的AI。

这次,DeepMind 获得了星际争霸II的开发者暴雪(魔兽世界、炉石传说和守望先锋也是这家公司开发的)的帮助,而这一帮助会使DeepMind甩掉其他任何一家想要完成同样挑战的AI研发公司。在2017年第一季度,暴雪将会更新星际争霸II,为游戏引入一个新的AI研发环境,并提供一个API,开发者可以利用这个API从游戏中获取额外的信息,用以教会他们的机器人如何玩这个游戏。

征服围棋后,DeepMind为什么把星际争霸当成了下个目标318 / 作者:UFO爱好者 / 帖子ID:86625


DeepMind的最终目标仍然是创造一台可以像人类那样玩星际争霸的电脑,仅仅通过获取屏幕上的信息并利用键盘和鼠标来完成操作。但是在短期内,利用简化视觉效果来教会他们的系统对DeepMind来说更为容易,即将地图图形和迷你地图转化为低像素的图像,并将各种特征分解成不同的图层,以清晰地显示出地形高度、单位类型和血量等各种信息。

这项合作是双赢的,暴雪希望通过这些新发现改进自己的游戏。“是否能有一个游戏世界可以具有更为复杂,甚至可以为玩家量身定制的AI?”星际争霸II的执行制作人,暴雪的Chris Sigaty说道。“我们能根据我们教导AI的方式来教导玩家吗?这将意味着什么?我们这边有很多猜测,但我们相信它将有助于改善游戏。”

但DeepMind的目标不仅仅是改进视频游戏。Vinyals说,工作室的最终目标是使用AI来解决现实世界的问题, 很自然地星际争霸II就是它的下一步。完整信息的缺乏,现实的(狭义的“现实”)视觉,开发记忆的需求,甚至是某种想象能力,都是AI尝试理解现实世界的重要技能。他说,比起现实世界,游戏是一种更好的了解现实世界的方法。“你可以快速运行游戏,它们有明确的得分,或者输赢。而且也有其他人认为,学习和掌握游戏对人类来说也是个有趣挑战,他们对游戏做出了许多优化。”

当DeepMind将注意力转向围棋时,它一年内打败了最好的AI玩家,并且在两年内打败了最好的人类玩家。但Vinyals和Sigaty都不确定AI需要多长时间来掌握星际争霸II。“从研究的角度来看,我们可能会取得很大的进步,但我认为我们现在还不知道我们能否击败最好的玩家,”Vinyals说。

Sigaty则表现得更有信心。 “我相信我们的职业玩家, 他们表现总是令人赞叹”。

翻译:张光辉  陈璟仪

原文链接:https://www.theguardian.com/technology/2016/nov/04/starcraft-ii-deepmind-game-ai
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

手机版|UFO中文网

GMT+8, 2024-12-26 09:17

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表