由于游戏中每个人无法看到对手手里的牌,这要求参与者具备更复杂的推理能力,不仅要看对手打了什么牌,还要猜测对手手里有什么牌,并根据对手行动暗示出的信息,来计算自己的最优出牌法。这给 AI 带来了更严峻的挑战。AI 不仅要学会根据不完全信息进行复杂决策,还要应付对手的虚张声势、故意示弱等招数。游戏的人数的也将改变 AI 的应对难度。
实验中使用的扑克游戏界面。图片来源:Facebook
在所有双人游戏里,“表现过人”的 AI 都是通过近似纳什均衡实现的。在纳什均衡里,只要另一位玩家的策略保持不变,任何人都不能从改变策略中获益。虽然 AI 的策略只能保证比赛结果不比平局更差,但如果 AI 的对手犯了错误而无法维持均衡时,AI 将取得胜利。