网站首页
手机版

麻省理工学院最新研发桌游AI,击败人类高手,胜率突破平均水准

更新时间:2026 01 20 11:02:18作者:佚名

麻省理工学院最新研发桌游AI,击败人类高手,胜率突破平均水准

大家好,如果您还对麻省理工学院最新研发桌游AI,击败人类高手,胜率突破平均水准不太了解,没有关系,今天就由本站为大家分享麻省理工学院最新研发桌游AI,击败人类高手,胜率突破平均水准的知识,包括的问题都会给大家分析到,还望可以解决大家的问题,下面我们就开始吧!

在4000 多场比赛中,DeepRole 取得了比人类玩家更好的平均胜率,无论派系如何,也无论队友是人工智能还是人类。并且统计显示,如果用AI替代人类玩家,阵营的胜率最多可以提升12%。虽然被替换的玩家的游戏水平未知,但超过10%的稳定胜率提升表明AI的表现已经超过了普通玩家。

这项研究是一个更广泛项目的一部分,旨在更好地模拟人类如何根据社会反应做出决策,帮助开发能够更好地理解人类、向人类学习并与人类合作的机器人。

麻省理工学院的研究团队将在下个月的神经信息处理系统会议(NeurIPS)上进一步展示DeepRole。目前的研究成果已作为预印本发表在Arxiv上。

“阿瓦隆”的游戏规则

桌游《阿瓦隆》的全称是《抵抗组织:阿瓦隆(The Resistance: Avalon)》,与《狼人》类似。一场游戏由5-10人组成,每个人都有一张身份证、一张成功票和一张失败票。每个人都分为两个对立的阵营:抵抗组织和间谍。前者希望任务成功,后者希望任务失败。

每场比赛共有5轮任务。玩家轮流担任队长,负责指派3-5人行使投票权,决定本轮任务的成败。只要有一张失败票,任务就被视为失败。

游戏的核心角色是来自抵抗阵营的“梅林”和来自间谍阵营的“刺客”。 “梅林”知道间谍是谁,所以他可以阻止他们执行任务,以确保100%成功,但他不能做得太明显。向间谍阵营暴露自己的身份将会导致“刺客”的暗杀。

抵抗阵营的玩家只有在执行任务时才能投票成功。获胜条件是三轮任务成功。间谍阵营的玩家可以根据情况投票决定失败或成功(隐藏身份)。获胜条件是三轮任务失败或完成刺杀“梅林”(正确找出“梅林”是谁)。

这是一款明显的信息不对称游戏,考验玩家在短时间内收集信息并分析推理的能力。

对于AI来说,玩好这类游戏最困难的部分是如何区分阵营,尤其是当玩家刻意隐藏身份来找出谁是队友、谁是对手时。

研究小组成员马克斯·克莱曼-韦纳(Max Kleiman-Weiner) 表示:“人类向他人学习并与他人合作,使我们能够共同实现一个人无法单独完成的事情。” “像《阿瓦隆》这样的游戏可以更好地模仿人们独处时的行为。在我们日常生活中经历的动态社交环境中,无论是在幼儿园还是在工作场所,我们必须弄清楚我们可以与谁一起工作。”

出于概念验证的原因,

DeepRole 的设计原理

研究团队稍微简化了游戏。 DeepRole仅限于5人游戏,因为具有特殊能力的角色会随着人数的增加而增加,使得游戏的不确定性和复杂性明显增加。上升了,但其他规则没有改变。

在开发DeepRole 的过程中,研究人员使用了常见的“反事实遗憾最小化(CFR)”游戏规划算法,通过与自己反复对弈来学习游戏,同时还引入了演绎推理。技术,使其能够从现有的假设或前提中推断出新的结论。例如,如果人工智能在一项任务中看到一张失败的票证,它就可以推断出至少有一名间谍。

在游戏中,CFR主动创建一棵由线和节点组成的“游戏决策树”,它集成了每个玩家在每个未来决策点可能采取的所有可能动作,以描述每个玩家可能采取的行动。

在运行数十亿次游戏模拟时,CFR 会关注哪些举动会增加或减少获胜的机会,迭代修改其策略以包含更多好的决策,并最终选择最佳解决方案。

虽然《阿瓦隆》的游戏规则相对于围棋或扑克来说并不复杂,但因为每轮任务都可以选择几个不同的人,并且可以通过集体投票的方式最多否决队长的提案五次,所以在一场游戏中,状态空间包含10^56组不同的信息,甚至超过了国际象棋的状态空间(10^47)。

为了减小决策树的大小并优化寻找最优解决方案的过程,研究团队还开发了一个与CFR结合使用的价值网络。

在训练过程中,DeepRole并没有依赖人类玩家的任何数据,只是扮演两个阵营的角色“互相对战”。它使用决策树来预测每个玩家将做什么。每个分支代表玩家的不同策略,树上的每个节点都有一个相应的值,这是AI选择该策略的估计收益。

理论上,一个分支的整体价值越高,对应阵营获胜的概率就越大。

在游戏的任务执行阶段,DeepRole会利用决策树中的选择来比较每个玩家基于自己阵营的真实选择。如果玩家做出的选择与AI的预期不同,那么该玩家很可能站在对方一边。随着游戏的进行,它会积累更多的数据,更准确地确定玩家的身份。最终,这些概率信息被用来更新人工智能的策略,以增加其获胜的机会。

同时,人工智能还使用相同的技术来估计第三人称观察者将如何看待自己的行为。这有助于衡量其他玩家的反应,让您做出更明智的决定。

“如果两人任务失败,可以合理地假设至少有一名间谍参与其中。人工智能将来很可能不会让两人执行同一个任务,因为它知道其他抵抗组织玩家会感受到这一点这个提议太糟糕了,”该论文的主要作者杰克·塞里诺(Jack Serrino)解释道。他也是一位狂热的《阿瓦隆》游戏爱好者。

玩法高端,胜率不俗,还不用沟通

在真实测试中,从未与人类练习过的DeepRole 表现良好。

在玩家上传的视频中,AI扮演的“梅林”甚至会玩高端:人类玩家后期判断哪三个人是好人(抵抗组织),所以派这三个人去表演任务。尽管知道这三人执行任务是绝对安全的,但他们仍然不断否决这些提议,以迷惑间谍的判断,让他们无法辨别“梅林”是谁,最终成功避免了被被暗杀。

4000多场比赛的统计显示,在一场5人玩家的比赛中,如果其中一人被AI替换,他所在队伍的平均胜率将比替换前提高12%左右。另一方面,在一场有5个AI的游戏中,如果其中一个被人类玩家取代,他所在阵营的平均胜率会下降8%左右。

虽然不同级别的玩家没有统一的衡量标准,但超过10%的胜率差距确实体现了DeepRole的不俗表现。

值得一提的是,DeepRole在游戏过程中不与其他玩家交流,依然能够取得不错的成绩。一般来说,沟通是《阿瓦隆》等桌游的关键组成部分。在游戏中,人类玩家可以通过游戏平台上的文本框相互交流。

“但事实证明,人工智能只需观察玩家行为就能够与其他人很好地合作。这很有趣,因为人们倾向于认为这样的游戏需要复杂的沟通策略,”克莱曼-韦纳说。

接下来,研究团队将尝试让DeepRole 使用简单的文字进行交流,比如给出自己对玩家阵营的看法。 —— 该信息已经以概率的形式存在于AI 的决策树中,但需要与正确的概率进行配对。单词。

此外,他们还希望DeepRole学习强调沟通、社交和推理的“狼人”。这对沟通能力提出了更高的要求,因为它需要学习如何争论和说服其他玩家,并且涉及的推理因素也更加复杂。

“在这样的游戏中,有很多障碍需要克服,但沟通绝对是最关键的因素,”塞里诺强调。

好了,文章到这里就结束啦,如果本次分享的麻省理工学院最新研发桌游AI,击败人类高手,胜率突破平均水准和问题对您有所帮助,还望关注下本站哦!

相关问答

问:麻省理工的新AI可以玩桌游戏吗?
2个回答
暖栀

答: 是的,麻省理工学院的研究人员开发出了一款新的人工智能,能够玩各种桌面游戏,包括扑克和围棋。 这套系统被称为“AGENT”,它利用机器学习方法来分析游戏规则、对手行为和自身局势,从而制定出最有利的策略。 在多个游戏中,AGENT 已经展现出了超越人类玩家的胜率。

203 人赞同了该回答

非想

答: 这款AI不仅能够玩游戏,更重要的是,其学习能力非常强大。它可以根据每一次比赛的结果进行调整,不断改进自身的策略。 这意味着AGENT 可以随着时间的推移越来越聪明,并最终成为不可战胜的棋手或牌手。

299 人赞同了该回答

问:为什么这个AI能赢过人类玩家?
2个回答
此刻不是了i

答: 主要是因为 AGENT 使用的是一种叫做“强化学习”的机器学习算法。简单来说,强化学习就像是一个孩子在玩游戏一样:它会尝试不同的策略,如果结果比较好,就会记住那个策略;如果结果不好,就会放弃那个策略,寻找更好的路线。通过不断的试错和修正,最终找到最有效的策略来战胜对手。

289 人赞同了该回答

ok绷遮不住我颓废的伤あ

答: 另外,AGENT 还能够分析大量的数据,从过去的比赛中总结经验教训,并将其运用到未来的游戏中。这使得它在决策上更加果断,并且能够预测对手的行为,从而预判局势的发展,避免掉败局。

242 人赞同了该回答

问:麻省理工的新AI技术会不会影响人类吗?
2个回答
莫阑珊

答: 这种技术既有光明的一面也有担忧的地方。一方面,它可以帮助我们提高游戏智能,解决一些复杂的问题,甚至在医疗、金融等领域发挥作用。 另一方面,如果 AI 技术发展过于迅速,可能会导致人类在某些领域失去优势,甚至引发一些伦理争论。

19 人赞同了该回答

微信名字

答: 因此,我们需要谨慎地看待和发展人工智能技术,确保其能够为人类社会带来更多益处,同时也要关注其潜在的风险,制定相应的措施来避免负面影响。

64 人赞同了该回答

为您推荐

英国四所高校新申请季放宽入学要求,非211/985学生亦可申请

这两年英国留学特别火爆,很多名校的申请门槛被一再提及。为了进入梦想的学校,国际学生必须“卷起”,刷分数,修改论文,争取优秀。但现在,英国大学终于想通了,准备降低

2024-12-01 19:43

留学移民新西兰,哪个专业更容易获得身份?如何获得新西兰PR?

教育尤其是幼儿教育,是新西兰长期紧缺的专业。但幼儿教育要求雅思4项7分,门槛比较高。如果您想移民新西兰接受幼儿教育和中学教育,您的英语口语能力必须良好。关心该专

2024-11-29 14:49

澳洲抗疫政策下,护理职业如何成为移民邀请热门话题?

在这样的大环境下,移民局作为联邦政府的核心机构之一,始终以明确的政策引导支持澳大利亚社会的正常运转。最明显的例子就是:始终将护理专业作为移民邀请的首选考虑。相信

2024-11-27 09:58

马来西亚留学归国,“海归”就业现状揭秘

“考研”期间的学习压力可想而知。有的学生为了考上目标院校,不惜奋战两三次。通过“公考”笔试后,会有面试,但在一个只招一个人的职位上,如果你的笔试成绩没有进入前两

2024-11-24 18:07

中国观众集体转向:曾经风靡一时的韩流,为何逐渐失去吸引力?

2月19日,在韩国一档名为《闲着干嘛呢》的综艺节目中,韩国艺人刘在石表达了对韩国选手黄大贤在刚刚结束的冬奥会男子1000米短道速滑决赛中受到处罚的反应。为了表达

2024-11-22 13:16

2018年韩国高校本科学费全面盘点

私立大学(1学期)人文专业:20,000元至22,000元工程专业:人民币25,000元至人民币27,000元艺术体育专业:3万元以上私立大学的奖学金相对丰厚。

2024-11-20 08:25