为什么AI麻将比围棋、象棋更难?打麻将,隐藏信息的空间更大!


作者:卢忆北 苗夏丽
编辑:卢忆北
时间:2019-09-01 13:59

“我看网上大家的评论为什么麻将比围棋难,你今天听了我的演讲可以跟你爸爸妈妈解释一下。”微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋说,打麻将,隐藏空间变的非常大!

在 2019 世界人工智能大会期间的AI FOR ALL"二十一世纪的计算"学术研讨会上,沈向洋详解了为什么AI麻将比跳棋、围棋、象棋做起来更难。

从 AlphaGo、深蓝、AlphaZero 到 Pluribus ,AI 系统已经会下象棋、下围棋、打扑克。微软做的这款能打麻将的AI Suphx ,到底有什么不同之处?

图/Suphx 以“大三元”役满胡牌

AI打麻将,比下棋难多了

2019 世界人工智能大会期间,沈向洋公开称,由微软亚洲研究院研发的麻将 AI 系统 Suphx ,在日本专业麻将平台“天凤”上荣升十段。这是麻将领域中,AI 系统目前创造的最好成绩,其实力超越该平台公开房间顶级人类选手的平均水平。”

与象棋、围棋等棋类游戏相比,麻将在对弈过程中,存在大量隐藏信息,具有高度的不确定性。因此,麻将的复杂度远高于其他棋类,对AI技术有着特殊挑战。

“打麻将,第一是海量的隐藏信息。微软的做法是做‘先知教练’,可以看到所有牌打的时候应该是什么样,而你打的时候是没有看到的,但有一个先知教练可以看到的,这个可以当训练数据。”沈向洋说,其次,还有复杂的奖励机制,因为打牌时不见得每一副都要赢,还有胡大一点还是胡小一点等等。这样可以用全盘预测的方式,当然还有一个是巨大的状态空间,所以还有自适应的决策,再加上深度强化学习,把所有的东西串起来。”

Suphx 在天凤的公开房间“特上房”,与人类选手进行超过 5000 场对战后,获得“特上房”最高段位十段。研发团队表示,游戏中,Suphx 表现出了类人的直觉、预测、推理、模糊决策能力,以及大局观意识

图/微软麻将游戏的挑战以及 Suphx 的核心技术

据了解,天凤是一家创立于 2006 年的线上麻将平台。它有着完善的规则、专业的段位升级系统。目前,天凤在全球有近33万名麻将玩家,其中不乏有大量专业选手。

天凤平台上有两种竞技房间:一种为“特上房”,为四段以上所有玩家免费开放,该房间能达到的最高段位是十段;一种为“凤凰房”,专为七段以上的人类付费玩家开放(不允许 AI 参与),该房间能达到的最高段位为十一段——“天凤位”。

官方数据显示,天凤平台自上线13年以来,全平台曾经达到“天凤位”的高手仅 13 人,达到十段的选手约有 180 位,现役的十段人类选手也仅有十几位。

图/麻将平台“天凤”

尽管目前Suphx 还没有和天凤级选手对决过,但一位天凤级麻将玩家朝仓康心在社交媒体上表示,自己看了 Suphx 的比赛,它看起来很强大,似乎能轻而易举地战胜人类。

麻将AI,厉害在于能寻找隐藏信息

游戏一直是人工智能研究的最佳试验田,训练游戏 AI 的过程,可以不断提升人工智能的算法,以及人工智能处理复杂问题的能力。麻将 AI 系统 Suphx 的技术突破,对于探索及扩展人工智能算法的边界是非常有益的尝试。

对此,微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士解释道:

针对非完美信息游戏——麻将,AI系统的基本思路是,在自我博弈的训练阶段,利用不可见的隐藏信息,引导AI模型的训练方向。AI的学习路径清晰后,当它接近完美信息意义下的最优路径后,AI模型就能更深入地理解可见信息,从而找到有效决策依据。这就好像AI可以看到其他人的牌,但不是作弊。

图/微软亚洲研究院院长洪小文博士

作为老少咸宜的“国粹”,麻将所运用的推理、决策能力,与人类真实且复杂的生活十分贴近。因此,研究麻将 AI 系统,对提升 AI 在现实环境中解决复杂问题的能力,的确具有重要意义。

游戏,无形中训练了 AI,也为 AI 提供了一个与人类“交流”的绝佳机会。可以预见,未来,AI会以意想不到的方式,融入我们的生活。

麻将AI的研究员,竟然不会打麻将

距离麻将AI取得十段的好成绩,已过去两个月。

当被问及接下来微软的麻将 AI 会落地什么应用场景时,洪小文也坦言,“研究成果太新,所以目前还没有,不过有计划,特别是对于此次突破中使用的强化学习技术

简言之,当我们每做一个动作,都会影响到最后的结果。每做错一次,下次再做时,便会加权少做这件事。这就是强化学习。”

图/微软亚洲研究院院长洪小文博士

“麻将AI也一样,这有一点像人类,一件事情做决定后,结果是吃亏了,或者得了益处,就知道下一次如何做了,”洪小文接着说道。

其实,麻将 AI 项目,在微软内部是如何孵化出来的,一直是个“谜”。据说,微软做此研究的研究员并不会打麻将,还现学了日本麻将的规则(连日语都不会)。

在麻将 AI 上,作为微软亚洲研究院院长的洪小文,似乎更多是带着对科学的热诚与信仰来看这件事。他说:“治理研究院,很特别。人是有自己的想法,你不能控制他,所以要信任他,要给他空间,这样才会有创新。做研究时,研究员八成是没有想过未来如何应用。但正是这种好奇心驱动,才推动了整个科研的发展。”

同时,沈向洋也表示,人工智能跟以前很多技术创新不太一样。以前,很多技术创新只是体力的延伸,人工智能的创新是脑力的延伸,所以大家会很担心。不过,微软很早开始思考这个问题,在2016年的时候发布了微软人工智能的6条准则:第一条是公平,第二条是可靠和安全,第三条是隐私和保障,第四条是包容,第五条是透明,第六条是责任。沈向洋说,希望未来微软每个人工智能的产品都能够通过人工智能相关的道德伦理的审查,微软也在推动,特别是和政府,相关的法律法规的一些讨论。


来源:周到