《王者荣耀》KPL人气电竞选手VS绝悟AI,腾讯的醉翁之意是? - 周到

《王者荣耀》KPL人气电竞选手VS绝悟AI,腾讯的醉翁之意是?


作者:苗夏丽
编辑:苗夏丽
时间:2021-07-08 17:14:46

2021世界人工智能大会期间,手游《王者荣耀》进行了一场特殊的比赛:AI技术和KPL人气电竞选手对决。

这里的AI技术,其实是腾讯AI Lab与王者荣耀的联合产品“王者绝悟” 。

“这是腾讯第一次尝试在这样的大型展会中做这样的电竞选手和机器AI这样的对抗,起名叫‘绝悟’,因为腾讯之前有一个类似于AlphaDog这样的产品,我们叫‘绝艺’,现在也是中国国家围棋队官方指定的训练AI。”腾讯公司副总裁、腾讯华东总部总经理张立军接受采访时说。

据了解,此次亮相的“王者绝悟”是掌握游戏中全部100多个英雄玩法的“完全体”版本。精通王者荣耀这款多人在线战术竞技游戏,“王者绝悟”背后是天文数字级的计算量:

在王者荣耀对局中,AI的动作状态空间远远大于围棋及其他简单游戏,甚至超过整个宇宙的原子总数(10的80次方)。如此庞大的运算空间里,要做高效准确的决策,对算法的挑战巨大。

张立军说,在整个人工智能的发展过程中,从Deep Blue深蓝一直到AlphaDog,乃至发展到腾讯后来的绝艺到现在的“绝悟”,这个过程中也是涉及到AI整个领域技术发展越来越深化,越来越深入到从单一的这样的一些比较简单的博弈到多智能体博弈。

“游戏场景尤其像《王者荣耀》这样的多人对抗高复杂度、高挑战性、强协作性等等特征的游戏产品中,如何让高水平的AI算法在这样的场景中应用是很重要的一点,我们是希望这样的产品可以带动整个行业,在这个算法研究方面的一个深入,更多地其实是一个技术方面的探讨和研究的需要。”

据介绍,绝悟AI背后的技术,主要涉及监督学习和强化学习两大领域。监督学习通过海量有标记的训练数据为基础,推导出行为预测函数。

这个方法的优点在于能够模拟不同级别的目标行为,做到很好的拟人化;缺点在于过度依赖于数据,特别是标注数据的质量。强化学习通过构建奖励和惩罚刺激环境的角度出发,优化AI行为逻辑。这个方法的优点在于不依赖已有数据并且能够探索出新的策略。

张立军说,实际上,通过《王者荣耀》国民级的影响力,我们希望借此推动和普及AI研究相关的成果和走到真正的产品和落地中去,也可以希望在这个过程中有各种的一些新的技术突出可以反哺整个游戏行业的健康发展和深入的发展。

2021世界人工智能大会开幕式上,马化腾强调,人类对AI的未知,仍然大于已知。追求“科技向善”,就要推动“AI向善”,让AI技术实现“可知、可控、可用、可靠”。他表示,我们善用AI的智慧,必须胜过日益强大的AI技术。这也是为什么腾讯今年要把“可持续社会价值创新”纳入公司的核心战略。“我们希望用‘向善’这个方向,来牵引整个公司的技术创新和业务发展,一步一个脚印地实现‘科技向善’。”

此外,腾讯参展2021世界人工智能大会,也呈现了多项AI技术,从AI游戏、AI泛娱乐、AI可持续、AI加速器、AI政务+云AI以及微信AI方面展示最新AI应用成果。


来源:周到