▲MaNa 正在聚精会神比赛
DeepMind 在演示中介绍,双方的比赛固定在 Catalyst LE 地图,采用 4.6.2 游戏版本,而且只能进行神族内战,双方将进行 5 场比赛。首先接受邀请的是 Liquid 战队的虫族选手 TLO,目前世界排名 68。
“深层思维”公司联合研发负责人戴维·西尔弗在比赛后指出:“尽管后续还有很多工作要做,但是我希望未来人们在回望今天时,会把这一比赛结果当成人工智能系统的能力又向前迈了一步的表现。”
据介绍,与围棋棋盘上所有棋子都对双方可见不同,此类游戏中有“战争迷雾”,一方需要猜测和侦察对方的行动,属于“不完美信息博弈”,并且要求人工智能必须实时做出反应,这对人工智能的要求更高。
“深层思维”公司表示,在“阿尔法星”之前,还没有任何人工智能系统能够在《星际争霸2》中能与人类职业选手的技巧比拟。而“阿尔法星”能够在这场“人机大战”中大比分胜出的一个重要基础,就是它使用了深度神经网络,研究人员通过监督学习和强化学习的方式,直接利用游戏的原始数据来训练,以模仿学习的思路,让模型快速学到高水平人类玩家在游戏中使用的策略和操作。
此外,《星际争霸2》等游戏中有一个“手速”的概念,用APM(每分钟操作指令数)来衡量。在基准测试中,“阿尔法星”每分钟能够执行约280个操作指令,虽然远低于人类职业选手,但是其动作更精确,也有助于在比赛中取得胜利。
下赢围棋、打赢电脑游戏,这都能给人工智能的发展带来什么呢?“深层思维”的研究团队认为,训练“阿尔法星”的先进方法以及算法的先进架构未来都会有助研究人员积累更多经验,最终设计出能够应对现实生活中不少复杂问题的人工智能程序,比如天气预测、气候模型计算以及语言理解等。
编辑:沈湫莎
责任编辑:张鹏
来源:新华网、人民日报