“阿法星”在“星际争霸”中比肩顶尖人类玩家,多主体增强算法未来将大展身手

2019-11-01信息快讯网

“阿法星”在“星际争霸”中比肩顶尖人类玩家,多主体增强算法未来将大展身手-信息快讯网

▲“阿法星”的训练设置。图片来源:《自然》网站

著名的人工智能公司英国“深度思维”(DeepMind)最新推出了一款主体增强学习算法“阿法星”(AlphaStar)。目前,这款人工智能程序已进入战略游戏《星际争霸II》前0.2%排名的人类玩家之列。根据英国《自然》杂志30日发表的一篇论文,该算法代表了机器学习的一大重要成就,经过改造,将有助于解决其他应用领域的复杂问题。

《星际争霸II》游戏已经成为人工智能研究领域的一项巨大挑战。据介绍,这是一款科幻主题的策略游戏,有全球性的专业比赛,也是全球最赚钱的专业电子竞技之一。该游戏中有三个特征和能力截然不同的种族,玩家控制其中一个种族,相互对抗。

而在之前的比赛中,即使简化了游戏规则,人工编制特定动作序列或依赖超人类的功能(如每分钟执行上万次动作),人工智能体也无法与顶尖人类玩家抗衡。

此次,“深度思维”公司奥里奥·维亚尔斯及同事,展现了最新的多主体增强学习算法——“阿法星”。在该算法中,若干深度神经网络主体相互竞争,生成大量的持续适应性策略和对策。之后,“阿法星”在一系列在线游戏中与人类玩家比赛,无论玩《星际争霸II》的哪一个种族,“阿法星”都达到了大师级水平。这标志着人工智能体首次在没有简化游戏的情况下,在专业电子竞技中达到了顶尖人类玩家的水平。

“深度思维”公司2016年凭借“阿法狗”程序与人类围棋世界冠军之战大获全胜而成名;其后该程序升级为“阿法元”(AlphaGo Zero),能够从空白状态起,不需要任何人类棋谱输入的条件下自学围棋;下一代“阿法零”(AlphaZero)则接连击败了国际象棋、将棋、围棋三个世界冠军级的电脑程序,成了全能棋王。随后,公司宣布这一程序不再主攻棋法,而是“投身”医疗、能源以及新材料等领域。

作者:张梦然

编辑:储舒婷
责任编辑:顾军

来源:科技日报、光明网

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。

多图直击 | 油罐迎来“硬核”杂技玩家的中国首秀,60分钟里你会惊叫几次?
多图直击 | 油罐迎来“硬核”杂技玩家的中国首秀,60分钟里你会惊叫几次?
国家林草局公园办:2025年建成以国家公园为主体自然保护地体系
2019年度“吴文俊人工智能科技进步奖”颁发:AI算法+芯片成为行业新亮点,两家上海企业上榜
豆瓣评分9.0!纪录片《长江之恋》展现人类对于哺育文明的大江大河的新态度
“慧眼”卫星发布一批新成果:为人类理解黑洞和中子星系统提供新线索
杨剑等:人类世到来,复合系统的全球治理能否应对?|嘉宾新著先睹㊸
与诺奖得主威廉·凯林面对面!人类最强大脑集结第二届世界顶尖科学家论坛!
“我从哪里来?”科学家找到现代人类祖先的家园,为理解人类演化补充“时空背景”
徐悲鸿“求而不得”的这幅画将首度公开亮相!最高水准法国学院派艺术在上博展出
《少年的你》票房过八亿,易烊千玺从“流量的你”到“演员的你”
进博·主宾国 | 2000年前的秘鲁纳斯卡地画,人类至今还“一头雾水”
中外嘉宾将聚首探讨“70年中国发展与人类命运共同体”
中国将推动人类命运共同体的理念,徐徐铺展,与全球深情互动| 虹桥国际经济论坛
“敦煌女儿”樊锦诗:莫高窟里藏着人类命运共同体的密码 | 虹桥国际经济论坛
满减算法直逼“奥数”,她选择了这么做……
集高速公路、普通公路、城际铁路“三位一体” 常泰长江大桥主体工程开工
二次元玩家的福利!WePlay游戏文化展登陆普陀,电竞玩家有了强力支持!
©2014-2024 dbsqp.com