打游戏也输了!新款“阿尔法”击败人类玩家

(记者张家伟)继围棋“人机大战”成功击败人类顶尖围棋高手后,谷歌旗下的人工智能技术公司“深层思维”的人工智能程序“阿尔法星”,与人类职业选手在经典即时战略电脑游戏《星际争霸2》对战中,取得压倒性胜利。

打游戏也输了!新款“阿尔法”击败人类玩家

来源:科技日报    2019-01-28 08:30
来源: 科技日报
2019-01-28 08:30 
分享
分享到
分享到微信

原标题:打游戏也输了!新款“阿尔法”击败人类玩家

新华社讯 (记者张家伟)继围棋“人机大战”成功击败人类顶尖围棋高手后,谷歌旗下的人工智能技术公司“深层思维”的人工智能程序“阿尔法星”,与人类职业选手在经典即时战略电脑游戏《星际争霸2》对战中,取得压倒性胜利。

据“深层思维”公司介绍,自去年12月以来,该公司开发的“阿尔法星”人工智能程序与高水平人类职业选手先后举行了11场比赛。在这一系列“人机大战”中,人工智能程序最终以10比1击败人类选手。只有在1月24日举行的现场比赛中,“阿尔法星”由于游戏视角受限,人类选手才勉强赢下一场。

“深层思维”公司联合研发负责人戴维·西尔弗在比赛后指出:“尽管后续还有很多工作要做,但是我希望未来人们在回望今天时,会把这一比赛结果当成人工智能系统的能力又向前迈了一步的表现。”

据介绍,与围棋棋盘上所有棋子都对双方可见不同,此类游戏中有“战争迷雾”,一方需要猜测和侦察对方的行动,属于“不完美信息博弈”,并且要求人工智能必须实时做出反应,这对人工智能的要求更高。

“深层思维”公司表示,在“阿尔法星”之前,还没有任何人工智能系统能够在《星际争霸2》中能与人类职业选手的技巧比拟。而“阿尔法星”能够在这场“人机大战”中大比分胜出的一个重要基础,就是它使用了深度神经网络,研究人员通过监督学习和强化学习的方式,直接利用游戏的原始数据来训练,以模仿学习的思路,让模型快速学到高水平人类玩家在游戏中使用的策略和操作。

此外,《星际争霸2》等游戏中有一个“手速”的概念,用APM(每分钟操作指令数)来衡量。在基准测试中,“阿尔法星”每分钟能够执行约280个操作指令,虽然远低于人类职业选手,但是其动作更精确,也有助于在比赛中取得胜利。

下赢围棋、打赢电脑游戏,这都能给人工智能的发展带来什么呢?“深层思维”的研究团队认为,训练“阿尔法星”的先进方法以及算法的先进架构未来都会有助研究人员积累更多经验,最终设计出能够应对现实生活中不少复杂问题的人工智能程序,比如天气预测、气候模型计算以及语言理解等。

(张家伟)

【责任编辑:张瑨瑄】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn