人工智能游戏程序打击了所有人而不是人

在复杂的游戏中击败我们不满意,计算机现在想要贬低我们。去年,Cosmos报道了AlphaGo Zero的开发,这个程序可以让我们在没有任何训练的情况下将我们带到极其艰难的Go游戏中的清洁工(因此“零”位)。它制定了战略本身。

AlphaGo Zero向我们展示了它的潜力,它的前身已经有100%甚至没有了,它受益于人类的投入,毫不奇怪,这被誉为人工智能研究的里程碑。值得一读的是Cathal O'Connell的原始报告。

然而,现在,开发者,英国的DeepMind,随着AlphaZero的发布再次提高了赌注(注意这次“Go”位丢失了),这可以在任意数量的游戏中做同样的事情。

它可以通过反复对抗自身来学习围棋,国际象棋和棋子(日本国际象棋),直到每个人都掌握,并且根据开发人员大卫·西尔弗,在几个小时内可以击败创建的最先进的人工智能程序专注于其中一个游戏。

在一篇发表在“ 科学 ”杂志上的论文中,Silver及其同事相当随意地建议他们“推广”AlphaGo Zero方法来创建一个在许多具有挑战性的游戏中“可以达到超人性能”的算法。

“AlphaZero用深度神经网络,通用强化学习算法和通用树搜索算法取代了传统游戏程序中使用的手工知识和领域特定增强,”他们报告说。

新程序使用与其前身相同的网络架构,但必须考虑到游戏之间的一些重要差异。例如,与Go不同,你可以在国际象棋和棋牌中进行抽牌,规则取决于位置。

AlphaZero也不能假设对称性,因为国际象棋和棋子不是对称的 - 例如,棋子只向前移动,而且在王翼和后翼上的铸造是不同的。

然而,开发人员似乎已经采取了这一步骤。

他们报告说,AlphaZero实际上每秒搜索的位置明显少于它在竞争中肆虐的游戏专用程序,通常通过使用其深度神经网络更有选择性地集中于最有希望的变化来补偿。

这是一种人类的事情 - 这就提出了一个问题,即我们如何以及在哪里可以保持一些优势。

已经注意到,虽然国际象棋,将棋和围棋都非常复杂,但是许多特征使得人工智能系统更容易掌握:特别是,做出决定所需的所有信息对于玩家来说都是可见的。

是时候给他们一些非常难玩的东西了。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。