第9部分(第3/4 页)
理论上而言,象棋是一个理想的可以通过倒后推理加以解决的序贯行动博弈。13在这个博弈中:参与者交替行动;参与者之前的所有行动都是可观察且无法撤销的;局势和参与者动机没有不确定性。如果相同的局势重复出现,比赛就算平局,这一规则确保比赛能在有限次行动后结束。我们可以从最末端那个决策点(或者终点)开始倒后推理。然而,理论和实践完全是两码事。据估计,象棋中的决策点总共大约有10120个,也就是1后面加120个零。一台比普通计算机速度快1 000倍的超级计算机,也需要10103年才能把这些决策点全部考察完。等待是徒劳的;即便是可以预见的计算机改进,也不可能对这有太大的帮助。而与此同时,象棋选手和电脑象棋程序员都做了什么?
临近比赛结束之际,象棋大师在刻画最优策略方面一直做得非常成功。一旦棋盘上只剩下很少几个棋子,大师级选手就能展望博弈的结局,然后通过倒后推理来判断一方是否一定取胜,或者另一方能否确保打成平局。但在博弈中盘阶段,当棋盘上还有好些棋子的时候,预测局势就困难得多了。向前展望十步,这与象棋大师们在适当的时间内所能展望的步数差不多,也不可能使局势简化到可以使当时的局势直到终局都得到完全解决。
实用性的方法是将展望分析和价值判断相结合。前者属于博弈论科学——向前展望,倒后推理。后者属于象棋艺术,能够根据棋子的数目和棋子之间的相互联系判断出所处局面的价值,而无须从某个决策点开始向前展望,明确找出这个博弈的解决方法。象棋选手们通常把这称为“知识”,但你也可以把它称为经验、本能或者艺术。我们通常可以根据象棋选手掌握“知识”的深度和精度,来识别出谁是最佳的象棋选手。
我们可以通过对大量的象棋博弈和象棋选手进行观察,提炼“知识”,然后总结出规律。对此的大部分研究都集中在开局,即棋局刚走了10步或者15步时。有很多书籍对不同的开局进行了分析和比较,讨论了它们的优缺点。
计算机是怎样做到这一点的?编制电脑象棋程序曾经被认为是新兴人工智能科学的组成部分;它的目的是为了设计出能像人类一样思考的计算机。可惜研究了很多年都没能成功。后来,人们的注意力开始转向利用计算机做它们最擅长的事情——数字运算。计算机可以向前多展望几步,而且展望得比人类更快。�到20世纪90年代末,像菲兹(Fritz)和深蓝(Deep Blue)这样的象棋电脑,已经可以利用纯粹的数字运算,与人类最优秀的象棋选手进行较量了。再后来,一些中盘局面的知识也被编入电脑程序,这些知识是由一些最优秀的人类棋手所传授的。txt电子书分享平台
公平和利他主义的演化(3)
�但是,优秀的象棋选手可以利用他们掌握的知识,立即区分出哪步棋不该走,而不需要向前展望四五步棋来预测其结果,这样他们就省下了推理哪步棋比较好的时间和精力。人类棋手的等级是根据他们的业绩评定的;最高等级的电脑已经达到了相当于2800等级分的级别,这相当于世界最强的象棋大师加里·卡斯帕罗夫(Garry Kasparov)的水平。2003年11月,卡斯帕罗夫与最新版的菲兹电脑X3D进行了一场四轮赛。结果是双方各胜一局,打平两局。2005年7月,Hydra象棋电脑在一场六轮赛中,以五胜一平的成绩打败了世界排名第13位的迈克尔·亚当斯(Michael Adams)。估计在不久的将来,电脑可能会成为顶级高手,然后它们之间开始相互较量,争夺世界象棋冠军。
大家将从中学到什么呢?它说明了考虑复杂博弈的方法,这些复杂博弈是大家可能会面临的。你应该在你的最大推理范围内,把向前展望、倒后推理的规则和引导你判断中盘局面价值的经验结合起来。成功源于对博弈论科学和具体的博弈艺术的综合,而不是来自它们其中之一。
一心二用
象棋策略说明了向前展望、倒后推理方法的另一个实用性特征:你必须从参与者双方的角度来进行博弈。虽然根据复杂的博弈树来估计自己的最佳行动比较困难,但预测对方的行动比这还要困难得多。
如果你和对方真的可以分析出所有可能的行动和反行动,那么,你们俩就会事先在整个博弈的结果将会如何的问题上达成一致。但是,一旦这个分析只限于考察整个博弈树的某些分支,对方就可能获得一些你没有的或者你错过的信息。这样,接下来对方就可能采取一个你未
本章未完,点击下一页继续。