首页 > 学院 > 开发设计 > 正文

怎样编制黑白棋(4)

2019-11-17 05:27:42
字体:
来源:转载
供稿:网友
开局及终局开局     所有的强力程序都采用了开局定式,许多顶级程序的定式大多来自IOS游戏。对于强力的程序而言,他会在每一次对局结束以后升级定式,因此,对于有自学习功能的电脑来说,用上一次击败电脑的战术对付电脑是不会管用的。另一方面,具有自学习功能的电脑的中局棋力也会越来越强,原因是电脑会通过不断升级估值函数的权重来提高棋力。TD(Temporal Difference)就是一个实用的强化学习技术。一个应用了该技术的国际象棋程序在国际互联网上进行了300多局对局后,其等级分从1650分(一般水平)上涨到了2110分(美国大师水平)。终局    终局是电脑的强项,它的搜索比中局快得多,主要有这样几个理由:1.终局的估值函数很简单,他只用看双方谁胜了,估值就等于电脑的棋子减去对手的棋子。而不用判定行动力、潜在行动力、余裕手、边角判定和稳定子。2.终局的搜索由于空格越来越少,使得搜索节点很少。如深度为5的搜索,中盘时叶子节点平均为10*10*10*10*10=100000,而终局时最大为5*4*3*2*1=120。3.哈希表在终局时效率更高。    因为随着游戏向终局接近,玩者可下的位置逐渐减少,在终局阶段程序可以搜索得更深。这使得他们在终局比人类下得更好。看计算机在终局下棋经常感到不可思议,因为双方都在游戏结束20步以前知道了游戏的结果。对计算机而言,终局早在人类玩家中局结尾时就开始了,离游戏结束还有20-30步。  

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表