博弈程序编写

本文最后更新于：2024年9月5日下午

写一些博弈相关的东西

基础概念

点格棋由$66 $的点位构成$ 55$的格子，整个局面一共25个格子和60条边。

游戏规则：四条边围住一个格子，这个格子归属于放下最后一条边的一方，当最终棋盘被填满时，占据格子多的一方获胜。

长链：一系列尚未被完全围住的正方形（通常只有两条边），这些正方形共享边，形成一个连续的链条状结构。如下图

打开长链：当一方使得长链正方形中的某一个正方形构成了3边，就会形成死树，那么其对手方将获会占据所有长链正方形。

死树：一个已经形成的长链状结构，只差一条边就可以完成并将所有包含的正方形“吃完”（即完成所有正方形，获得分数和额外回合）。死树非常接近完成，但当前回合的玩家不愿意去画最后那条边，因为这样做会给对手带来大量得分。

环：若干个正方形围成的闭合结构，即它们的边已经被画满，形成一个封闭的回路。

让格：通过不主动完成某些正方形，让对手先操作一些边线，从而为自己留下更有利的操作空间。

alpha&beta剪枝

树结构定义：

每个节点表示此时的赢面

根节点表示我方赢面

父节点到子节点表示执棋方落子一步，故以我方为根节点，则奇数层为我方赢面，偶数层为敌方赢面

搜索深度就是树的深度

最大最小算法：

根据树结构定义，我们显然要在奇数层获取最大赢面，对手会在偶数层使得我们走向最小赢面。故我们在偶数层填入子节点中的最小值，称为MIN节点，在奇数层填写子节点中的最大值，称为MAX节点。

剪枝：

上述算法需要遍历整个博弈树，我们发现在遍历博弈树的过程中，我们的赢面情况是在不断变化的，所以我们可以记录当前赢面的范围，从而规避掉不必要的搜索路径。alpha表示此时可以获得的最大赢面，beta表示此时我方受到敌方行棋限制（根据先前的搜索结果敌方可以导向我方选择路径）后可以获得的最大赢面，当alpha大于等于beta时，剪掉后续路径。

回溯过程中存在三种状态：