转载——Alpha-Beta算法详解

2023年6月7日下午8:37 • 数据结构和算法 • 阅读 74

前置：

MinMax算法：https://www.xqbase.com/computer/search_minimax.htm https://www.cnblogs.com/johnsonstar/p/16101778.html

原文链接：https://www.xqbase.com/computer/search_alphabeta.htm

原文如下：

《对弈程序基本技术》专题

Alpha-Beta搜索

Bruce Moreland /文

“非常相似，事实上只多了一条额外的语句。最小最大运行时要检查整个博弈树，然后尽可能选择最好的线路。这是非常好理解的，但效率非常低。每次搜索更深一层时，树的大小就呈指数式增长。通常一个国际象棋局面都有

个左右的合理着法，所以用最小

最大搜索来搜索一层深度，就有

个局面要检查，如果用这个函数来搜索两层，就有

个局面要搜索。这就已经上千了，看上去还不怎样，但是数字增长得非常迅速，例如六层的搜索就接近是二十亿，而十层的搜索就超过两千万亿了。要想通过检查搜索树的前面几层，并且在叶子结点上用启发式的评价，那么做尽可能深的搜索是很重要的。最小

最大搜索无法做到很深的搜索，因为有效的分枝因子实在太大了。

幸运的是我们有办法来减小分枝因子，这个办法非常可靠，实际上这样做绝对没有坏处，纯粹是个有益的办法。这个方法是建立在一个思想上的，如果你已经有一个不太坏的选择了，那么当你要作别的选择并知道它不会更好时，你没有必要确切地知道它有多坏。有了最好的选择，任何不比它更好的选择就是足够坏的，因此你可以撇开它而不需要完全了解它。只要你能证明它不比最好的选择更好，你就可以完全抛弃它。你可能仍旧不明白，那么我就举个例子。比如你的死敌面前有很多口袋，他和你打赌赌输了，因此他必须从中给你一样东西，而挑选规则却非常奇怪：每个口袋里有几件物品，你能取其中的一件，你来挑这件物品所在的口袋，而他来挑这个口袋里的物品。你要赶紧挑出口袋并离开，因为你不愿意一直做在那里翻口袋而让你的死敌盯着你。假设你一次只能找一只口袋，在找口袋时一次只能从里面摸出一样东西。很显然，当你挑出口袋时，你的死敌会把口袋里最糟糕的物品给你，因此你的目标是挑出”诸多最糟的物品当中是最好的”那个口袋。你很容易把最小

最大原理运用到这个问题上。你是最大一方棋手，你将挑出最好的口袋。而你的死敌是最小一方棋手，他将挑出最好的口袋里尽可能差的物品。运用最小

最大原理，你需要做的就是挑一个有”最好的最差的”物品的口袋。假设你可以估计口袋里每个物品的准确价值的话，最小

最大原理可以让你作出正确的选择。我们讨论的话题中，准确评价并不重要，因为它同最小

最大或

的工作原理没有关系。现在我们假设你可以正确地评价物品。最小

最大原理刚才讨论过，它的问题是效率太低。你必须看每个口袋里的每件物品，这就需要花很多时间。那么怎样才能做得比最小

最大更高效呢？我们从第一个口袋开始，看每一件物品，并对口袋作出评价。比方说口袋里有一只花生黄油三明治和一辆新汽车的钥匙。你知道三明治更糟，因此如果你挑了这只口袋就会得到三明治。事实上只要我们假设对手也会跟我们一样正确评价物品，那么口袋里的汽车钥匙就是无关紧要的了。现在你开始翻第二个口袋，这次你采取的方案就和最小

最大方案不同了。你每次看一件物品，并跟你能得到的最好的那件物品

三明治

去比较。只要物品比三明治更好，那么你就按照最小

最大方案来办——去找最糟的，或许最糟的要比三明治更好，那么你就可以挑这个口袋，它比装有三明治的那个口袋好。比方这个口袋里的第一件物品是一张

美元的钞票，它比三明治好。如果包里其他东西都没比这个更糟了，那么如果你选了这个口袋，它就是对手必须给你的物品，这个口袋就成了你的选择。这个口袋里的下一件物品是六合装的流行唱片。你认为它比三明治好，但比

美元差，那么这个口袋仍旧可以选择。再下一件物品是一条烂鱼，这回比三明治差了。于是你就说”不谢了”，把口袋放回去，不再考虑它了。无论口袋里还有什么东西，或许还有另一辆汽车的钥匙，也没有用了，因为你会得到那条烂鱼。或许还有比烂鱼更糟的东西

那么你看着办吧

。无论如何烂鱼已经够糟的了，而你知道挑那个有三明治的口袋肯定会更好。

就是这么工作的，并且只能用递归来实现。稍后我们再来谈最小一方的策略，我希望这样可以更明白些。这个思想是在搜索中传递两个值，第一个值是

，即搜索到的最好值，任何比它更小的值就没用了，因为策略就是知道

的值，任何小于或等于

的值都不会有所提高。第二个值是

，即对于对手来说最坏的值。这是对手所能承受的最坏的结果，因为我们知道在对手看来，他总是会找到一个对策不比

更坏的。如果搜索过程中返回

更好的值，那就够好的了，走棋的一方就没有机会使用这种策略了。在搜索着法时，每个搜索过的着法都返回跟

有关的值，它们之间的关系非常重要，或许意味着搜索可以停止并返回。如果某个着法的结果小于或等于

，那么它就是很差的着法，因此可以抛弃。因为我前面说过，在这个策略中，局面对走棋的一方来说是以

为评价的。如果某个着法的结果大于或等于

，那么整个结点就作废了，因为对手不希望走到这个局面，而它有别的着法可以避免到达这个局面。因此如果我们找到的评价大于或等于

，就证明了这个结点是不会发生的，因此剩下的合理着法没有必要再搜索。如果某个着法的结果大于

但小于

，那么这个着法就是走棋一方可以考虑走的，除非以后有所变化。因此

会不断增加以反映新的情况。有时候可能一个合理着法也不超过

，这在实战中是经常发生的，此时这种局面是不予考虑的，因此为了避免这样的局面，我们必须在博弈树的上一个层局面选择另外一个着法。在第二个口袋里找到烂鱼就相当于超过了

，如果口袋里没有烂鱼，那么考虑六盒装流行唱片的口袋会比三明治的口袋好，这就相当于超过了

在上一层

。算法如下，醒目的部分是在最小

最大算法上改过的： int

(int depth

) { if (depth == 0) { return Evaluate(); } GenerateLegalMoves(); while (MovesLeft()) { MakeNextMove(); val = –

(depth – 1

); UnmakeMove();

if (val > alpha) { alpha = val; } } return alpha;} 把醒目的部分去掉，剩下的就是最小-最大函数。可以看出现在的算法没有太多的改变。这个函数需要传递的参数有：需要搜索的深度，负无穷大即

，以及正无穷大即

： val = AlphaBeta(5, -INFINITY, INFINITY); 这样就完成了

层的搜索。我在写最小

最大函数时，用了一个诀窍来避免用了”

“还用”

函数中我们做了同样的处理。唯一使算法感到复杂的是，

是不断互换的。当函数递归时，

不但取负数而且位置交换了，这就使得情况比口袋的例子复杂，但是可以证明它只是比最小

最大算法更好而已。最终出现的情况是，在搜索树的很多地方，

是很容易超过的，因此很多工作都免去了。

这个算法严重依赖于着法的寻找顺序。如果你总是先去搜索最坏的着法，那么

截断就不会发生，因此该算法就如同最小

最大一样，效率非常低。该算法最终会找遍整个博弈树，就像最小

最大算法一样。如果程序总是能挑最好的着法来首先搜索，那么数学上有效分枝因子就接近于实际分枝因子的平方根。这是

算法可能达到的最好的情况。由于国际象棋的分枝因子在

左右，这就意味着

算法能使国际象棋搜索树的分枝因子变成

。这是很大的改进，在搜索结点数一样的情况下，可以使你的搜索深度达到原来的两倍。这就是为什么使用

搜索时，着法顺序至关重要的原因。原文：

译者：象棋百科全书网

类型：全译

Original: https://www.cnblogs.com/johnsonstar/p/16101803.html
Author: Johnson-Hugo
Title: 转载——Alpha-Beta算法详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/583993/

转载文章受原作者版权保护。转载请注明原作者出处！

数据结构和算法

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

学习随笔——codeforces题目Color the Picture解答

摘要：构造类题目题目原地址如下：https://codeforces.com/problemset/problem/1710/A 题目截图如下：关键词：构造算法，递归，*150…

数据结构和算法 2023年6月7日
0079
2021年第12届蓝桥杯国赛做题记录

A:带宽：计算200Mbps=?MB/s。常识题，答案200/8=25 先打一个素数表，然后遍历即可。答案1903 bool check(int n): while (m >…

数据结构和算法 2023年6月12日
0078
Testlink for linux by Xampp

Testlink 1．环境：（1）需要的环境配置: ① Linux system. ② Mysql ③ apache ④ Php （2）上面的 2,3,4 我们使用简易的X…

数据结构和算法 2023年6月12日
0074
Rust单链表

节点的结构希望链表存储在堆上，所以使用 Box 包裹节点 Rust 没有空值，所以用 Option 在包裹一层 #[derive(PartialEq, Eq, Clone, De…

数据结构和算法 2023年6月7日
0092
AcWing 179. 八数码（搜索）

题目描述题目链接解决思路启发函数：只需要搜索非常少的状态，就可以搜到从起点到终点的最短路径估价函数：当前状态中每个数与它的目标位置的曼哈顿距离之和 A*算法优先级为：从起…

数据结构和算法 2023年6月16日
0076
epoll服务器开发一

socket英文单词为插座的意思，在网络通信中代表套接字，取插座的意思代表socket需要像插头插座一样配套使用，所以socket需要指定具体的五元组才可以通信，包括源ip、源端口…

数据结构和算法 2023年6月16日
0084
leetcode-数组中两元素的最大乘积

给你一个整数数组 nums，请你选择数组的两个不同下标 i 和 j，使 (nums[i]-1)*(nums[j]-1) 取得最大值。请你计算并返回该式的最大值。 &#x8…

数据结构和算法 2023年6月8日
0073
acm可好玩了(6) 题解

acm可好玩了(6) 今天我要ak!! 按照题意直接输出就好了 #include int main() { printf("今天我要AK\n"); } 小A的方…

数据结构和算法 2023年6月12日
0086
入门学习1.1.1——K进制小数对金融工作中的影响——（程序设计与算法（一）C语言程序设计（mooc郭炜）课程学习）

2.1思考点 2.1.1 K进制小数对金融工作中的影响本课中提到，虽然整数格式都可以通过2进制来表示，但是小数是通过2的负幂相加的形式来形成的。这就造成，在内存有限的情况下，一…

数据结构和算法 2023年6月8日
0082
DFS与BFS

DFS与BFS dfs又称深度优先搜索，即一路走到底（一个执着的人），当走到底（到达叶子节点）时要回溯。注：回溯不是直接回到头，而是边回去边看，能不能再往下走，只有当我们明确当前节…

数据结构和算法 2023年6月7日
0078
力扣2. 两数相加

2. 两数相加 2. 两数相加难度：中等描述：给你两个非空的链表，表示两个非负的整数。它们每位数字都是按照逆序的方式存储的，并且每个节点只能存储一位数字。请你将两个数相…

数据结构和算法 2023年6月16日
00113
[C++]使用auto遍历判断是否是最后一个元素

一、背景略二、代码 for(auto& it:vec){ if(&it==&vec.back()){ cout< 其实就是通过判断当前遍历的元素地…

数据结构和算法 2023年6月7日
0072
每日代码系列（17）

1 interface Achievement { 2 public abstract float average(); 3 } 4 class Person { 5 String…

数据结构和算法 2023年6月7日
0096
题解 AT5635 Shortest Path on a Line（线段树优化建图）

upd on 2022.9.3：增加了对解法的描述。 Description 有一张有 (N) 个点，编号为 (1 – N) 的无向图。做 (M) 次操作，每次操作给…

数据结构和算法 2023年6月8日
0089
「浙江理工大学ACM入队200题系列」问题 E: 零基础学C/C++78——求奇数的乘积

本题是浙江理工大学ACM入队200题第八套中的E题我们先来看一下这题的题面. 输入数据包含多个测试实例，每个测试实例占一行，每行的第一个数为n，表示本组数据一共有n个，接着是n个…

数据结构和算法 2023年6月12日
00105
如何离线安装posh-git

不用上github 1、下载post-git离线安装包 2,用Powershell执行install.ps1 3.用管理员权限打开powershell，修改策略： set-exec…

数据结构和算法 2023年6月16日
00105

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

转载——Alpha-Beta算法详解

大家都在看