用Python搞定AlphaBeta剪枝：从零实现一个AI五子棋的决策核心（附完整代码）

张

张建站

2026/5/30 2:40:14

10分钟阅读

用Python搞定AlphaBeta剪枝：从零实现一个AI五子棋的决策核心（附完整代码）

用Python实现AlphaBeta剪枝打造智能五子棋AI核心五子棋作为一款经典策略游戏其AI开发一直是算法实践的热门领域。本文将带你从零实现一个基于AlphaBeta剪枝算法的五子棋AI决策核心不仅掌握算法原理更能体验完整项目开发的乐趣。与教科书式的算法讲解不同我们聚焦于如何将抽象理论转化为可运行的代码最终得到一个能与你对弈的智能对手。1. 博弈树与五子棋的映射原理五子棋的每个棋盘状态都可以视为博弈树中的一个节点。当玩家落子时相当于从当前节点延伸出若干子节点。AlphaBeta剪枝算法的核心任务就是在这些可能的走法中找出最优解。传统教学案例中的博弈树通常使用固定数值作为叶子节点评估值但在实际五子棋AI中我们需要设计动态评估函数。一个基础但有效的评估方式如下def evaluate_board(board): # 评估当前棋盘状态 score 0 directions [(1,0), (0,1), (1,1), (1,-1)] # 横、竖、斜方向 for i in range(len(board)): for j in range(len(board[0])): if board[i][j] 0: # 空位 continue for dx, dy in directions: count 1 # 当前连续棋子数 # 向正反两个方向检测 for step in [1, -1]: x, y i, j for _ in range(4): # 最多检测4步 x dx * step y dy * step if 0 x len(board) and 0 y len(board[0]) and board[x][y] board[i][j]: count 1 else: break # 根据连续棋子数加分 if board[i][j] 1: # AI棋子 score 10 ** (count - 1) else: # 玩家棋子 score - 10 ** (count - 1) return score这个评估函数会扫描整个棋盘对每个棋子的连续排列情况进行评分。连续棋子越多得分呈指数级增长这与五子棋的实际价值判断一致。2. AlphaBeta剪枝算法实现AlphaBeta剪枝是Minimax算法的优化版本通过剪除不必要的分支来提升搜索效率。以下是核心实现def alphabeta(board, depth, alpha, beta, maximizing_player): if depth 0 or game_over(board): return evaluate_board(board) if maximizing_player: # AI回合取最大值 value -float(inf) for move in generate_moves(board): make_move(board, move, 1) # 1代表AI value max(value, alphabeta(board, depth-1, alpha, beta, False)) undo_move(board, move) alpha max(alpha, value) if alpha beta: break # β剪枝 return value else: # 玩家回合取最小值 value float(inf) for move in generate_moves(board): make_move(board, move, 2) # 2代表玩家 value min(value, alphabeta(board, depth-1, alpha, beta, True)) undo_move(board, move) beta min(beta, value) if beta alpha: break # α剪枝 return value关键参数说明参数类型说明depthint搜索深度影响AI思考时间和强度alphafloat当前路径上MAX玩家的最佳值betafloat当前路径上MIN玩家的最佳值maximizing_playerbool当前是否为AI回合3. 走法生成与优化技巧高效的走法生成对算法性能至关重要。五子棋的走法不是全盘随机而是围绕已有棋子的邻域def generate_moves(board): moves set() size len(board) # 只考虑已有棋子周围2格范围内的空位 for i in range(size): for j in range(size): if board[i][j] ! 0: # 已有棋子 for di in [-2, -1, 0, 1, 2]: for dj in [-2, -1, 0, 1, 2]: ni, nj i di, j dj if 0 ni size and 0 nj size and board[ni][nj] 0: moves.add((ni, nj)) # 如果没有相邻棋子开局返回中心区域 if not moves and size % 2 1: moves.add((size//2, size//2)) return sorted(moves, keylambda x: -evaluate_move(x, board)) # 按评估值排序为提高搜索效率我们可以实现以下优化迭代加深搜索先浅层搜索再逐步加深置换表缓存已评估的棋盘状态杀手启发式优先尝试历史表现好的走法# 迭代加深搜索示例 def find_best_move(board, max_depth4): best_move None best_value -float(inf) # 从浅到深逐步搜索 for depth in range(1, max_depth 1): for move in generate_moves(board): make_move(board, move, 1) value alphabeta(board, depth-1, -float(inf), float(inf), False) undo_move(board, move) if value best_value: best_value value best_move move return best_move4. 完整五子棋AI实现将上述组件整合我们得到完整的五子棋AI类class GomokuAI: def __init__(self, size15): self.size size self.board [[0 for _ in range(size)] for _ in range(size)] self.transposition_table {} # 置换表 def reset(self): self.board [[0 for _ in range(self.size)] for _ in range(self.size)] def make_move(self, move, player): x, y move self.board[x][y] player def undo_move(self, move): x, y move self.board[x][y] 0 def game_over(self): # 检查是否有五连珠 directions [(1,0), (0,1), (1,1), (1,-1)] for i in range(self.size): for j in range(self.size): if self.board[i][j] 0: continue for dx, dy in directions: count 1 for step in [1, -1]: x, y i, j for _ in range(4): x dx * step y dy * step if 0 x self.size and 0 y self.size and self.board[x][y] self.board[i][j]: count 1 else: break if count 5: return True return False def get_best_move(self, depth3): best_move None best_value -float(inf) for move in self.generate_moves(): self.make_move(move, 1) value self.alphabeta(depth-1, -float(inf), float(inf), False) self.undo_move(move) if value best_value: best_value value best_move move return best_move # 其他方法同上...实际使用时只需几行代码即可创建AI对战ai GomokuAI() while not ai.game_over(): # AI回合 ai_move ai.get_best_move(depth4) ai.make_move(ai_move, 1) # 玩家回合通过GUI或命令行输入 player_move get_player_input() ai.make_move(player_move, 2)5. 性能调优与进阶方向要让AI更强大可以从以下几个方向优化评估函数精细化区分活四、冲四、活三等棋型考虑棋盘控制区域加入位置权重中心更有利搜索优化实现并行搜索使用更高效的数据结构动态调整搜索深度机器学习增强使用神经网络评估棋盘通过自我对弈提升策略结合蒙特卡洛树搜索(MCTS)一个改进后的评估函数示例def advanced_evaluate(board): # 定义各种棋型的分数 SCORES { five: 100000, # 五连 live_four: 10000, # 活四 rush_four: 1000, # 冲四 live_three: 500, # 活三 sleep_three: 100, # 眠三 live_two: 50, # 活二 } score 0 # 这里添加具体的棋型检测逻辑 # ... return score在开发过程中我发现在15×15棋盘上搜索深度为4时AI响应时间在可接受范围内1-3秒而深度达到5时思考时间会显著增加。因此在实际应用中可以根据需要动态调整搜索深度——在简单局面使用更深搜索复杂局面则适当降低深度以保证响应速度。