用Python手把手教你实现一个简单的感知器（附AND/OR逻辑门完整代码）

张

张建站

2026/6/1 2:28:18

10分钟阅读

用Python从零构建感知器AND/OR逻辑门的实战演练第一次接触神经网络时很多人会被复杂的数学公式吓退。但事实上神经网络的基础单元——感知器Perceptron——其核心思想简单得令人惊讶。本文将带你用不到100行Python代码亲手实现一个能够学习AND和OR逻辑门的感知器模型。我们不会涉及任何高深的数学推导而是通过直观的代码示例和实时权重可视化让你在Jupyter Notebook或PyCharm中直接感受机器学习的学习过程。1. 感知器基础神经网络的乐高积木想象一下你正在教一个三岁小孩区分苹果和橙子。你会指着颜色说红色的是苹果橙色的是橙子。感知器的工作原理与此惊人地相似——它通过调整内部的权重weights和偏置bias来学习区分不同的输入模式。感知器的核心是一个简单的数学函数def predict(inputs): weighted_sum sum(w*x for w,x in zip(weights, inputs)) bias return 1 if weighted_sum 0 else 0 # 阶跃函数这个函数做了三件事计算输入信号与权重的点积加权和加上偏置项可以理解为难易程度的调节通过激活函数这里用阶跃函数产生输出对于AND逻辑门我们希望感知器学会以下规则x1x2输出0000101001112. 构建感知器类面向对象实现让我们用Python类来封装感知器的核心功能。这个实现特别注重可解释性——我们会在训练过程中打印权重变化让你直观看到学习是如何发生的。class Perceptron: def __init__(self, input_size): self.weights [0.0] * input_size # 初始化权重为零 self.bias 0.0 # 初始化偏置为零 def predict(self, inputs): 预测函数计算加权和并应用阶跃函数 total sum(w * x for w, x in zip(self.weights, inputs)) self.bias return 1 if total 0 else 0 def train(self, training_data, labels, epochs20, learning_rate0.1): 训练函数通过数据迭代调整权重 for epoch in range(epochs): print(fEpoch {epoch1}: weights{self.weights}, bias{self.bias}) for inputs, label in zip(training_data, labels): prediction self.predict(inputs) error label - prediction # 更新权重 self.weights [w learning_rate * error * x for w, x in zip(self.weights, inputs)] self.bias learning_rate * error关键点学习率(learning_rate)控制着每次权重调整的幅度。太小会导致学习过慢太大可能无法收敛。3. 训练AND逻辑门分步演示现在让我们用这个类来训练一个AND逻辑门。我们将逐步展示训练过程中权重的变化让你看到模型是如何学会这个简单模式的。# AND逻辑门训练数据 and_inputs [[0, 0], [0, 1], [1, 0], [1, 1]] and_labels [0, 0, 0, 1] # 创建感知器实例 and_perceptron Perceptron(input_size2) # 开始训练 and_perceptron.train(and_inputs, and_labels) # 测试训练结果 print(\n测试AND逻辑门:) for inputs in and_inputs: print(f{inputs} - {and_perceptron.predict(inputs)})典型的训练过程输出可能如下具体数值可能因初始条件和学习率而略有不同Epoch 1: weights[0.0, 0.0], bias0.0 Epoch 2: weights[0.1, 0.1], bias-0.1 Epoch 3: weights[0.2, 0.1], bias-0.1 ... Epoch 10: weights[0.3, 0.3], bias-0.4观察最终权重你会发现它们满足不等式w1x1 w2x2 b 0 只有当x1和x2都为1时才成立。这就是AND逻辑的数学表达4. 实现OR逻辑门微小调整带来的巨大变化OR逻辑门与AND的唯一区别在于标签数据。这展示了感知器框架的灵活性——同样的代码只需改变训练数据就能学习完全不同的逻辑。# OR逻辑门训练数据 or_inputs [[0, 0], [0, 1], [1, 0], [1, 1]] or_labels [0, 1, 1, 1] # 创建新的感知器实例 or_perceptron Perceptron(input_size2) # 开始训练 or_perceptron.train(or_inputs, or_labels) # 测试训练结果 print(\n测试OR逻辑门:) for inputs in or_inputs: print(f{inputs} - {or_perceptron.predict(inputs)})OR感知器的权重通常会收敛到较小的正值而偏置为一个较小的负值。这使得只要任一输入为1加权和就能超过阈值。5. 可视化决策边界理解感知器的局限性为了更深入理解感知器的工作原理我们可以绘制它的决策边界。这能直观展示感知器是如何在输入空间中划分不同类别的。import matplotlib.pyplot as plt import numpy as np def plot_decision_boundary(perceptron, title): # 创建网格点 x_min, x_max -0.5, 1.5 y_min, y_max -0.5, 1.5 xx, yy np.meshgrid(np.arange(x_min, x_max, 0.01), np.arange(y_min, y_max, 0.01)) # 预测每个网格点的类别 Z np.array([perceptron.predict([x, y]) for x, y in zip(xx.ravel(), yy.ravel())]) Z Z.reshape(xx.shape) # 绘制决策边界和训练点 plt.figure(figsize(8, 6)) plt.contourf(xx, yy, Z, alpha0.4) plt.scatter([0, 0, 1, 1], [0, 1, 0, 1], cand_labels if titleAND else or_labels, s100, edgecolorsk) plt.title(f感知器决策边界 ({title})) plt.xlabel(x1) plt.ylabel(x2) plt.show() # 绘制AND和OR的决策边界 plot_decision_boundary(and_perceptron, AND) plot_decision_boundary(or_perceptron, OR)从图中你可以清晰地看到一条直线完美地将不同类别的点分开。这也揭示了感知器的一个重要特性它只能解决线性可分的问题。对于更复杂的模式如XOR单层感知器就无能为力了——这正是多层神经网络深度学习出现的原因。6. 超参数实验学习率和训练轮次的影响感知器的表现很大程度上取决于两个关键超参数学习率(learning_rate)和训练轮次(epochs)。让我们通过实验看看它们如何影响训练过程。def train_with_params(learning_rate, epochs): p Perceptron(2) p.train(and_inputs, and_labels, epochsepochs, learning_ratelearning_rate) accuracy sum(1 for inputs, label in zip(and_inputs, and_labels) if p.predict(inputs) label) / len(and_labels) print(f学习率{learning_rate}, 轮次{epochs} - 准确率{accuracy*100}%) # 不同参数组合实验 params [ (0.01, 10), (0.01, 100), # 小学习率 (0.1, 10), (0.1, 100), # 中等学习率 (1.0, 10), (1.0, 100) # 大学习率 ] for lr, ep in params: train_with_params(lr, ep)实验结果可能显示学习率太小0.01时模型需要更多轮次才能收敛学习率适中0.1时模型能在较少的轮次内达到高准确率学习率太大1.0时模型可能震荡甚至无法收敛7. 从感知器到现代神经网络虽然我们的感知器很简单但它包含了现代神经网络的所有核心概念。多层感知器(MLP)本质上就是多个感知器的堆叠通过非线性激活函数如ReLU连接起来。深度学习中的反向传播算法也是感知器学习规则的扩展。# 一个简单的多层感知器伪代码示例 class MLP: def __init__(self, layer_sizes): self.layers [] for i in range(len(layer_sizes)-1): # 每层都是一个感知器集合 layer [Perceptron(layer_sizes[i]) for _ in range(layer_sizes[i1])] self.layers.append(layer) def predict(self, inputs): for layer in self.layers: inputs [neuron.predict(inputs) for neuron in layer] return inputs理解了这个简单的感知器实现你就掌握了神经网络最基础也最重要的构建块。下次当你使用复杂的深度学习框架时记住在核心处它们仍然在做着类似的事情——调整权重以最小化误差。

局域网办公电脑时间总不准？用SymmTime+任务计划程序搞定Windows 10自动校时

局域网办公电脑时间同步难题：SymmTime与任务计划程序的完美解决方案在局域网办公环境中，多台Windows电脑系统时间不同步可能引发一系列令人头疼的问题。从文件版本混乱到日志记录错位，再到会议系统预约冲突，时间偏差看似小事&…...

2026/6/1 2:26:37 阅读更多 →

KMeans聚类实战：用RFM模型给电商用户分群，制定精准营销策略（Python+sklearn）

KMeans聚类实战：用RFM模型给电商用户分群，制定精准营销策略（Pythonsklearn）电商平台每天产生海量用户交易数据，如何从这些数据中挖掘用户价值，是每个运营团队的核心课题。RFM模型作为经典的客户价值分析框架…...

2026/6/1 2:14:56 阅读更多 →

深入QueryPerformanceCounter：从TSC到硬件计数器，揭秘Windows高精度计时背后的原理与坑

深入QueryPerformanceCounter：从TSC到硬件计数器，揭秘Windows高精度计时背后的原理与坑在性能敏感型应用的开发中，时间测量的精度往往直接决定了分析结果的可靠性。当开发者从Linux环境转向Windows平台时，常会遇到一个核心问题&am…...

2026/6/1 2:14:00 阅读更多 →

AI辅助创作的临界点已至（2024全球创意工作者生产力白皮书核心发现）

更多请点击： https://intelliparadigm.com 第一章：AI辅助创作的临界点已至（2024全球创意工作者生产力白皮书核心发现） 2024年，全球创意产业迎来关键拐点：AI不再作为边缘工具，而是深度嵌入创意工…...

2026/6/1 2:30:08 阅读更多 →

双稳态核心记忆架构：解决人工智能长期上下文断裂的极简底层范式

双稳态核心记忆架构：解决人工智能长期上下文断裂的极简底层范式开源声明本文完全开源、无版权限制、公开通用，允许所有开发者、科研机构、技术团队无偿引用、落地、迭代、二次开发，助力人工智能长期记忆体系技术革新。作者：杨建…...

2026/6/1 2:30:09 阅读更多 →

单片机IIC实验

单片机 ：STM32F407 开发板：DMF407电机开发板平台：keil V5.31HSE 为8MHZ HSI为16MHZ原理图：主函数：int main(void) {uint8_t key;uint16_t i 0;uint8_t datatemp[TEXT_SIZE];HAL_Init(); …...

2026/6/1 2:30:08 阅读更多 →