用Python和Scikit-learn给人民币‘看相’：一个颜色矩+SVM的纸币面额识别小项目

张

张建站

2026/6/3 7:43:00

10分钟阅读

用Python和Scikit-learn给人民币‘看相’：一个颜色矩+SVM的纸币面额识别小项目

用Python打造人民币智能识别系统从颜色特征到SVM模型的实战解析走在街头巷尾你是否注意过自动售货机如何精准识别投入的纸币这背后隐藏的正是计算机视觉与机器学习的精妙结合。今天我们将用Python构建一个能看懂人民币面额的智能系统整个过程就像教孩子认识不同颜色和大小的玩具一样直观有趣。1. 项目准备与环境搭建在开始之前我们需要准备好Python环境和必要的工具库。这个项目特别适合刚学完Python基础想要尝试实际应用的开发者。以下是我们的技术栈Python 3.8推荐使用Anaconda管理环境Pillow (PIL)处理图像的基本操作NumPy数值计算和数组处理scikit-learn机器学习模型实现Matplotlib可选可视化分析安装依赖只需一行命令pip install pillow numpy scikit-learn matplotlib提示如果遇到权限问题可以尝试添加--user参数或在虚拟环境中安装。我们的数据集包含6种面额的人民币图片1元、5元、10元、20元、50元、100元每种面额有40张不同角度和正反面的照片总共240张。这些图片已经按照面值_序号.png的格式命名例如5_23.png表示第23张5元人民币照片。2. 图像预处理为机器学习准备食材就像烹饪前需要洗净切配食材一样图像预处理是机器学习项目成功的关键第一步。我们需要确保所有图片规格统一并且排除干扰因素。2.1 标准化图像尺寸不同照片可能因为拍摄角度和距离产生尺寸差异我们需要统一调整为相同大小from PIL import Image def resize_image(image_path, target_size(60, 60)): img Image.open(image_path) return img.resize(target_size)2.2 提取中心区域纸币边缘可能因为拍摄角度产生变形我们更关注中心区域的颜色特征def crop_center(image, crop_width100, crop_height100): width, height image.size left (width - crop_width)/2 top (height - crop_height)/2 right (width crop_width)/2 bottom (height crop_height)/2 return image.crop((left, top, right, bottom))2.3 颜色通道分离人民币不同面额最直观的区别就是颜色我们需要分别处理RGB三个通道def split_channels(image): return image.split() # 返回(R, G, B)三个通道3. 特征工程颜色矩的魔力特征工程是将原始数据转换为机器学习模型能理解的形式的过程。对于图像识别颜色矩Color Moments是一种简单有效的特征提取方法。3.1 理解颜色矩颜色矩包含三个层次的统计特征一阶矩均值颜色的平均强度二阶矩标准差颜色的变化幅度三阶矩偏度颜色分布的不对称性对于RGB图像每个通道计算这三个矩总共得到9个特征值。3.2 计算颜色矩以下是计算颜色矩的Python实现import numpy as np def calculate_moments(channel): # 一阶矩均值 mean np.mean(channel) # 二阶矩标准差 std np.std(channel) # 三阶矩偏度 skewness np.mean((channel - mean)**3) ** (1/3) return mean, std, skewness3.3 构建特征矩阵我们需要为每张图片计算RGB三个通道的颜色矩并组合成特征向量def extract_features(image): r, g, b split_channels(image) r_mean, r_std, r_skew calculate_moments(np.array(r)) g_mean, g_std, g_skew calculate_moments(np.array(g)) b_mean, b_std, b_skew calculate_moments(np.array(b)) return [r_mean, r_std, r_skew, g_mean, g_std, g_skew, b_mean, b_std, b_skew]4. 构建SVM分类模型支持向量机(SVM)在小样本、高维度分类问题上表现优异非常适合我们的纸币识别任务。4.1 数据准备首先加载所有图片并提取特征import os def load_dataset(image_folder): features [] labels [] for filename in os.listdir(image_folder): if filename.endswith(.png): # 从文件名获取面额标签 label filename.split(_)[0] labels.append(label) # 处理图像并提取特征 img_path os.path.join(image_folder, filename) img Image.open(img_path) img resize_image(img) img crop_center(img) feature extract_features(img) features.append(feature) return np.array(features), np.array(labels)4.2 训练测试分割使用scikit-learn的train_test_split划分数据集from sklearn.model_selection import train_test_split X, y load_dataset(人民币图片/) X_train, X_test, y_train, y_test train_test_split( X, y, test_size0.2, random_state42)4.3 SVM模型训练不同核函数对结果有显著影响我们比较几种常见选择核函数类型适用场景训练速度预测速度linear线性可分快快poly非线性中等中等rbf非线性慢中等sigmoid特定场景中等中等from sklearn.svm import SVC from sklearn.metrics import accuracy_score # 使用RBF核函数 svm_model SVC(kernelrbf, C1.0, gammascale) svm_model.fit(X_train, y_train) # 评估模型 train_acc accuracy_score(y_train, svm_model.predict(X_train)) test_acc accuracy_score(y_test, svm_model.predict(X_test)) print(f训练集准确率: {train_acc:.2%}) print(f测试集准确率: {test_acc:.2%})4.4 模型优化技巧提高模型性能的几个实用方法特征标准化SVM对特征尺度敏感使用StandardScaler类别权重样本不均衡时设置class_weightbalanced网格搜索寻找最优的C和gamma参数组合from sklearn.preprocessing import StandardScaler from sklearn.pipeline import make_pipeline # 创建包含标准化的管道 svm_pipeline make_pipeline( StandardScaler(), SVC(kernelrbf, C1.0, gammascale) ) svm_pipeline.fit(X_train, y_train)5. 实际应用中的挑战与解决方案在理想实验室环境下模型可能表现良好但实际应用中会遇到各种挑战5.1 光照条件变化不同光线环境下拍摄的照片颜色差异很大解决方案使用HSV颜色空间替代RGB增加光照归一化步骤收集更多不同光照条件下的训练数据5.2 拍摄角度倾斜纸币不是正对相机时颜色特征会失真解决方案应用透视变换校正角度提取多个区域的特征而不仅是中心区域使用SIFT或SURF等局部特征5.3 纸币磨损和污渍流通中的纸币会有不同程度的磨损解决方案增加数据增强模拟磨损效果结合纹理特征而不仅依赖颜色使用更鲁棒的分类算法如随机森林5.4 实时性要求实际应用可能需要实时识别优化策略# 简化特征计算 def fast_features(image): r, g, b split_channels(image) return [np.mean(r), np.mean(g), np.mean(b)] # 仅使用均值减少特征维度选择计算量小的模型如线性SVM使用Cython或Numba加速关键代码6. 项目扩展与进阶方向完成基础版本后可以考虑以下扩展方向提升系统能力6.1 多特征融合除了颜色矩可以加入纹理特征LBP、灰度共生矩阵形状特征边缘检测、霍夫变换深度学习特征使用预训练CNN提取高级特征6.2 模型集成结合多种模型的优势训练随机森林作为第二分类器使用投票机制综合SVM和RF的结果堆叠(Stacking)不同模型的预测结果6.3 端到端部署将模型应用到实际场景from flask import Flask, request, jsonify app Flask(__name__) app.route(/predict, methods[POST]) def predict(): file request.files[image] img Image.open(file.stream) # 预处理和特征提取 feature extract_features(img) # 预测 pred svm_model.predict([feature]) return jsonify({denomination: pred[0]}) if __name__ __main__: app.run(host0.0.0.0, port5000)6.4 移动端集成使用以下工具将模型部署到移动设备TensorFlow Lite轻量级推理框架Core MLiOS或ML KitAndroidONNX Runtime跨平台模型部署在实际测试中我发现模型的性能很大程度上取决于训练数据的多样性。曾经在一个项目中因为训练集缺少特定光照条件下的样本导致模型在实际应用中准确率骤降。后来通过数据增强和收集更多真实场景数据解决了这个问题。

用立创GD32E230开发板实现呼吸灯：深入理解GPIO输出模式与速度配置

用立创GD32E230开发板实现呼吸灯：深入理解GPIO输出模式与速度配置呼吸灯效果作为嵌入式开发的经典入门项目，看似简单却蕴含着GPIO配置的核心原理。本文将基于立创GD32E230开发板，从硬件电路到软件实现完整解析呼吸灯项目，重点探讨…...

2026/6/3 7:40:56 阅读更多 →

RHEL 7离线升级到8的完整避坑指南：从环境准备到重启验证

RHEL 7离线升级到8的完整避坑指南：从环境准备到重启验证在企业级Linux环境中，RHEL系统的版本升级往往牵一发而动全身。特别是从RHEL 7到RHEL 8这样的大版本跨越，不仅涉及底层架构的变更，更可能影响关键业务的连续性。本文将从一个…...

2026/6/3 7:40:25 阅读更多 →

非公度缺陷下蜂窝晶格边缘态的谱分析与有效Dirac理论

1. 项目概述：蜂窝晶格中的非公度缺陷与边缘态在凝聚态物理和拓扑光子学领域，蜂窝晶格结构——最著名的代表是石墨烯——因其独特的能带结构和狄拉克锥（Dirac cones）而备受关注。这类材料最迷人的特性之一，是当系统存在…...

2026/6/3 7:39:56 阅读更多 →

AI辅助创作的临界点已至（2024全球创意工作者生产力白皮书核心发现）

更多请点击： https://intelliparadigm.com 第一章：AI辅助创作的临界点已至（2024全球创意工作者生产力白皮书核心发现） 2024年，全球创意产业迎来关键拐点：AI不再作为边缘工具，而是深度嵌入创意工…...

2026/6/2 15:30:51 阅读更多 →

双稳态核心记忆架构：解决人工智能长期上下文断裂的极简底层范式

双稳态核心记忆架构：解决人工智能长期上下文断裂的极简底层范式开源声明本文完全开源、无版权限制、公开通用，允许所有开发者、科研机构、技术团队无偿引用、落地、迭代、二次开发，助力人工智能长期记忆体系技术革新。作者：杨建…...

2026/6/1 2:30:09 阅读更多 →

单片机IIC实验

单片机 ：STM32F407 开发板：DMF407电机开发板平台：keil V5.31HSE 为8MHZ HSI为16MHZ原理图：主函数：int main(void) {uint8_t key;uint16_t i 0;uint8_t datatemp[TEXT_SIZE];HAL_Init(); …...

2026/6/2 15:19:14 阅读更多 →