别再傻傻分不清了！用‘好瓜烂瓜’的例子，5分钟搞懂机器学习里的准确率、召回率和F1

张

张建站

2026/6/20 19:42:01

10分钟阅读

别再傻傻分不清了！用‘好瓜烂瓜’的例子，5分钟搞懂机器学习里的准确率、召回率和F1

水果摊主的机器学习课用挑西瓜的故事讲透准确率、召回率和F1站在水果摊前老王头正对着两筐西瓜发愁。左边那筐标着AI精选右边则是普通货。这AI精选到底靠不靠谱他嘀咕着。这场景像极了我们在机器学习中面临的困境——如何判断一个模型的预测是否可靠今天我们就用挑西瓜这个日常场景拆解那些让初学者头疼的评估指标。1. 从水果摊到混淆矩阵理解四个基本概念想象你是个西瓜采购员每天要判断上百个西瓜的好坏。你的判断会出现四种情况真甜瓜TP你预测是好瓜切开确实汁多味甜假甜瓜FP你预测是好瓜切开却发现寡淡无味假烂瓜FN你预测是坏瓜实际错过了完美熟度的佳品真烂瓜TN你预测是坏瓜切开证实已经变质这四种情况构成了机器学习的混淆矩阵。用采购数据来说话预测\实际好瓜坏瓜预测好瓜TP70FP10预测坏瓜FN5TN15提示FP就像过度乐观的采购员FN则是过分谨慎的类型好的评估指标应该平衡这两种倾向。2. 准确率水果摊主的靠谱程度准确率回答的问题是**你选中的瓜里有多少是真正的好瓜**计算公式很简单准确率 TP / (TP FP)用上面的数据70 / (70 10) 87.5%这意味着你标注好瓜的筐里约87%确实值得购买。高准确率的模型就像个保守的采购员优点选中的瓜基本不会出错缺点可能会错过不少潜在的好瓜FN较高3. 召回率不漏掉任何好瓜的能力召回率关注**所有真正的好瓜中你找出了多少**公式是召回率 TP / (TP FN)我们的例子中70 / (70 5) 93.3%这表示摊位上93%的好瓜都被你发现了。高召回率模型像个积极的采购员优点极少错过好瓜缺点筐里可能混入不少坏瓜FP较高4. F1分数在挑剔和宽容间找到平衡现实中我们既不想买到坏瓜高准确率也不愿错过好瓜高召回率。F1分数就是这两个指标的调和平均数F1 2 × (准确率×召回率) / (准确率召回率)代入我们的数据2 × (0.875×0.933) / (0.8750.933) ≈ 90.3%为什么用调和平均而非算术平均因为它会惩罚极端值如果准确率或召回率有一个很低F1会明显下降只有当两者都较高时F1才会保持在高位5. 实战调整你的选瓜策略不同的场景需要不同的平衡垃圾邮件过滤高准确率优先宁可漏掉垃圾邮件低召回也绝不能把重要邮件误判为垃圾FP代价高疾病筛查高召回率优先宁可多检查几个假阳性FP也不能漏掉真实病例FN代价高在Python中可以这样计算这些指标from sklearn.metrics import precision_score, recall_score, f1_score y_true [1, 1, 0, 1, 0] # 实际标签1好瓜 y_pred [1, 0, 1, 1, 0] # 预测标签 print(f准确率: {precision_score(y_true, y_pred):.2f}) print(f召回率: {recall_score(y_true, y_pred):.2f}) print(fF1分数: {f1_score(y_true, y_pred):.2f})输出准确率: 0.67 召回率: 0.67 F1分数: 0.67下次当你站在水果摊前或是评估机器学习模型时不妨想想这四个简单的字母TP、FP、FN、TN。它们背后蕴含的评估智慧既适用于挑选完美西瓜也适用于构建可靠的AI系统。记住没有完美的模型只有适合特定场景的平衡点——就像老练的水果采购员知道不同场合需要不同的挑选策略。

热潮下的冷思考：从OpenClaw“龙虾”困境看AI Agent的理性选择与国产平替

2026年初，开源AI智能体项目OpenClaw（俗称“小龙虾”）以一种近乎野蛮的方式闯入大众视野。两天内GitHub星标突破17万，线下排队安装，甚至催生了“代装龙虾”的灰色产业。然而，这场技术狂欢的B面，却…...

2026/6/17 19:12:19 阅读更多 →

如何免费使用Cursor Pro：3步实现AI编程助手永久激活的终极指南

如何免费使用Cursor Pro：3步实现AI编程助手永久激活的终极指南【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached …...

2026/6/14 8:26:39 阅读更多 →

LangChain 工程化总结：测试、监控与持续迭代

系列导读你现在看到的是《LangChain 实战与工程化落地：从原型到生产环境的完整指南》的第 10/10 篇，当前这篇会重点解决：建立 LLM 应用的测试与监控体系，确保系统在迭代中保持稳定与高质量。上一篇回顾：第 9 篇《生产化部署：LangServe、Docker 与 API 网关》主要聚焦…...

2026/6/18 6:03:29 阅读更多 →

终极暗黑破坏神2存档编辑器d2s-editor：5分钟掌握可视化修改的完整指南

终极暗黑破坏神2存档编辑器d2s-editor：5分钟掌握可视化修改的完整指南【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 还在为暗黑破坏神2单机存档修改而烦恼吗？d2s-editor是一款免费开源的暗黑破坏神2存档…...

2026/6/19 22:02:36 阅读更多 →

APK安装器：在Windows电脑上直接安装安卓应用的终极指南

APK安装器：在Windows电脑上直接安装安卓应用的终极指南【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾经想在Windows电脑上运行安卓应用&#xff…...

2026/6/19 22:02:37 阅读更多 →

5分钟快速指南：silk-v3-decoder让微信语音转换变得如此简单

5分钟快速指南：silk-v3-decoder让微信语音转换变得如此简单【免费下载链接】silk-v3-decoder [Skype Silk Codec SDK]Decode silk v3 audio files (like wechat amr, aud files, qq slk files) and convert to other format (like mp3). Batch conversion support.…...

2026/6/20 19:04:00 阅读更多 →