收藏！带你走完AI应用全链路：从Token到Harness Engineering，小白也能彻底搞懂大模型

张

张建站

2026/7/3 5:24:58

10分钟阅读

收藏！带你走完AI应用全链路：从Token到Harness Engineering，小白也能彻底搞懂大模型

本文以一个用户请求AI助手查天气并写邮件的例子带领读者走完AI应用的全链路。涵盖了LLM大语言模型、Token词元、Prompt提示词、Context上下文窗口、Tool工具调用、MCP模型上下文协议、Agent智能体、Agent Skills智能体技能和Harness Engineering驾驭工程等核心概念。文章详细解释了每个环节的作用和解决的问题展示了AI应用技术栈的演进过程帮助读者对AI应用的底层逻辑有清晰的全景认知。从一个请求出发走完 AI 应用的全链路彻底搞懂 Token、Prompt、Context、Tool、MCP、Agent、Agent Skills 和 Harness Engineering。想象你对一个 AI 助手说了这样一句话“帮我查一下杭州明天的天气然后写一封邮件告诉我老板明天需要带伞。”短短一句话背后却触发了一场精密的连锁反应——你的文字被拆成碎片、装进信封、送入一个读过万亿文字的大脑、这个大脑思考后决定上网查天气、拿到结果后又动笔写邮件、最后把邮件发出去。这篇文章就是跟着这句话走完它的全部旅程。每经过一个站点我们就认识一个核心概念。走完全程你会对 AI 应用的整个技术栈有一个清晰的全景认知。第一站大脑 —— LLM大语言模型LLM 就像一个读过整个图书馆的语言天才——它没有真正理解世界但它见过太多文字以至于能极其流畅地接话。概念介绍LLM全称 Large Language Model大语言模型是整个 AI 应用的核心引擎。GPT、Claude、Gemini、千问大模型——这些都是 LLM。它的工作原理其实很简单本质上只做一件事预测下一个词。当你说今天天气真LLM 会根据它在训练中见过的海量文本计算出下一个词最可能是好而不是桌子或紫色。把这个过程不断重复——预测下一个词、再预测下一个词——就能生成一整段流畅的文字。LLM 预测下一个 Token但别被预测下一个词这个简单描述骗了。现代 LLM 拥有数千亿个参数可以理解为神经连接在万亿级别的文本上训练。这种规模带来了涌现能力——它不仅能接话还能推理、总结、翻译、写代码甚至表现出一定的常识。在 LLM 出现之前让机器理解人类语言需要大量的规则编写和特征工程。你想做一个聊天机器人得手写几百条 if-else。想做翻译得雇语言学家标注语法树。LLM 一次性解决了这个问题你只需要用自然语言告诉它你想要什么它就能理解并回应。这是从编程控制机器到对话驱动机器的范式转变。回到我们的旅程你说的那句帮我查一下杭州明天的天气……最终就是要告诉LLM来处理。但在送进去之前它需要先经过一道翻译工序。第二站积木块 —— Token词元Token 就像乐高积木块——LLM 不认识文字它只认识一块块标准化的小积木。你说的每句话都要先被拆成这些小积木才能送进大脑。概念介绍你说的那句话——“帮我查一下杭州明天的天气然后写一封邮件告诉我老板明天需要带伞”——在 LLM 眼里并不是一个个汉字或单词而是一串Token。Token 是 LLM 处理文本的最小单位。它可能是一个完整的词也可能是词的一部分甚至是一个标点符号。不同的 LLM 使用不同的分词器Tokenizer拆法也不同。Token 化过程以英文为例Hello, world!会被拆成[Hello, ,, world, !]共 4 个 Token。中文的拆分更有趣——现代 LLM 使用的 BPEByte Pair Encoding分词器并不是按语义来分词的而是基于统计频率来合并字节对。常见的中文词会被合并成一个 Token不常见的字可能被拆成更小的字节片段。你可以在 OpenAI 的 Tokenizer 工具中实际体验分词效果亲眼看看你的文字是怎么被拆积木的。为什么要关心 Token因为它直接关系到两件事成本LLM 的 API 按 Token 数量计费。GPT-4.1 的价格是每百万输入 Token 2 美元每百万输出 Token 8 美元。你的每一句话、每一个回复都在烧 Token。容量限制每个 LLM 都有一个 Token 上限后面会详细讲超过了就装不下了。回到旅程你的那句话被拆成了大约 20 多个 Token像一串编了号的积木块准备送入下一个环节。解决什么问题计算机本质上只能处理数字不能直接处理文字。Token 是人类语言和机器数字之间的桥梁。每个 Token 都对应一个数字编号Token IDLLM 实际上是在对这些数字做数学运算。没有 Token 化这一步LLM 就无法阅读你的任何输入。第三站指令 —— Prompt提示词Prompt 就是你给天才下达的工作指令——同一个天才给他不同的指令产出天差地别。Prompt 的质量直接决定了 AI 回答的质量。概念介绍你以为你只是说了一句帮我查一下杭州明天的天气……“实际上在这句话到达 LLM 之前系统已经在它前面拼接了大量的隐藏指令”。最终送进 LLM 的完整 Prompt 可能长这样【系统指令 - 用户看不到】你是一个智能助手能够帮助用户完成各种任务。你可以调用以下工具天气查询、邮件发送。请用中文回复语气友好专业。当需要查询信息时先调用工具获取数据再基于数据回复用户。【用户消息】帮我查一下杭州明天的天气然后写一封邮件告诉我老板明天需要带伞。一个完整的 Prompt 通常由三部分组成Prompt 三层结构Prompt Engineering提示词工程就是研究如何写出更好的 Prompt 的学问。一个经典的例子❌ 差的 Prompt: 写一首诗✅ 好的 Prompt: 请用五言绝句的格式写一首描写西湖春天景色的诗要求意境清新最后一句要有转折。同样的 LLM前者可能给你一首平庸的打油诗后者则可能产出一首让你眼前一亮的作品。Prompt 是你和 LLM 之间最重要的沟通界面。回到旅程你的那句话被包装成了一个结构化的 Prompt带上了系统指令和工具说明准备送入 LLM 的工作台。解决什么问题LLM 虽然强大但它是一个通才——什么都能聊但不一定聊到点上。Prompt 解决的是精确控制的问题让 LLM 在正确的角色、正确的约束下产出符合预期的结果。没有好的 PromptLLM 就像一个没有任务说明书的天才——能力很强但不知道该往哪使劲。第四站工作台 —— Context上下文窗口Context 就是天才的工作桌面大小——桌面越大能同时摊开的资料越多但桌面总有边界超出的部分就会掉到地上被遗忘。概念介绍Context Window上下文窗口是 LLM 一次能看到的全部信息量用 Token 数量来衡量。你可以把它想象成 LLM 的短期记忆。Context 里装了什么所有东西Context Window 内部结构关键问题Context 满了怎么办当对话越来越长历史消息越来越多Context Window 就会被塞满。这时候系统必须做出取舍——通常是丢弃最早的对话记录或者对历史内容做摘要压缩。这就是为什么你和 AI 聊了很久之后它可能会忘记你们最开始聊的内容。回到旅程你的 Prompt系统指令工具定义你的请求被装进了 Context Window。LLM 扫视整个工作台上的所有资料开始思考该怎么回应你。解决什么问题Context 解决的是LLM 的视野问题。没有足够大的 ContextLLM 就像一个只能看到眼前一行字的人——无法理解上下文无法保持对话连贯无法处理长文档。Context Window 的扩大是 LLM 从一问一答的玩具进化为能处理复杂任务的助手的关键因素之一。第五站双手 —— Tool工具调用Tool 就是给天才配上了电话和电脑——光靠想是查不到真实天气的得拿起电话打给气象局。Tool 让 AI 从只会说变成能做事。概念介绍LLM 读完你的请求后它意识到一个问题杭州明天的天气这个信息我脑子里没有。 LLM 的知识截止于训练数据它不知道明天的天气。这时候Tool工具调用登场了。Tool 是预先定义好的、LLM 可以调用的外部功能。开发者会告诉 LLM“你有以下工具可以使用”并描述每个工具的功能和参数格式。{ tools: [ { name: get_weather, description: 查询指定城市的天气预报, parameters: { city: 城市名称, date: 日期格式 YYYY-MM-DD } }, { name: send_email, description: 发送电子邮件, parameters: { to: 收件人邮箱, subject: 邮件主题, body: 邮件正文 } } ]}LLM 分析你的请求后决定先调用天气工具// LLM 的输出不是给你看的是给系统执行的{ tool_call: get_weather, arguments: { city: 杭州, date: 2026-04-20 }}注意LLM 并不是自己去查天气。它只是输出了一段结构化的指令告诉外部系统“请帮我调用天气 API”。外部系统执行后把结果返回给 LLM{ result: { city: 杭州, date: 2026-04-20, weather: 小雨, temperature: 18-23°C, suggestion: 建议携带雨具 }}LLM 拿到这个结果再继续处理你的第二个请求——写邮件。完整的 Tool 调用流程Tool 调用流程回到旅程LLM 通过 Tool 查到了杭州明天有小雨现在它有了写邮件所需的信息。但这里有一个问题——如果每个 AI 应用都要自己写一套工具接入代码那岂不是重复造轮子解决什么问题LLM 的训练数据是静态的、有截止日期的。它不知道今天的股价、明天的天气、你的日程安排。Tool 解决的是LLM 与真实世界的连接问题——让 AI 能够获取实时信息、操作外部系统、执行真实动作。没有 ToolLLM 就是一个关在房间里的天才——博学但与世隔绝。第六站万能插座 —— MCP模型上下文协议一句话理解MCP 就像 USB-C 统一充电口——以前每个手机品牌都有自己的充电线现在一根 USB-C 走天下。MCP 让所有 AI 应用和所有工具之间有了统一的接口标准。概念介绍在 MCP 出现之前Tool 的接入是碎片化的。假设你有 3 个 AI 应用ChatGPT、Claude、千问和 5 个工具天气、邮件、日历、数据库、文件系统你需要写 3 × 5 15 套集成代码。每个 AI 应用都有自己的工具调用格式每个工具都要为每个平台单独适配。MCP从 M×N 到 MNMCPModel Context Protocol模型上下文协议是 Anthropic 在 2024 年底推出的开源协议它定义了一套标准化的通信方式让任何 AI 应用都能通过同一个协议连接任何工具。如上图所示MCP 将原本 M×N 的集成复杂度降低为 MN。MCP 采用Client-Server 架构并提供三种核心能力Tools工具可执行的操作如查天气、发邮件、读写数据库Resources资源可读取的数据源如文件内容、数据库记录、API 数据Prompts提示模板预定义的提示词模板帮助用户更好地与 AI 交互架构上的两个角色MCP Client客户端嵌入在 AI 应用中负责发起请求MCP Server服务端包装了具体的能力Tools / Resources / Prompts负责执行并返回结果MCP Client-Server 架构一个 MCP Server 的定义非常简洁{ name: weather-server,description: 提供全球天气查询服务,tools: [ { name: get_weather, description: 查询指定城市的天气预报, inputSchema: { type: object, properties: { city: { type: string, description: 城市名称 }, date: { type: string, description: 日期 } }, required: [city] } } ]}回到旅程在我们的故事里AI 助手通过 MCP 协议连接到天气服务的 MCP Server用标准化的方式查询了杭州的天气。同样的协议它还能连接邮件服务的 MCP Server 来发送邮件。一个协议连接一切。解决什么问题MCP 解决的是AI 工具生态的碎片化问题。就像 USB-C 终结了充电线的混乱MCP 让工具开发者只需要写一次 Server就能被所有支持 MCP 的 AI 应用使用AI 应用开发者只需要实现一次 Client就能接入所有 MCP 工具。这是 AI 应用从各自为战走向生态互通的关键一步。第七站指挥官 —— Agent智能体一句话理解Agent 就像一个项目经理——它不只是回答问题而是能自主拆解任务、制定计划、调配资源、执行行动直到把整个项目交付。概念介绍让我们回顾一下你的请求“帮我查一下杭州明天的天气然后写一封邮件告诉我老板明天需要带伞。”一个普通的 LLM 聊天机器人可能只会回复一段文字。但一个Agent会这样做Agent 执行任务的完整过程Agent 和普通 LLM 对话的核心区别是什么Agent vs 普通 LLM 对话Agent 的核心能力可以用一个循环来概括Agent 核心循环这个感知-思考-行动-观察的循环就是 Agent 的灵魂。它会不断循环直到任务完成或者判断无法继续。回到旅程在我们的故事里Agent 就是那个把查天气和发邮件串联起来的指挥官。它分析了你的请求拆解成多个步骤依次调用工具最终完成了整个任务链。解决什么问题Agent 解决的是复杂任务的自动化编排问题。在 Agent 出现之前即使 LLM 能理解你的意图也需要人类来手动拆解任务、依次调用工具、处理中间结果。Agent 让 AI 从被动回答者进化为主动执行者——你只需要说出目标它来搞定过程。第八站技能 —— Agent Skills智能体技能Agent Skills 就像项目经理的专业认证——一个项目经理可以管理任何项目但有了 PMP 认证、Scrum Master 认证他在特定领域就更专业、更高效。概念介绍一个通用的 Agent 什么都能做一点但什么都不够精。Agent Skills是预定义的、针对特定任务领域的专业能力包。以我们正在使用的 AI 编程助手为例它可能拥有这些 SkillsAgent的技能树每个 Skill 本质上是一份结构化的指令文档它告诉 Agent什么时候激活遇到什么类型的任务时使用这个技能怎么执行具体的工作流程、步骤、检查清单质量标准什么样的结果算做好了Skill 和 Tool 的区别是什么Skill 与 Tool 对比Skill 是更高层次的抽象——它不是一个工具而是使用多个工具完成复杂任务的策略和流程。回到旅程在我们的故事里如果 Agent 拥有一个邮件写作的 Skill它就不会只是干巴巴地写一封邮件而是会考虑邮件的语气、格式、称呼甚至根据告诉老板这个上下文自动使用更正式的措辞。解决什么问题Agent Skills 解决的是Agent 在特定领域的专业度问题。通用 Agent 像一个什么都会一点的实习生而配备了 Skills 的 Agent 像一个在特定领域有深厚经验的专家。Skills 让 Agent 的能力从广而浅变成广而深。第九站 Harness Engineering驾驭工程一句话理解Harness Engineering 就像城市规划师——Agent 是在路上跑的车而 Harness Engineer 是设计道路、红绿灯、护栏和交通规则的人。没有好的道路系统再好的车也会翻车。概念介绍Birgitta BöckelerThoughtworks 杰出工程师在 2026 年发表于 Martin Fowler 网站的文章中给出了一个精辟的公式Agent Model HarnessHarness驾驭系统是 Agent 中除了模型本身以外的一切——系统提示、工具定义、约束规则、反馈循环、错误处理、安全护栏……所有这些包裹在模型外面的东西统称为 Harness。Harness Engineering驾驭工程就是设计、构建和维护这套 Harness 的工程学科。OpenAI 在 2025 年也发表了同名文章描述他们如何围绕 Codex 构建 Harness让 Agent 在实际工程中可靠运转。可以说这个概念已经成为 AI 工程领域的共识。为什么需要它因为 LLM 是非确定性的——同样的输入可能产生不同的输出。它可能犯错、幻觉、跑偏。Harness 的作用就是提高首次正确率Feedforward / 前馈控制在 Agent 行动之前通过指令、规则、示例来引导它走正确的路自动纠错Feedback / 反馈控制在 Agent 行动之后通过检查、测试、验证来发现并修正错误Harness 双重控制机制一个具体的例子假设你让 Agent 帮你写一个 React 组件。没有 Harness 的情况下❌ Agent 可能 - 使用了项目中没有的依赖 - 不符合团队的代码规范 - 没有写测试 - 破坏了现有的模块边界有了良好的 Harness✅ Harness 会前馈AGENTS.md 告诉 Agent 使用 TypeScript Fusion 组件库前馈Skills 告诉 Agent 先写测试再写实现反馈Linter 自动检查代码规范反馈测试运行验证功能正确性反馈架构测试确保没有违反模块边界Harness Engineering 的核心理念是转向循环Steering Loop当 Agent 反复犯同一个错误时不是每次手动纠正而是改进 Harness——添加新的规则、更好的示例、更严格的检查——让这个错误在未来不再发生。Harness Engineering 转向循环回到旅程回看我们的整个故事——从你说出那句话到 Agent 查天气、写邮件、发送邮件——这条路之所以能走通是因为有人精心设计了每一个环节系统提示怎么写、工具怎么定义、错误怎么处理、结果怎么验证。这个设计道路的人就是 Harness Engineer。解决什么问题Harness Engineering 解决的是AI Agent 的可靠性和可控性问题。LLM 是非确定性的Agent 是自主行动的——这两个特性叠加在一起意味着如果没有良好的驾驭系统Agent 随时可能跑偏、犯错、甚至造成损害。Harness Engineering 是让 Agent 从实验室玩具变成生产级工具的关键学科。回看旅程一张全景图一个请求的旅程核心概念全景流程图上面的全景流程图完整展示了这句话走过的每一个站点。下面用一张表格来总结九个概念一条链路概念角色一句话总结LLM大脑理解语言、生成回应的核心引擎Token积木块人类语言和机器数字之间的桥梁Prompt工作指令精确控制 LLM 输出的沟通界面Context工作台LLM 一次能看到的全部信息Tool双手让 AI 触达真实世界的能力MCP万能插座统一 AI 与工具之间的接口标准Agent指挥官自主规划和执行复杂任务的智能体Agent Skills专业认证让 Agent 在特定领域更专业的能力包Harness Engineering城市规划师让 Agent 可靠、可控的工程学科从 LLM 到 Harness Engineering我们见证了 AI 应用技术栈的完整演进LLM给了机器思考的能力Token和Prompt解决了怎么和机器沟通Context决定了机器能记住多少Tool和MCP让机器能动手做事Agent让机器能自主完成任务Skills让 Agent 在特定领域更专业Harness Engineering确保这一切可靠运转每一层都在解决上一层留下的问题每一层都让 AI 离真正有用更近一步。最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

保姆级教程：在RK3588开发板上搞定GC2145 DVP摄像头（附完整DTS配置）

RK3588开发板GC2145 DVP摄像头全流程配置指南第一次拿到RK3588开发板和GC2145摄像头模组时，面对密密麻麻的引脚和晦涩的设备树配置，相信不少开发者都会感到无从下手。本文将用最直观的方式，带你从硬件连接到软件配置，一步步完成整…...

2026/6/12 12:47:49 阅读更多 →

别再为差分时钟头疼了！手把手教你用Xilinx PLL搞定Genesys2板载时钟（附Verilog代码）

差分时钟实战指南：从Genesys2板载时钟到LED点亮的完整路径刚拿到Genesys2开发板的FPGA初学者，往往会被板载的差分时钟搞得一头雾水。为什么不能像普通时钟那样直接使用？IBUFGDS和PLL到底该选哪个？这些问题困扰着许多入门者。本文…...

2026/6/22 1:22:48 阅读更多 →

技术赋能设计：2026传媒/广告店用在线设计包月，实现高效协同与成本优化

对于线下传媒、广告店而言，设计环节的核心痛点始终是“协同效率低、改稿沟通繁琐、人力成本高”：传统设计外包需通过多平台切换沟通，需求传递滞后；设计师与客户对接断层，改稿意见无法实时同步；缺乏统一的对…...

2026/5/30 1:59:33 阅读更多 →

四六级备考时间安排|2026年四六级资料|四六级考试材料

四六级备考时间安排|2026年四六级资料|四六级考试材料资料全科都有2026年四六级资料 PDFhttps://tool.nineya.com/s/1jpf2t49o【英语真题】1. "Arrangement" most probably means（ ） A. 安排，布置 B. 取消 C. 延迟 D. 忽略答案&…...

2026/7/2 4:59:53 阅读更多 →