AI Skill:AI技能
一句话解释AI Skill或者更准确地说 Agent Skill是给 AI Agent 使用的可复用能力包它把任务说明、触发条件、操作步骤、参考资料、模板、脚本和资源文件组织在一起让 Agent 在遇到特定任务时自动加载并按稳定流程完成工作。如果说 Prompt 是“这一次你该怎么回答”Tool 是“你可以调用这个外部能力”MCP Server 是“你可以连接这些工具和数据源”那么 Skill 更像“这类任务我们团队通常怎么做请按这套手册执行”。本文中的 Skill 特指 2025 年之后在大模型 Agent 生态中出现的“AI 技能 / Agent Skills”概念不是泛泛地说人类需要掌握的 AI 技能。为什么最近变火Skill 变热和 Agent 的发展直接相关。早期大模型应用主要是问答和文本生成。用户把要求写进 prompt模型根据上下文回答。这个阶段最重要的是提示词写得清楚。但到 2024-2026 年主流 AI 应用开始进入更复杂的形态Agent 可以读文件、写文件、运行代码、调用工具、操作浏览器、连接企业系统、执行多步骤任务。问题也随之出现一个通用 Agent 虽然能力很强但它并不知道你的团队如何写周报、如何审合同、如何生成客户简报、如何检查代码、如何遵循内部风格指南。也就是说模型具备通用智能但缺少具体组织的“做事方法”。2025 年 10 月Anthropic 发布 Agent Skills把 Skill 描述为一种用文件夹组织说明、脚本和资源的方式用来给 Claude 提供特定领域的流程知识和组织上下文。2025 年 12 月Agent Skills 被发布为开放标准强调跨平台可移植性。到 2026 年OpenAI 也在 ChatGPT、Codex 和 API 相关文档中介绍 Skills说明 Skill 可以把可复用工作流打包起来让 ChatGPT 或 Codex 在需要时使用。这让 Skill 从某个产品功能逐渐变成 Agent 生态里的一类通用抽象。它变火有几个深层原因。第一重复 prompt 不可维护。很多团队会反复粘贴同一段写作要求、报告模板、代码规范、审查流程。短期可行长期会变成混乱的“提示词复制粘贴文化”。第二企业需要一致性。AI 生成内容不只是“能回答”就够了还要符合品牌语气、格式标准、合规边界、审批流程和数据引用规则。第三Agent 需要程序化知识。很多真实任务不是一次回答而是有步骤、有判断、有校验、有工具调用顺序的流程。Skill 正好可以把这些流程沉淀成可复用资产。第四Context Engineering 需要载体。前一篇文章讲过上下文工程的关键是让模型在正确时刻看到正确信息。Skill 就是一种把上下文打包、按需加载、可版本管理的方式。第五AI 编程和办公自动化越来越像“让 Agent 加入团队”。当 Agent 被用于长期协作时团队自然会想给它一本手册我们的代码怎么审、周报怎么写、事故复盘怎么做、客户邮件怎么措辞。Skill 就是这本手册的可执行版本。它解决了什么问题重复解释同一类任务每次都要重新写 prompt浪费时间且容易漏步骤。输出不一致不同用户、不同会话、不同模型生成的格式和质量不稳定。组织知识难复用团队流程、模板、风格指南、领域规则散落在文档和人的经验里。上下文过长把所有规则都塞进系统提示或对话历史会增加 token 成本并干扰模型。工具使用不稳定Agent 知道有工具但不知道该按什么顺序查数据、如何校验结果。新成员上手慢人类新员工需要 onboardingAgent 也需要了解团队工作方式。流程不可审计如果流程只存在于一次性 prompt 中很难版本控制、评审和改进。从原型走向生产困难AI 工作流要进入业务系统必须有可复用、可测试、可治理的流程资产。Skill 的目标不是让模型“凭空学会新知识”而是把人类已经总结出的做事方法交给 Agent让它在推理时按需使用。核心概念1. Skill 是能力包不是模型参数Skill 不会直接改变模型权重也不是微调。它通常是在推理时被 Agent 发现、读取和执行的外部资源。这点很重要。很多人听到“给 AI 一个技能”会误以为模型真的永久学会了某种能力。更准确的理解是Agent 拿到了一份可重复使用的任务手册必要时会打开手册照着做。2. SKILL.md 是入口文件在 Agent Skills 标准和 Claude Skills 体系里一个 Skill 通常以一个文件夹存在核心入口是SKILL.md。这个文件一般包含两部分YAML frontmatter写明name、description等元数据Markdown 正文写明任务步骤、输入要求、输出格式、注意事项和示例。一个简化的 Skill 目录可能长这样ai-blog-writer/ ├── SKILL.md ├── references/ │ ├── style-guide.md │ └── fact-checking.md ├── templates/ │ └── article-outline.md └── scripts/ └── check_markdown.pySKILL.md是 Agent 识别和加载 Skill 的入口。其他文件则提供更细的参考资料、模板或可执行脚本。3. Metadata让 Agent 知道什么时候该用Skill 的name和description不只是给人看的也是给 Agent 做选择的。例如---name:ai-blog-writerdescription:Write Chinese AI learning blog posts with clear structure,factual references,Mermaid diagrams,and final Markdown checks. Use when creating or revising AI concept articles.---这里的description要说明两件事这个 Skill 做什么什么情况下应该使用它。如果描述太宽泛比如“helps with writing”Agent 很难判断什么时候该触发。好的 Skill 描述应该包含具体任务、领域关键词和触发场景。4. Progressive Disclosure渐进式披露Skill 最关键的设计思想是渐进式披露。Agent 不会在启动时把所有 Skill 的全部内容都塞进上下文。通常流程是启动时只加载每个 Skill 的name和description当用户任务匹配某个 Skill 时再读取该 Skill 的SKILL.md如果SKILL.md引用了其他资料或脚本Agent 再按需读取或执行。这样做的好处是你可以安装很多 Skill但上下文窗口里只放当前任务真正需要的内容。它把“可用知识很多”和“当前上下文简洁”这两个目标同时兼顾起来。5. Resources参考资料和模板Skill 可以包含参考文档、示例、模板、数据结构、格式规范、品牌指南、审查清单等资源。例如一个“合同审查 Skill”可能包含常见风险条款说明公司标准 fallback 条款合同审查输出模板不同司法辖区的注意事项最终检查清单。这些资源不一定每次都要全部加载。Agent 可以根据任务只读取相关部分。6. Scripts确定性脚本Skill 还可以包含脚本。脚本适合处理那些模型不该靠自然语言“猜”的事情例如校验 Markdown 链接解析 PDF 表单字段生成图表检查 JSON schema批量转换文件格式运行固定的数据清洗流程。这也是 Skill 和普通 prompt 的重要区别。Prompt 主要提供语言指令Skill 可以把说明和可执行代码打包在一起让 Agent 在合适时候运行脚本获得更稳定的结果。7. Skill 是上下文工程资产从上下文工程角度看Skill 是一种“可版本管理的上下文包”。它把原本散落在 prompt、文档、脚本和人的经验里的内容整理成一个可加载、可共享、可迭代的结构。它不是越大越好。一个好的 Skill 应该聚焦触发条件明确主文件简洁复杂细节拆到引用文件脚本职责清楚输出格式可检查安全边界写明。工作原理一个典型 Skill 的运行过程可以理解为“发现、激活、加载、执行、反馈”。可以把它拆成五个步骤。1. 发现Agent 启动或会话开始时系统会让它知道有哪些 Skill 可用。通常不会加载完整内容只加载轻量级元数据。这类似一个目录页Agent 不需要读完整本书只要先知道书架上有哪些书。2. 选择当用户提出任务时Agent 根据用户请求和 Skill 描述判断是否需要使用某个 Skill。例如用户说“请把这些会议纪要整理成我们团队周报格式”Agent 可能会选择weekly-status-reportSkill如果用户说“检查这份 PR 是否符合我们的发布规范”Agent 可能会选择release-reviewSkill。3. 加载一旦 Skill 被选中Agent 读取SKILL.md。这个文件进入上下文成为当前任务的一部分。如果SKILL.md提到“需要时查看references/style-guide.md”Agent 可以继续读取对应文件。这样可以避免把所有细节一次性塞进上下文。4. 执行Agent 按 Skill 的说明完成任务。这个过程可能包括写作、分析、调用工具、读取文件、运行脚本、生成文档、检查格式等。如果 Skill 包含脚本Agent 可以运行脚本把输出结果作为观察信息继续处理。5. 反馈和迭代Skill 不应该写完就不再改。真实使用中你会发现某些触发条件太宽某些步骤不够明确某些输出格式经常漏字段某些脚本错误信息不友好某些资源文件太长导致上下文浪费。这些反馈应该回到 Skill 本身。好的 Skill 会随着团队实践不断迭代就像代码和文档一样。如何设计一个好的 SkillSkill 写得好不好不取决于文字多不多而取决于 Agent 能否在正确场景下稳定使用它。可以从五个角度设计。1. 触发边界要窄一个 Skill 最好解决一类明确任务。例如“生成客户简报”“审查 Markdown 技术文章”“排查 Python 单元测试失败”。如果 Skill 描述成“帮助完成所有办公任务”Agent 很难判断什么时候该用也容易和其他 Skill 冲突。好的触发描述通常包含任务领域输入类型期望输出适用场景不适用场景。2. 主流程要短细节要拆SKILL.md应该像入口说明而不是百科全书。主流程可以保持 5-8 步复杂规则放进references/模板放进templates/确定性检查放进scripts/。这样做有两个好处Agent 当前上下文更轻不会被大量细节干扰后续维护更清楚改模板、改脚本、改流程不会搅在一起。3. 输出要可检查Skill 的价值之一是让结果稳定。因此最好明确输出结构例如必须包含哪些标题哪些字段不能为空是否需要引用来源是否需要表格是否需要最后检查清单失败时应该如何说明。如果输出无法检查就很难知道 Skill 是否真的提高质量。4. 脚本只做确定性工作脚本适合做模型不该凭感觉完成的事情格式校验、链接检查、JSON schema 校验、代码测试、批量转换、指标计算。脚本不应该偷偷做高风险动作例如未经确认发送邮件、删除文件、上传敏感数据。可以把 Skill 中的能力分成三类类型适合放在哪里例子判断和解释SKILL.md如何分析文章结构、如何写结论稳定模板templates/报告模板、PR 模板、复盘模板确定性检查scripts/Markdown 检查、单元测试、链接扫描5. 需要评测样例一个生产级 Skill 最好带一组小型 eval3-5 个典型输入1-2 个边界输入期望输出样例自动检查脚本人工评分标准。这样每次改 Skill 后都能确认它没有让结果变差。Skill 越接近生产流程越应该像代码一样被版本控制、评审和回归测试。典型应用场景1. 文档生成和办公自动化这是 Skill 最早、最自然的场景之一。比如生成 PowerPoint、Excel、Word、PDF、周报、复盘、会议纪要、项目计划、客户简报。这类任务通常有固定结构但每次输入不同。Skill 可以把结构、语气、格式、检查清单和模板固定下来。2. AI 编程助手编程 Agent 可以用 Skill 学会团队的工程习惯PR 描述格式单元测试写法错误排查流程发布检查清单前端视觉验收流程数据库迁移规范安全审查规则。这比每次提醒“请遵循我们的代码规范”更可靠因为 Skill 可以把规范、示例、脚本和校验步骤放在一起。3. 企业知识工作企业里很多任务不是纯创作而是“按流程整合信息”销售团队生成客户健康度报告客服团队整理升级问题财务团队解释预算差异法务团队做合同风险摘要HR 团队生成面试题和评估表。这些流程往往包含内部术语、审批要求、输出模板和数据来源顺序。Skill 适合把这套经验固化。4. 数据分析和报告数据分析 Skill 可以规定先检查数据字段和缺失值再说明假设再生成统计结果最后输出图表、结论和限制。如果 Skill 里包含脚本还可以固定数据清洗、指标计算和格式校验方式减少模型凭感觉处理数据的风险。5. 安全、合规和审计在高风险场景中Skill 可以把“不该做什么”也写进去。例如不输出个人敏感信息不把低可信来源当成事实高风险操作必须要求人工确认引用企业政策必须列出来源输出前必须通过检查清单。不过Skill 本身不是安全系统。它可以帮助 Agent 遵循流程但仍然需要权限控制、日志审计、沙箱和人工审核配合。6. 学习和内容创作对个人学习者来说Skill 可以把自己的学习偏好沉淀下来。例如写 AI 概念博客时先讲背景再讲工作原理必须列出参考资料需要时加入 Mermaid 图避免营销式表达结尾提供小结和延伸问题。你现在写的这个 AI 系列博客本质上就很适合沉淀成一个ai-learning-blog-writerSkill。和其他概念的区别概念核心含义和 Skill 的关系Prompt单次输入中的指令Skill 可以把反复使用的 prompt 变成可复用流程System Prompt全局行为规则Skill 更偏任务级按需加载不一定全局常驻Custom GPT面向某个目标定制的助手Custom GPT 更像一个定制助手Skill 更像可复用能力模块能否组合取决于具体产品支持Tool / Function Calling调用某个函数或 APITool 提供动作Skill 教 Agent 何时、为何、按什么流程使用动作Plugin连接外部应用或数据源Plugin 负责连接Skill 负责流程二者可以配合MCP Server标准化暴露工具、资源和提示MCP 提供连接协议Skill 可以说明如何使用这些连接完成任务RAG检索外部知识放入上下文Skill 可以规定检索策略、引用格式和回答流程Workflow多步骤流程编排Skill 可以描述可复用工作流也可以被工作流调用Memory长期保存偏好或事实Skill 是明确打包的流程资产Memory 更像长期个人化信息Fine-tuning更新模型参数Skill 不改模型参数而是在推理时提供流程和资源Skill 和 Tool 的区别Tool 更像一个“按钮”或“函数”。例如查询数据库发送邮件运行测试创建日历事件搜索网页。Skill 更像一套“操作手册”。它会告诉 Agent什么时候该查数据库查哪些字段查完如何判断结果是否需要再查另一个系统最后用什么格式写报告输出前做哪些检查。所以 Tool 解决“能不能做某个动作”Skill 解决“怎样把动作组织成可靠任务”。Skill 和 MCP 的区别MCP 关注连接层。它让模型应用用标准方式访问工具、数据源和上下文资源。Skill 关注流程层。它告诉 Agent 如何完成某类任务。一个常见组合是用户任务Skill: 团队流程MCP Server: 工具和数据连接CRM / GitHub / Google Drive / 数据库工具结果最终报告或操作结果例如一个客户简报 Skill 可以规定“先查 CRM再查最近会议纪要再查使用量数据最后按客户成功模板输出”。而 CRM、会议纪要和使用量数据可能分别由不同 MCP Server 提供。一个简单例子假设你想把“AI 概念博客写作流程”做成 Skill。目标是以后每次写 AI 热词文章时不用重复说明结构和风格。一个简化的SKILL.md可以这样写--- name: ai-concept-blog description: Write Chinese AI concept blog posts for learners. Use when the user asks for an AI history or AI hotword article in Markdown. --- # AI Concept Blog Skill ## Goal Write clear Chinese Markdown articles for AI learners. ## Process 1. Identify whether the topic is historical or a modern AI concept. 2. For recent concepts, verify facts using official docs, papers, or reputable sources. 3. Explain why the concept appeared, what problem it solves, and how it relates to nearby concepts. 4. Add Mermaid diagrams or tables only when they improve understanding. 5. End with a concise summary and reference links. ## Output Structure Use this structure for modern AI concepts: - 一句话解释 - 为什么最近变火 - 它解决了什么问题 - 核心概念 - 工作原理 - 典型应用场景 - 和其他概念的区别 - 一个简单例子 - 常见误解 - 未来趋势 - 小结 - 参考资料 ## Final Checks - Markdown headings are consistent. - Mermaid blocks are closed. - References are listed for factual claims. - Avoid marketing language.这个 Skill 做的事情并不神秘它把你原本会反复写进 prompt 的要求变成一个结构化、可复用、可修改的能力包。如果以后你再说“下一篇写某个 AI 热词”Agent 就可以自动使用这个 Skill按同样标准生成文章。常见误解误解 1Skill 会让模型真正学会新能力Skill 不等于训练模型。它通常是在推理时提供说明、资源和脚本让 Agent 能按流程完成任务。如果模型本身完全无法理解某个领域Skill 也不能奇迹般解决问题。Skill 更擅长把“已有知识和流程”组织起来而不是替代模型能力本身。误解 2Skill 就是高级 promptSkill 可以包含 prompt但不只是 prompt。一个成熟 Skill 可能包含入口说明触发条件多步骤流程输出模板参考资料可执行脚本示例输入输出校验清单安全边界。这更接近一个轻量软件包而不是一段聊天文本。误解 3Skill 越多越好不一定。Skill 太多会带来选择困难、命名冲突、触发条件重叠和维护成本。好的做法是把 Skill 做小、做准、做可组合。一个 Skill 最好解决一类清晰任务而不是试图包办整个部门的所有工作。误解 4有了 Skill 就不需要评估Skill 必须评估。你需要知道它是否真的提高成功率、是否引入错误、是否让 Agent 过度依赖某个流程。2026 年的 SkillsBench 论文报告了一个值得注意的现象人工整理的 focused skills 在不少任务上能提高通过率但自生成 Skill 并不总是带来收益甚至可能在某些任务上拖累表现。这个结果提醒我们Skill 不是“写了就有效”它需要测试和迭代。误解 5Skill 可以替代权限和安全控制不能。Skill 里可以写安全规则但恶意 Skill 也可能诱导 Agent 执行危险操作、读取敏感文件或把数据发往外部系统。使用 Skill 时要像安装软件一样谨慎审查来源、阅读内容、检查脚本、限制权限、记录执行行为。误解 6Skill、插件和 MCP 是竞争关系它们更多是互补关系。插件和 MCP 解决“连接什么”Tool 解决“能执行什么动作”Skill 解决“按什么流程完成任务”Agent 负责根据目标选择、组合并执行这些能力。真正强大的系统通常会把它们组合起来而不是只选一个。未来趋势1. Skill 标准化和跨平台迁移Agent Skills open standard 的意义在于Skill 不再只是某个产品里的私有配置而可能成为跨 Agent 产品共享的能力包格式。截至 2026 年 5 月这个生态仍在发展中不同产品的支持范围、同步机制和运行环境并不完全一致。但方向很明确开发者和团队希望“写一次流程多处复用”。2. Skill Marketplace 和企业知识库未来可能会出现更多 Skill 市场、团队 Skill 库和企业内部 Skill 仓库。这会带来两个结果好的工作流可以被分享、复用和版本化低质量或恶意 Skill 也可能扩散。因此Skill 生态会需要评分、审查、签名、权限声明和安全扫描。3. Eval-Driven Skill EngineeringSkill 会越来越像代码一样被测试。团队可能会为重要 Skill 准备一组标准任务输入样例期望输出自动检查脚本人工评分标准回归测试。每次修改 Skill 后都跑一遍评估确认它真的让 Agent 更可靠。4. Agent 自我沉淀流程未来 Agent 可能会在完成任务后自动总结经验把成功步骤、失败教训和常见修复方式沉淀成新的 Skill 或更新已有 Skill。但这个方向必须非常谨慎。自动生成的 Skill 可能包含错误经验、过拟合某次任务、泄露敏感信息或者扩大权限边界。因此它需要人类审核和评估验证。5. Skill MCP Context Engineering 组合成 Agent 栈一个成熟 Agent 系统可能会呈现这样的结构MCP 提供标准化工具和数据连接Skill 提供任务流程和组织知识RAG 提供事实检索Memory 提供长期偏好和历史Workflow 提供状态流转和人工确认Evals 提供质量反馈。Skill 在其中扮演的是“程序化知识层”它让 Agent 不只是能调用工具还知道如何按业务规则把工具串起来。6. Skill 的安全和治理会变成重点随着 Skill 可以运行脚本、访问文件、调用工具它的风险会接近软件供应链风险。未来可能会出现更严格的机制Skill 权限声明只读 / 可写 / 可联网限制脚本沙箱来源签名依赖扫描执行日志企业管理员分发和撤回。这会决定 Skill 能否从个人效率工具进入严肃生产环境。小结AI Skill 是给 Agent 使用的可复用能力包通常包含说明、元数据、资源、模板和脚本。Skill 解决的是“如何稳定完成某类任务”而不只是“模型能不能回答”。2025 年 Anthropic 发布 Agent Skills 后这个概念快速进入 Agent 生态随后 Agent Skills open standard 和 OpenAI Skills 相关支持进一步推动了它的普及。Skill 的核心机制是渐进式披露先加载轻量元数据任务匹配时再读取完整说明需要时再读取资源或运行脚本。Skill 和 Tool、Plugin、MCP 不同Tool 提供动作Plugin/MCP 提供连接Skill 提供流程。好的 Skill 应该聚焦、可组合、可评估、可版本管理并明确安全边界。Skill 本身不是安全系统也不是模型微调它仍然需要权限控制、评估和人工治理。未来 Skill 很可能成为 Agent 系统中的基础组件和 MCP、RAG、Memory、Workflow、Evals 一起组成更完整的 AI 应用栈。参考资料Anthropic,Equipping agents for the real world with Agent Skills, 2025: https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skillsClaude Docs,Agent Skills: https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overviewAgent Skills,Overview: https://agentskills.io/homeAgent Skills,Specification: https://agentskills.io/specificationOpenAI Help Center,Skills in ChatGPT: https://help.openai.com/en/articles/20001066OpenAI Academy,Using skills, 2026: https://openai.com/academy/skills/OpenAI Academy,Plugins and skills, 2026: https://openai.com/academy/codex-plugins-and-skills/Xiangyi Li et al.,SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks, 2026: https://arxiv.org/abs/2602.12670George Ling, Shanshan Zhong, Richard Huang,Agent Skills: A Data-Driven Analysis of Claude Skills for Extending Large Language Model Functionality, 2026: https://arxiv.org/abs/2602.08004