精通 Claude Agent 技能 - 构建你的 AI 超能力武库完整指南

Claude Agent 技能 - 构建你的 AI 能力武库
技能不仅仅是提示词。它们是你 AI 能力的 DNA。
技能公式

技能将你的程序性知识转化为可重用的能力包 — 当你的 Agent 需要时随时待命,且每次都能稳定执行。

我还记得那个豁然开朗的时刻。那是凌晨 2 点,我正在试图向 Claude 解释——感觉像是第一百次了——究竟该如何校对我的文章。检查是否有 AI 味的表达。拆分长句。保持段落为移动端阅读友好的 3-5 行。不要过度使用粗体。让它听起来像人写的。每一次对话,我都输入相同的指令。每一次,我都在相同的解释上浪费宝贵的 Token。

然后我发现了技能(Skills)。我意识到我之前对 AI 助手的理解完全错了。

这篇指南包含了我在刚开始时希望有人能告诉我的所有内容。无论你是想知道“技能”究竟是什么的完全新手,还是希望构建自我进化、越用越聪明的技能库的高级用户——这都是你的综合路线图。我们将从“到底什么是技能?”一直讲到构建在仅仅一年前还像是科幻小说的自动化管理系统。

我真正理解技能是什么的那一刻

让我给你讲个故事。想象一下,你被要求指导一位才华横溢的新员工。这个人极其聪明——是你见过的学得最快的人,几乎能理解你解释的任何事情,能就任何话题侃侃而谈。但有一个问题:他们不知道公司的规则。

每天早上,你都要坐下来向他们解释同样的事情。“这是我们要如何格式化报告。这是我们的代码风格。这是这封邮件要抄送给谁。这是客户提案的模板。”而每天午饭后,他们不知怎么就全忘了。不是因为他们笨——他们很聪明。而是因为他们没有关于你公司做事方式的持久记忆。

这正是过去与 AI 合作的感觉。

提示词(Prompts)就像站在那位新员工旁边,当场给出在口头指令。“把这封邮件写得正式点。”“这里用要点列表。”“检查这段代码的 bug。”这行得通。但当你结束对话的那一刻,一切都消失了。每一次新的聊天都从零开始。

技能(Skills)就像递给他们一本内部 SOP 手册——一个包含规范、脚本、模板和参考资料的知识库文件夹。Agent 会在需要的时候查找它需要的内容。最关键的是,这本手册在每次对话中都持续存在。

💡

技能是包含指令、脚本和资源的模块化能力包,在需要时由 Claude 自动加载和使用。 就是这样。这就是定义。但理解其中的含义花了我数周时间。

这是一个突破性的洞察:技能不仅仅是花哨的提示词。它们是一个完全不同的范式。提示词是反应式的——你给出指令,你得到回应。技能是主动式的——它就在那里,等待在相关时被发现和应用,并且每次都以相同的方式执行。

技能实际上包含什么

每个技能都是一个文件夹,而不仅仅是一个文本文件。这一点理解起来至关重要。在这个文件夹里,你可以拥有:

SKILL.md

核心指令文件。必需。这是 Claude 阅读的主要文档,用于理解该技能的作用以及如何使用它。

scripts/

任何语言的可执行脚本。可选但强大。Python, Bash, Node — 任何你需要用于确定性执行的语言。

references/

详细文档、API 规范、长篇指南。仅在需要时加载,保持主技能精简。

assets/

模板、图片、字体、样板文件。Claude 在执行技能时可以使用的资源。

当我第一次看到这个结构时,我想:“等等,这就像在构建一个小应用程序。”完全正确。每个技能都是一个独立的、自包含的能力模块。有些很简单——只是一个包含校对规则的 markdown 文件。有些很复杂——包含处理数据、上传到服务器并生成报告的完整 Python 脚本。

技能是何时出现的?

Anthropic 在 2025 年 10 月为 Claude Code 发布了技能功能。起初,我以为这只是另一个功能更新。但在 2025 年 12 月发生了一件事——他们通过 agentskills.io 将技能作为标准开放了。突然间,技能不仅仅是 Claude 的东西了。OpenAI 的 Codex CLI 采用了相同的架构。Cursor, Codebuddy, OpenCode — 每个人都开始构建兼容性。

技能成为了 AI Agent 能力扩展的事实标准,就像 MCP 迅速成为每个人连接外部的协议一样。

至于流行程度?让我这样说吧:一个包含 50+ 个 Claude 技能的仓库在 GitHub 上达到了 1.8 万星。在 AI 圈子里,“技能”这个词现在就像 2023 年的“提示词”一样无处不在。

渐进式披露 - 为什么这个设计是天才之作

在理解渐进式披露之前,我一直有一个担忧:“如果我安装了 50 个技能,Claude 的上下文不会爆炸吗?加载技能描述会不会就要烧掉几千个 Token?”

这正是 Anthropic 设计才华闪耀的地方。他们借鉴了 UX 设计中的一个概念——渐进式披露(Progressive Disclosure)——并将其完美地应用于 AI 上下文管理。

三层加载系统

渐进式披露意味着分阶段按需加载。Claude 不会在启动时把所有东西都倾倒进上下文。相反,它使用了一个三层系统:

1
第 1 层:元数据 — 始终加载

仅加载每个 SKILL.md 的 YAML 头部 — 名称和描述字段。每个技能大约 100 Token。即使是 50 个技能也只需 5,000 Token。Claude 利用这些信息知道有哪些技能可用。

2
第 2 层:指令 — 触发时加载

完整的 SKILL.md 正文。通常 3,000-5,000 Token。只有当你的请求匹配某个技能的描述时才会加载。这里是实际“如何做”的内容所在。

3
第 3 层:资源 — 引用时加载

脚本、参考文档、模板。仅当技能指令特别调用它们时才加载。脚本在本地执行——只有结果进入上下文,而不是代码本身。

让我们算算账

这是一个让我对该设计赞叹不已的比较:

传统方法

所有内容都在 CLAUDE.md 中,每次对话都加载。

  • 我的旧设置:3,000+ 行
  • Token 成本:每次聊天约 40,000 Token
  • 无论是否需要都加载

技能方法

基于需求的渐进式加载。

  • 50 个技能元数据:约 5,000 Token
  • 1-2 个活跃技能:+6,000 Token
  • 总计:通常约 11,000 Token

这减少了 75% 的 Token 消耗。 而这还没算上脚本带来的优势。

脚本的魔力

这就是技能将提示词远远甩在身后的地方。当一个技能包含脚本时,神奇的事情发生了:

  1. Claude 生成命令:python scripts/upload_image.py image.png
  2. 脚本在你的机器上本地执行
  3. 只有输出(如图片 URL)返回给 Claude

脚本代码本身从未进入上下文。

想想这意味着什么。你可以编写一个 500 行的 Python 脚本来处理每一个边缘情况,拥有健壮的错误处理、日志记录、重试机制——所有这些会让提示词变得极其臃肿的东西。Claude 只需要知道“执行这个脚本”。复杂性被封装了。

💡

技能可以封装确定性的执行能力。这与提示词有着根本的不同。提示词是希望 Claude 理解你想要什么。脚本则保证了将会发生什么。

移动端菜单的比喻

如果你设计过移动应用,你会非常熟悉渐进式披露。这就是为什么我们有汉堡菜单——我们不会立即向用户展示 47 个选项。我们展示一个菜单图标。他们点击。他们看到分类。他们再次点击。他们找到想要的设置。

目的是什么?永远不要用信息淹没用户。分解成易消化的块。让用户(或者在这里,是 AI)能够以最小的认知负荷专注于当前任务。

人类的工作记忆大约能容纳 7±2 个信息块。受限于上下文窗口的 AI,本质上有着相同的限制。渐进式披露在这两种情况下都尊重了这一限制。

技能 vs MCP vs Subagent - 终于理清了

这个问题困扰了我好几个星期。MCP、技能、Subagent——它们似乎都能“扩展 Claude 的能力”。真正的区别是什么?在使用这三者构建之后,我终于有了一个讲得通的答案。

一句话的区别

MCP 让 Claude 触摸外部系统。技能告诉 Claude 如何使用它触摸到的东西。Subagent 派别人去干活。

让我用真正帮助我理解的类比来展开说明:

MCP

门禁卡

想象你那位才华横溢的新员工进不了仓库——没有工牌,没有权限。MCP 就是门禁卡。它是让 Claude 访问外部系统的连接协议:数据库、API、文件系统、SaaS 服务。GitHub MCP 让 Claude 读取仓库。Notion MCP 让 Claude 编辑页面。核心价值是连接(Connection)

Skills

用户手册

现在你的员工可以进入仓库了。但他们知道库存系统吗?东西存在哪?收货流程是什么?技能就是用户手册。它们包含程序性知识——如何做事,遵循什么步骤,使用什么格式。核心价值是专门知识(Know-How)

Subagent

派人出去

有时你需要有人独立处理一项任务。Subagent 会启动一个新的隔离会话,拥有自己的上下文、工具和权限。它完成工作并将结果带回来。核心价值是并行执行(Parallel Execution)和上下文隔离。

对比表

维度 MCP 技能 (Skills) 子智能体 (Subagent)
核心角色 连接外部系统 提供程序性知识 并行任务执行
Token 成本 高 (预加载所有能力) 低 (按需加载) 高 (独立会话)
技术门槛 需要编程/服务器 只需 Markdown 需要配置
外部数据访问 否 (除非通过脚本)
最适合 实时数据需求 重复性工作流 复杂的多步骤任务

何时使用哪个

在需要连接外部系统时使用 MCP:

  • 查询数据库
  • 调用第三方 API
  • 读/写 Notion, Jira, GitHub, Salesforce
  • 访问任何需要认证的服务

在有重复性工作流时使用技能:

  • 具有特定检查清单的代码审查流程
  • 具有一致风格规则的文章校对
  • 标准格式的报告生成
  • 任何你发现自己重复输入的指令

在任务复杂且可并行化时使用 Subagent:

  • 审查整个代码库(耗时)
  • 同时处理多个独立任务
  • 防止不相关的工作污染上下文

它们协同工作

最美妙的部分在于:这些不是相互竞争的技术。它们是互补的层级。

一个复杂的工作流可能同时使用这三者:

  1. MCP 连接 Salesforce 拉取销售数据
  2. 技能 定义数据分析流程——如何计算指标,生成报告
  3. Subagent 并行处理不同区域的分析

在我自己的写作工作流中:

  • 技能定义了我的校对规则和风格指南
  • 脚本(打包在技能中)将图片上传到我的托管服务
  • 我正计划添加 MCP 来连接我的素材数据库

为什么 Simon Willison 说技能可能比 MCP 更重要

Simon Willison 是 AI 开发者社区中最受尊敬的声音之一。当他写道“技能可能比 MCP 更重要”时,人们开始关注。在使用这两者几个月后,我完全明白了他为什么这么说。

理由 1:Token 效率

MCP 有一个根本问题:Token 膨胀。

当你连接一个 MCP 服务器时,Claude 需要了解该服务器能做什么。每一个可用函数,每一个参数,每一个返回类型——所有这些都需要在上下文中。Simon 指出,仅官方 GitHub MCP 服务器就消耗了数万个 Token。

技能优雅地避开了这个问题。仅加载元数据(每个 100 Token),然后在触发时才加载完整的指令。效率上的差异是惊人的。

理由 2:简单性优势

要构建一个 MCP 服务器,你需要:

  • 理解协议规范
  • 编写服务端代码
  • 正确配置 JSON
  • 处理通信和错误状态

要构建一个技能?

只需写 Markdown。

如果你会写文档,你就会写技能。门槛的差异是巨大的。而在技术领域,更低的创作门槛总是导致爆炸性的增长。

理由 3:跨平台兼容性

MCP 服务器通常是特定于宿主的。为 Claude Code 构建的东西如果不经修改可能无法在其他地方工作。

技能只是包含 Markdown 和可选脚本的文件夹。它们不依赖于 Anthropic 的专有技术。Simon 指出,你可以将同一个技能文件夹指向 Codex CLI, Gemini CLI — 即使没有原生的技能支持,它们也能工作,因为技能的核心只是结构良好的指令。

这种可移植性正是 OpenAI 在 Codex CLI 中采用基本相同架构的原因。技能正在成为一种通用标准。

理由 4:寒武纪大爆发预言

“我预测技能将带来比去年 MCP 热潮更壮观的寒武纪大爆发。”
— Simon Willison

为什么?因为当创作门槛降得足够低时,社区贡献就会爆发。编写 MCP 服务器需要后端开发技能。编写技能只需要知道如何写文档。

我们已经看到这个预言成真。技能市场遍地开花。GitHub 仓库里充满了社区贡献。生态系统的增长速度超出了所有人的预期。

我自己的观察

在使用了这两种技术几个月后,我同意 Simon 的评估。技能感觉更符合 LLM 自然的工作方式——理解文本,遵循指令,根据上下文应用知识。

MCP 代表了传统的软件工程思维:定义接口,实现服务,处理协议。

技能代表了 LLM 原生思维:清楚地写下如何做某事,让模型自己弄清楚何时以及如何应用它。

两者都有其位置。但技能可能是更深刻的范式转变。

完美技能的解剖学结构

让我带你了解一个精心制作的技能的结构。这不仅是理论——理解这个解剖结构将使本指南中的其他一切变得清晰。

文件夹结构

标准技能目录
my-skill/
├── SKILL.md                 # 核心指令(必需)
├── scripts/
│   └── process.py           # 可执行脚本
├── references/
│   └── DETAILED_GUIDE.md    # 详细参考文档
└── assets/
    └── template.md          # 模板资源

只有 SKILL.md 是必需的。其他一切都是为了增强能力。

SKILL.md 文件

这是你技能的心脏。它有两个部分:

SKILL.md 结构
---
name: my-awesome-skill
description: 简要解释该技能的作用以及何时使用。包含触发关键词。
---

# My Awesome Skill

## Instructions

Claude 在被调用此技能时要遵循的分步指南。

## Examples

输入/输出或使用模式的具体演示。

## Guidelines

要遵循的任何规则、约束或最佳实践。

YAML Frontmatter (前置数据)

--- 标记之间的部分至关重要。这是 Claude 读取以决定是否使用你的技能的内容。

name

唯一标识符。仅限小写字母、数字、连字符。最多 64 个字符。这将成为你的 /slash-command(斜杠命令)。

description

告诉 Claude 何时使用此技能。包含触发关键词。最多 1024 个字符。这是你技能的“可发现性”。

关键的描述错误

不要把写提示词的习惯带到这里。在描述中始终使用第三人称,因为它们会被注入到系统提示词中。

好: "处理 Excel 文件并生成报告" (Process Excel files and generate reports)

坏: "我可以帮你处理 Excel 文件"

坏: "你可以用这个来处理 Excel 文件"

高级 Frontmatter 选项

除了名称和描述,技能还支持强大的配置选项:

字段 用途
disable-model-invocation 设为 true 以防止 Claude 自动加载。只有手动 /command 有效。
user-invocable 设为 false 以从 /menu 中隐藏。用于后台知识。
allowed-tools 限制技能激活时 Claude 可以使用的工具。
context 设为 "fork" 以在隔离的 subagent 上下文中运行。
agent 使用哪种 subagent 类型(Explore, Plan, 通用)。

黄金法则:500 行

💡

保持你的 SKILL.md 正文在 500 行以内。如果你需要更多,拆分到参考文件中。臃肿的技能违背了渐进式披露的初衷。

命名约定

文件夹名称很重要。必须是小写字母 + 连字符。没有空格。没有大写。

  • 好: hotspot-collector, code-review, ai-proofreading
  • 坏: Hotspot Collector, codeReview, AI_Proofreading

创建你的第一个技能

这是我最重要的建议:你不需要自己写技能。

让我解释一下。技能的价值在于它封装的内容——你的工作流、你的经验、你的 SOP。这些来自于你,通过实际工作总结出来的。但是把这些转化为格式正确的 SKILL.md 文件?让 AI 来做。

你需要做的是:

  1. 清楚地思考你想解决什么问题
  2. 理清你的工作流
  3. 提供足够的上下文和参考资料

然后告诉 Claude:“帮我创建一个做 XXX 的技能。”它会为你生成格式正确的文件。

AI 原生思维

如果你需要自己手写技能,那你还不是真正的 AI 原生者。先解决你的 AI 工作流问题,然后使用技能来封装这些解决方案。让 AI 处理格式化。

分步指南:一个简单的例子

让我们创建一个技能,教 Claude 使用视觉图表和类比来解释代码。

1
创建技能目录

个人技能放在 ~/.claude/skills/。它们在你所有的项目中都可用。

2
编写 SKILL.md

或者更好——告诉 Claude 你想要什么,让它为你写文件。

3
测试两种调用方法

让 Claude 通过问“这段代码是如何工作的?”自动调用。或者直接使用 /explain-code。

~/.claude/skills/explain-code/SKILL.md
---
name: explain-code
description: 用视觉图表和类比解释代码。用于解释代码如何工作,教授代码库知识,或当用户问“这是如何工作的?”时使用。
---

When explaining code, always include:

1. **Start with an analogy**: Compare the code to something from everyday life
2. **Draw a diagram**: Use ASCII art to show flow, structure, or relationships
3. **Walk through the code**: Explain step-by-step what happens
4. **Highlight a gotcha**: What's a common mistake or misconception?

Keep explanations conversational. For complex concepts, use multiple analogies.

技能存放位置

位置决定范围:

位置 路径 适用于
个人 (Personal) ~/.claude/skills/<skill-name>/SKILL.md 你所有的项目
项目 (Project) .claude/skills/<skill-name>/SKILL.md 仅此项目
插件 (Plugin) <plugin>/skills/<skill-name>/SKILL.md 启用插件的地方
企业 (Enterprise) 托管设置 所有组织用户
💡

对于大多数用户: 使用个人目录 (~/.claude/skills/)。无论你在哪个项目中工作,你的技能都随处可用。

使用官方 skill-creator

Anthropic 提供了一个专门用于创建技能的技能。很 Meta,对吧?

告诉 Claude 安装它:

安装提示词
Install this skill, project address is: https://github.com/anthropics/skills/tree/main/skills/skill-creator

安装后,你可以简单地说:“帮我创建一个校对文章的技能”,Claude 就会使用 skill-creator 正确地生成所有内容。

将整个 GitHub 变成你的个人武库

这是事情变得令人兴奋的地方。这个技巧彻底改变了我对 AI 能力的思考方式。

这里的洞察是:在互联网的三十年里,无数杰出的开发者已经解决了你几乎能想象到的每一个问题。他们构建了工具,开源了它们,并让任何人都可以使用。唯一的问题?这些工具大多需要部署、命令行操作、环境设置——这些障碍阻挡了普通用户。

技能可以消除这些障碍。

核心概念

因为技能可以将脚本和指令打包在一起,你可以将整个开源项目封装成可调用的能力。那些经过数千用户多年打磨的久经考验的代码,变成了你 AI 工具箱的一部分。

💡

那些经典的开源项目——经过无数用户测试,多年打磨——远比你要求 AI 针对一次性需求从头编写的代码可靠得多。当轮子已经存在时,为什么要重新造轮子?

真实案例:视频下载

让我通过一个实际例子来演示。假设你经常需要从 YouTube、Bilibili 和其他平台下载视频。

第 1 步:找到合适的项目。 问任何 AI:“GitHub 上有没有开源项目可以从各种网站下载视频?”

它会指向 yt-dlp —— 一个拥有 143,000+ 星的传奇项目,支持数千个网站。

第 2 步:将其打包为技能。

给 Claude 的提示词
Help me package this open source tool https://github.com/yt-dlp/yt-dlp into a Skill, so that whenever I give a video link, it can help me download the video.

第 3 步:让 Claude 规划。 先使用 Plan 模式。Claude 会分析项目,了解其能力,并询问你关于偏好的澄清问题。

第 4 步:构建和测试。 切换到开发模式。几分钟内,你就会拥有一个工作的视频下载技能。

第 5 步:根据初次运行进行迭代。 第一次使用任何封装开源工具的技能时,你会遇到问题。YouTube 有反爬虫机制。你可能需要安装依赖。记录这些经验并告诉 Claude 更新技能。

初次运行后的更新
Update all these experiences into the video-downloader skill. Remember the Cookie requirement, the dependency installation, everything we just figured out.

下一次?打开并下载。瞬间完成。

更多 GitHub 转技能的想法

01

Pake

45K 星。将任何 Web 应用打包成轻量级桌面应用程序。一句话把你的 Web 项目变成可安装的 App。

02

FFmpeg + ImageMagick

传奇的格式转换工具。打包在一起成为万能格式工厂。再也不用使用那些可疑的在线转换器了。

03

ArchiveBox

以无数种格式保存任何网页。HTML, PDF, 截图, WARC — 作为技能的综合网页归档。

04

Manim

为 3Blue1Brown 视频提供动力的动画引擎。将其转化为生成数学解释动画的技能。

这些只是冰山一角。GitHub 托管着数百万个项目——几十年来的人类智慧,免费可用。

完整流程

  1. 确定需求
  2. 使用 AI 在 GitHub 上搜索解决方案
  3. 使用 AI + skill-creator 打包项目
  4. 初次运行:预见问题,记录解决方案
  5. 用学到的经验迭代技能
  6. 结果:你的武库中一个可靠的、久经考验的能力

你不需要三头六臂。你不需要头上长角。在你身后站着过去几十年全人类积累的知识。只要你想要——它就可以听你号令。

构建自我进化的技能管理系统

现在我们进入了我花了整整两天时间才弄清楚的领域。这是技能从“有用的工具”变成“有生命的、不断成长的能力”的地方。

问题:从 GitHub 项目打包的技能需要维护。原始仓库会更新。Bug 修复。新功能出现。同时,你一直在使用你的技能并积累经验——“这个参数更好用”,“添加这个标志来避免那个错误”。你如何管理这一切?

三件套解决方案

我构建了(在 AI 的帮助下)一组三个协同工作的技能来解决这个问题:

01

github-to-skills

skill-creator 的修改版,在打包时注入 GitHub 元数据(URL 和 commit hash)。这给了每个技能一个“身份”——我们确切知道它来自哪里以及是哪个版本。

02

skill-manager

你的技能库管家。查询所有已安装的技能,显示它们的类型和版本,检查 GitHub 更新,允许删除。把它想象成技能的包管理器。

03

skill-evolution-manager

自动从对话中捕捉经验并将其注入技能。当你解决一个 bug 时,它记录解决方案。当你发现更好的方法时,它也会记录下来。

版本控制问题

这是我一直遇到的冲突:当 GitHub 更新时,我想拉取最新的代码并重新生成 SKILL.md。但也我也一直在根据使用经验迭代我的技能——微调、修复、偏好。这些修改也存在于 SKILL.md 中。

两股力量,都在修改同一个文件,目标完全不同。灾难一触即发。

解决方案:evolution.json

洞察:分离关注点。

GitHub 更新继续重新生成基础 SKILL.md 文件。但所有积累的经验都存储在一个单独的 evolution.json 文件中。把它想象成游戏存档。无论主游戏更新到什么版本,你的存档文件都会保留你的进度。

当 SKILL.md 被新版本覆盖时,evolution.json 发挥作用——将积累的智慧重新注入到新鲜的技能中。

带有进化机制的技能目录
yt-dlp-skill/
├── SKILL.md           # 基础指令(可重新生成)
├── evolution.json     # 积累的经验(保留)
└── scripts/
    └── download.sh    # 执行脚本

管理飞轮

有了这三部分,技能管理变成了一个自我强化的循环:

  1. 使用 github-to-skills 从 GitHub 创建新技能(嵌入身份)
  2. 在日常工作中使用技能,遇到边缘情况和解决方案
  3. 通过 skill-evolution-manager 自动进化技能(捕捉解决方案)
  4. 通过 skill-manager 当 GitHub 仓库更新时更新基础技能
  5. 将进化数据合并回更新后的技能中(保留经验)

结果:真正学习和进步的技能。不是比喻——是实际上。每次你使用它们并解决问题,它们都会变得更聪明。

💡

这就是实践中持续进化的样子。你的 AI 不仅仅拥有技能——它拥有随着你成长的技能,在积累你的智慧的同时保持与开源世界的同步。

我在 https://github.com/KKKKhazix/Khazix-Skills 开源了这三件套。它并不完美,但很有效。它指向了一些强大的东西:明天的技能将不是静态文档。它们将是生命系统。

14 个官方技能宝藏清单

在构建自己的技能之前,先了解一下现有的资源。Anthropic 维护着一个官方技能库,完美地覆盖了常见需求。

所有技能位于:https://github.com/anthropics/skills

文档技能(闭源)

这些技能驱动着你在 Claude.ai 中看到的文档生成功能:

docx

Word 文档创建、编辑、分析。支持批注、修订跟踪、格式保留。让 Claude 写一份报告——得到一个实际的 .docx 文件。

xlsx

Excel 电子表格操作。公式、格式化、数据分析、可视化。适用于 .xlsx, .csv, .tsv 文件。

pptx

PowerPoint 创建和编辑。模板、图表、自动幻灯片生成。给出一个大纲,得到一个完整的演示文稿。

pdf

PDF 操作套件。文本提取、表格提取、合并/拆分、表单填写。表单填写能力特别强大。

开发技能(Apache 2.0 开源)

artifacts-builder

构建复杂的 Claude.ai Artifacts。React 18 + TypeScript + Tailwind + shadcn/ui。包含完整的初始化和打包脚本。

frontend-design

生成高质量的前端界面。明确避免“AI 垃圾(AI slop)”——那种大喊着“我是 AI 做的”通用紫色渐变和过度居中。

mcp-builder

创建 MCP 服务器的指南。支持 Python (FastMCP) 和 Node/TypeScript 解决方案。很好地连接了技能和 MCP。

webapp-testing

使用 Playwright 进行自动化测试。验证前端功能,调试 UI,截图,查看浏览器日志。

创意技能

algorithmic-art

用 p5.js 创作生成艺术。迷人的两步过程:首先创建“算法哲学”(.md),然后用代码表达它。支持随机种子以产生无限变体。

theme-factory

主题风格工厂。10 个内置预设(颜色 + 字体),适用于幻灯片、文档、报告、网页。

brand-guidelines

Anthropic 官方品牌规范。颜色、字体、使用规则。用作你自己的品牌技能的模板。

canvas-design

通过设计表达的视觉哲学。极简文字,最大视觉冲击。创建令人惊叹的 PDF 和 PNG。

沟通和 Meta 技能

internal-comms

内部沟通模板。状态报告、领导层更新、时事通讯、事件报告、项目更新。

skill-creator

创建你自己的技能的指南。元技能。告诉 Claude “帮我为 X 创建一个技能”,它就会接手。

安装方法

方法 1:自然语言

只需告诉 Claude:“安装这个技能,项目地址是:[GitHub URL]”

方法 2:插件市场

Claude Code 命令
# 添加官方仓库作为市场
/plugin marketplace add https://github.com/anthropics/skills

# 安装技能
/plugin install
# 切换到 Marketplace 标签,选择所需的包

方法 3:手动拖放

下载技能文件夹并将其放在你的技能目录中(个人用 ~/.claude/skills/,项目专用用 .claude/skills/)。

设计技能的艺术 - 深度拆解

作为一个做了多年 UX 设计的人,我发现官方设计技能特别迷人。让我拆解一下使它们如此有效的技巧。这些模式远不止适用于设计——它们是任何高质量技能的模板。

技巧 1:提升天花板

algorithmic-art 技能不是以“帮我用 p5.js 画画”开始的。它是这样开始的:

“算法哲学是计算美学运动,然后通过代码表达出来。”

这将任务从“生成作品”提升为“创建美学流派加上相应的算法系统”。它提醒模型,输出必须是系统性的,而不是一次性的灵感。

技巧 2:两阶段结构

两个设计技能都使用了两阶段方法:

  1. 首先,创建哲学(.md 中的概念框架)
  2. 然后,将其视觉化表达(实际实现)

这强制在实现之前进行抽象。模型不会陷入“写代码,调整数值”的局部最优。概念先行;代码只是表达。

技巧 3:诗意 + 工程模板

algorithmic-art 技能为哲学写作提供了结构:

哲学要素
Express how this philosophy manifests through:
- Computational processes and mathematical relationships
- Noise functions and randomness patterns
- Particle behaviors and field dynamics
- Temporal evolution and system states
- Parametric variation and emergent complexity

注意:每一点既是美学语言又是技术对象。“噪声函数”直接映射到代码。“粒子行为”是可实现的。这连接了愿景和执行。

技巧 4:概念种子

官方技能的一个绝妙洞察:

“概念是嵌入算法本身的微妙、小众的参考——不总是字面的,总是复杂的。像爵士音乐家通过算法和声引用另一首歌一样思考。”

用户主题应该嵌入在参数、行为、模式中——而不是写在屏幕上。致敬,但藏得深一点。懂的人会感觉到;不懂的人只会觉得它看起来不错。

技巧 5:带自由区的模板化

技能清楚地定义了什么是固定的(布局、品牌、控件)和什么是可变的(算法、参数、颜色)。这确保了:

  • 每个输出都有一致的 UI 体验
  • 模型确切知道它可以/不能修改哪里
  • 减少因过度创造性解释带来的意外“惊喜”

技巧 6:作为检查清单的工匠精神

canvas-design 技能将专业标准编码为可检查的规则:

  • 没有东西掉出页面
  • 没有东西重叠
  • 适当的边距没得商量
  • 文字总是极简的且视觉优先

这将隐性的专业知识转化为显性的行为约束。模型可以根据具体标准验证自己的工作。

技巧 7:减法,而不是加法

最后的润色步骤是天才之举:

“为了完善作品,避免添加更多图形;相反,完善已创建的内容。如果本能是调用新函数或绘制新形状,停下来。”

这编码了区分业余与专业的“最后 10% 工匠精神”。当本能说“加更多”时,反问:什么可以删除?什么可以对齐、合并、加强?

💡

设计技能模式总结: 提升定位(流派,而非作品)→ 两阶段(哲学,然后表达)→ 提供维度模板 → 嵌入概念作为 DNA → 定义固定/可变区域 → 将工匠精神编码为检查清单 → 最终通过减法,永不加法。

设计你的技能库架构

有了几十个技能,组织就很重要。我是这样思考如何构建可扩展的技能库架构的。

为什么要拆分技能?

人们经常问:“我不能只写一个做所有事情的大技能吗?”

不。三个理由:

01

按需加载

写作工作流包括选题、研究、起草、校对、插图。并非每次对话都需要所有步骤。拆分允许仅加载当前所需的内容。

02

精确触发

大技能的描述模糊。“用于写作”——但什么时候?选题算吗?修补错别字?小而专注的技能可以有精确的触发描述。

03

可组合性

小技能可以组合。“校对并配图”同时加载 AI-proofreading 和 image-illustration 技能。模块化带来灵活性。

技能类型模式

我发现了四种覆盖大多数用例的模式:

模式 结构 最适合
基于工作流 概述 → 决策树 → 步骤 1 → 步骤 2... 固定顺序的任务(文档处理、部署)
基于任务 概述 → 快速开始 → 任务 1 → 任务 2... 同一领域内的多个操作(PDF: 提取/合并/拆分)
参考/指南 概述 → 准则 → 规范 → 用法 标准(品牌指南、代码风格、写作规则)
基于能力 概述 → 核心能力 → 1, 2, 3... 系统能力(数据分析、产品管理)

我的写作技能系统

作为一个具体例子,这是我如何构建写作技能的:

P0 核心技能(每篇文章)

  • ai-proofreading: 三遍流程以降低 AI 检测率。触发词:“proofread”, “too AI”
  • image-illustration: 生成图片 + 上传到托管 + 返回 markdown。触发词:“illustrate”, 在校对之后

P1 常规技能(大多数文章)

  • topic-generator: 基于趋势生成话题想法。触发词:“give me topics”
  • long-to-x: 将长文转换为 Twitter 帖子。触发词:“convert to X content”
  • research-collector: 收集并整理研究材料。触发词:“research [topic]”

P2 偶发技能

  • headline-generator: 制作抓人眼球的标题。触发词:“title ideas”
  • seo-optimizer: 针对搜索引擎优化。触发词:“SEO”, “optimize for search”

技能中的错误处理

别忘了失败路径

一个好的技能包括:先检查什么。如果失败提示什么。如何返回上一步。明确写出 AI 在遇到问题时应该做什么。

爆炸式增长的技能生态系统

上个月我第一次研究技能时,只发现了几个仓库。现在?生态系统已经爆炸。有专门的市场、精选目录和成千上万的社区贡献技能。

官方起点

Anthropic 文档: https://code.claude.com/docs/en/skills

创建和使用技能的清晰、分步指南。

官方仓库: https://github.com/anthropics/skills

14 个官方技能加上示例。

Agent Skills 标准: https://agentskills.io

开放标准规范。如果你想了解完整的技术规范,从这里开始。

社区市场

skillsmp.com

60,000+ 技能。我发现的最大的市场。数量惊人。

skillstore.io

精致的界面,带有分类过滤。比批量仓库更容易浏览。

claudeskillhub.com

口号:“Supercharge Claude.” 专注于实用的、立即可用的技能。

skillsdirectory.org

50,000+ 技能,具有强大的搜索功能。

精选合集

smithery.ai/skills — 数量不多,但每一个都经过质量筛选。

GitHub 上的 awesome-claude-skills — 人工精选列表。高质量,更新频繁。

https://github.com/travisvn/awesome-claude-skills

多工具目录

mcpservers.org/claude-skills — 将 MCP 服务器和 Claude 技能放在一起。生态系统的独特视角。

claudemarketplaces.com — 市场的目录。“市场的市场”。

💡

增长率超过了所有人的预期。三个月前,“技能”还是一个新词。现在有十几个专门的网站和成千上万的贡献。这就是当创作门槛降得足够低时会发生的事情。

高级模式和专业技巧

对于那些准备深入研究的人,这里有我通过大量使用发现的模式。

动态上下文注入

!`command` 语法在技能内容到达 Claude 之前运行 shell 命令。输出替换占位符。

包含动态数据的 PR 摘要技能
---
name: pr-summary
description: Summarize changes in a pull request
context: fork
agent: Explore
---

## Pull request context
- PR diff: !`gh pr diff`
- PR comments: !`gh pr view --comments`
- Changed files: !`gh pr diff --name-only`

## Your task
Summarize this pull request...

命令在 Claude 看到任何东西之前执行。Claude 接收到的是带有实际数据的完全渲染的提示词。

Forked Execution (Subagent 集成)

添加 context: fork 以隔离运行技能。技能内容成为驱动 subagent 的提示词。

使用 Explore Agent 的研究技能
---
name: deep-research
description: Research a topic thoroughly
context: fork
agent: Explore
---

Research $ARGUMENTS thoroughly:

1. Find relevant files using Glob and Grep
2. Read and analyze the code
3. Summarize findings with specific file references

创建了一个新的隔离上下文。Subagent 拥有自己的会话。结果被汇总回你的主对话。

参数替换

使用 $ARGUMENTS 或位置参数 $0, $1 等将动态值传递给技能。

组件迁移技能
---
name: migrate-component
description: Migrate a component from one framework to another
---

Migrate the $0 component from $1 to $2.
Preserve all existing behavior and tests.

运行 /migrate-component SearchBar React Vue 会自动替换值。

只读模式

使用 allowed-tools 限制技能激活时 Claude 可以做什么:

安全探索技能
---
name: safe-reader
description: Read files without making changes
allowed-tools: Read, Grep, Glob
---

Explore and understand the codebase without modifying anything.

视觉输出生成

技能可以生成在浏览器中打开的交互式 HTML 文件。这种模式适用于:

  • 代码库可视化
  • 依赖图
  • 测试覆盖率报告
  • 数据库架构图
  • 任何受益于交互式探索的复杂数据

捆绑的脚本完成繁重的工作;Claude 进行编排。用户无需任何手动步骤即可获得丰富的视觉输出。

会话日志

使用 ${CLAUDE_SESSION_ID} 进行特定于会话的操作:

会话日志记录器技能
---
name: session-logger
description: Log activity for this session
---

Log the following to logs/${CLAUDE_SESSION_ID}.log:

$ARGUMENTS

Extended Thinking (深度思考) 触发器

💡

在你的技能内容的任何地方包含单词 "ultrathink",即可为复杂的推理任务启用扩展思考模式。

创造的状态

我想以一些个人的话结束。

每次我研究技能时,我都会回到 2013 年的夏天。我刚刚结束中考,用积蓄买了一台笔记本电脑。我花了整个夏天折腾《上古卷轴 5:天际》的 Mod——下载它们,组合它们,调整配置文件,看着我的游戏变成了完全属于我自己的东西。

那是纯粹的创造乐趣。不是消费内容。不是刷 Feed 流。而是真正地构建一些东西,定制一些东西,让一些东西变成我的。

技能带回了这种感觉。

指导的最酷状态不是有一个需要不断手把手教的油嘴滑舌的人。而是递给他们一套手册,看着他们翻阅、执行、自查并独立迭代。你说得更少;他们交付得更多。

技能正是如此。

今天你可能安装 skill-creator 并固化一个常见的动作——也许是筛选热点话题,将错误日志转化为修复计划,或者将链接转换为摘要。仅仅一个。

当它成功运行时,你会理解重用的价值。

明天你会想要第二个。后天,你会想把你所有的流程都搬进去。

在那一点上,你进入了一个不同的状态。

自由。创造的状态。

GitHub 上那些杰出的开源项目——几十年来人类智慧的结晶,免费共享。因为技能,因为 Agent,每一个普通人现在都可以驾驭这种力量。

你不需要三头六臂。你不需要超能力。在你身后站着人类积累的知识。只要你想要——它就是你的。

如果你把现在的自己和三年前的自己相比,还有可比性吗?看看你今天能做什么。看看你的能力边界扩展到了哪里。

这个让任何人都能成为超人的辉煌、宏伟的时代——难道不让你感到兴奋吗?

“未来属于那些学会将 AI 不仅仅作为工具,而是作为自身能力延伸来运用的人。技能是我们向 AI 自我传授我们所知一切的方式——甚至更多。”

最后更新:2026年1月 | 技能规范持续演进。请查看官方文档以获取最新特性。

讨论

0 条评论

留下评论

成为第一个分享您想法的人!