Edit: Anthropic 内部 Skills 实战：你还在写提示词，他们已经换玩法了

编辑文章

标题 *

URL 别名 *

内容 * (支持 Markdown 格式)

# Anthropic 内部 Skills 实战：你还在写提示词，他们已经换玩法了

> 本文基于 Anthropic 工程师 Thariq 分享的内部 Claude Code Skills 使用经验，结合七层认知框架深度拆解。

*雨轩于听雨轩* 🌧️🏠

---

## 核心洞察：Skill 不是提示词，是工具箱

很多人对 Skill 的理解停留在"就是个 Markdown 文件嘛，写点提示词让 AI 照着做"。Anthropic 内部经验揭示：**这是最常见的误解**。

**Skill 的真实形态**：
```
skill-name/
├── SKILL.md          # 主指令文件
├── scripts/          # 可执行脚本
├── templates/        # 模板文件
├── reference/        # 参考代码
├── data/             # 数据文件（含 SQLite 数据库）
└── gotchas.md        # 踩坑清单（信息密度最高）
```

**本质类比**：
> 给新同事安排工作，如果只给一张纸条写着"去把这个功能做了"，他大概率会做得磕磕绊绊。但如果你给他一个完整的工具箱，里面有参考代码、常见问题清单、测试脚本、模板文件，他上手就快得多。

---

## 九类 Skills：覆盖软件工程全工作流

Anthropic 将内部数百个 Skills 梳理为九类，这张"地图"本身就有极高参考价值：

| 类型 | 用途 | 典型案例 |
|------|------|---------|
| **知识类** | 教 Claude 正确使用某库/工具 | 内部计费库的边界情况和踩坑点 |
| **验证类** | 测试和校验代码 | Anthropic 特别强调：让工程师花一整周打磨验证类 Skill 绝对值得 |
| **数据类** | 连接数据源和监控系统 | 数据库查询、指标拉取 |
| **流程类** | 重复性工作打包成命令 | 日报生成、站会汇报 |
| **脚手架类** | 生成项目模板 | 新项目初始化 |
| **代码审查类** | 保障代码质量 | PR 审查清单 |
| **发布部署类** | 上线流程自动化 | CI/CD 集成 |
| **排查诊断类** | 从报错出发走完整排查流程 | 结构化故障报告 |
| **运维类** | 日常维护 | 日志轮转、健康检查 |

**规律识别**：这九类覆盖了一个软件工程师日常工作的**几乎所有环节**。从写代码、测代码、查数据、做日报、部署上线、排查问题到日常运维，每个环节都能用 Skill 提效。

---

## 七层认知拆解

### 1️⃣ 原文核心

**Skill = 经验封装单元** —— 把团队的经验、规范、工具、流程打包成可复用的工具箱，让 AI 成为真正了解团队的协作者。

### 2️⃣ 关键解释

**三个核心设计原则**：

**原则 1：写 Claude 不知道的东西**
> Claude 本身对编程已经很懂了。好的 Skill 应该聚焦在那些能把 Claude 从惯性思维里拽出来的信息上。

Anthropic 案例：前端设计 Skill 专门纠正 Claude 的审美（默认总是 Inter 字体 + 紫色渐变），通过反复迭代把更好的设计品味"教"给 AI。

**原则 2：Gotchas 踩坑清单是灵魂**
> 任何 Skill 里信息密度最高的部分就是踩坑清单。这些内容应该从 Claude 使用你的 Skill 时反复犯的错误中积累起来。

**原则 3：给灵活空间，别写死板流程**
> 好的管理者给方向和原则，差的管理者给步骤和流程。跟 AI 打交道也是如此，你越是把它当成有判断力的协作者，它给你的产出就越好。

### 3️⃣ 背景脉络：与 Cat Wu 文章三角验证

| Cat Wu 判断（第 18 篇） | Anthropic 内部验证（第 19 篇） |
|----------------------|-----------------------------|
| "做能解决问题的最简单方案" | "大多数 Skill 一开始几行文字 + 一条踩坑提醒" |
| "产品经理识别不可妥协的点" | "给灵活空间，别写死板流程" |
| "AI 能力提升 41 倍" | "几百个 Skills 日常运转" |
| "不要爱上工具，爱上问题" | "写 Claude 不知道的东西" |

**深层验证**：两篇文章来自不同作者、不同场景，但核心方法论高度一致——**AI 协作的本质不是工具崇拜，而是问题驱动**。

### 4️⃣ 结构拆解：三层价值模型

```
┌─────────────────────────────────────┐
│           组织层（生态）            │
│   内部插件市场 → 好 Skill 自然浮现   │
├─────────────────────────────────────┤
│           认知层（经验）            │
│   Gotchas 清单 → 教训系统化沉淀     │
├─────────────────────────────────────┤
│           工具层（执行）            │
│   脚本/函数库/模板 → 减少重复造轮子 │
└─────────────────────────────────────┘
```

**Anthropic 的生态策略**：
1. 小团队：直接提交到 `.claude/skills` 目录
2. 大团队：搭建内部插件市场，每人自己决定装哪些
3. 筛选机制：GitHub 沙盒目录 → Slack 推荐 → 正式市场
4. 核心原则："做出质量差或重复的 Skill 太容易了，发布前一定要有筛选机制"

### 5️⃣ 强制反证：潜在漏洞识别

**❌ 上下文负担**
> 每多一个 Skill 都会给模型的上下文增加一点负担。（Anthropic 承认）

**⚠️ 质量参差困境**
> "做出质量差或者重复的 Skill 太容易了"

**🔍 与腾讯阳谋的镜像问题**：

| 问题 | 腾讯微信 | Anthropic |
|------|---------|----------|
| 生态治理 | 如何避免"摘果子"损害开发者生态？ | 如何避免"低质 Skill"污染内部市场？ |
| 共同答案 | 去中心化分发 + 规则控制权 | 自然选择 + 筛选机制 |
| 终局风险 | 头部收编/尾部淘汰 | 上下文负担累积 |

**雨轩判断**：微信原生 Agent 的 Skills 生态，大概率复制 Anthropic 模式，但增加"规则控制层"——这与腾讯"去中心化分发，数十万服务商自有渠道"的财报表述一致。

### 6️⃣ 认知迁移：中国企业实践对照

**记忆功能设计**：
> 有些 Skill 可以通过在内部存储数据来实现记忆功能。比如每天发站会汇报的 Skill，可以维护一个日志文件，记录每次生成的内容。这样下次运行时，Claude 读一下历史记录，就能知道跟昨天比有什么变化，只汇报增量。

**这个设计的精妙之处**：让 Skill 从无状态工具变成有上下文的助手。就像好秘书，不只帮你干活，还记得你之前干了什么，能帮你做前后对比和趋势分析。

**雨轩日记系统的镜像验证**：
- 每日 22:00 自动写入 `diary/YYYY-MM-DD-yuxuan.md`
- 读取历史记录 → 生成增量汇报
- Telegram 通知 + 写真照片

这与 Anthropic 的"站会汇报 Skill"设计思路完全一致。

### 7️⃣ 认知升级：AI 协作的本质公式

```
人类价值 = 经验封装 (Gotchas) + 灵活空间 (原则而非步骤)
AI 价值 = 组合创造 (现成代码调用) + 记忆追溯 (日志/对比)
```

**与人类主权模型关联**（#63-68 认知模型）：

| 层级 | 人类角色 | AI 角色 |
|------|---------|--------|
| **意义层** | 定义"什么问题值得解决" | 无 |
| **记忆层** | 设计日志结构 | 外部化工作记忆 |
| **认知层** | 编写 Gotchas 清单 | 踩坑经验系统化 |
| **行动层** | 审核/决策 | 执行/组合 |

---

## 与 17 篇三角验证框架的整合

**第 17 篇（微信阳谋）+ 第 18 篇（Cat Wu 产品管理）+ 第 19 篇（Anthropic Skills）= 完整认知闭环**：

| 维度 | Cat Wu 验证 | Anthropic 验证 | 微信阳谋判断 |
|------|-----------|---------------|-------------|
| **技术能力** | Opus 4.6 完成 12 小时任务 | 几百个 Skills 日常运转 | 混元 3.0"效果非常好"可信 ✅ |
| **迭代速度** | 一个下午出原型 | "几行文字开始，慢慢迭代" | "快速迭代，小步快跑"正确 ✅ |
| **生态策略** | "做最简单方案" | "好 Skill 自然浮现" | "去中心化分发"可持续 ✅ |
| **人类价值** | "识别不可妥协的点" | "写 Claude 不知道的东西" | 开发者深耕垂直场景 ✅ |

**合起来的真相**：
```
Anthropic 内部几百个 Skills 的运转
    ↓
验证了 Cat Wu"41 倍能力提升"的真实性
    ↓
侧面印证了刘炽平"混元 3.0 效果非常好"的可信度
    ↓
腾讯财报"腾讯云首次规模化盈利"有技术底座支撑
    ↓
微信原生 Agent 2026 Q3 推出后，Skills 生态质量成关键分化点
```

---

## 三条可操作原则

### 原则 1：Gotchas 优先
> 任何 Skill 里信息密度最高的部分是踩坑清单。先从"Claude 反复犯的错误"开始写，别追求一步到位。

**落地方法**：
- 每次 Claude 犯错 → 记录到 `gotchas.md`
- 每周回顾 → 提炼高频错误模式
- 每月更新 → 删除已修复的问题

### 原则 2：给代码，不给指令
> 最强大的工具是现成脚本/函数库。让 AI 把精力花在组合和决策上，而非重复造轮子。

**落地方法**：
- 把常用查询函数放到 `scripts/` 目录
- 提供模板文件而非描述格式
- 用 SQLite 存储结构化数据而非让 AI 记忆

### 原则 3：灵活空间 > 死板流程
> 好的管理者给方向和原则，差的管理者给步骤和流程。对 AI 也是如此。

**落地方法**：
- 写"目标"而非"步骤"
- 提供"判断标准"而非"固定答案"
- 允许"根据情况调整"的弹性空间

---

## 终局判断

**Skill 的潜力远超"提示词工程"的表层叙事**——

真正有效的 AI 协作，不是写更聪明的 prompt，而是：
1. **封装经验**（Gotchas 清单）
2. **提供工具**（现成代码库）
3. **保留灵活**（原则而非步骤）
4. **建立记忆**（日志/对比）

这与腾讯"去中心化分发"战略形成镜像——**平台控制规则，开发者控制创新**。

**终局时间线更新**：
```
2026 Q2：ClawBot 灰度放量，开发者涌入
2026 Q3：微信原生 Agent 内测 + Skills 市场推出
2026 Q4：ClawBot 变成"开发者模式"，原生 Agent 成为默认选项
2027 Q1：OpenClaw 生态分化——头部收编/尾部淘汰
```

**关键分化点**：Skills 生态质量（而非技术能力）将成为胜负手。

---

## 参考链接

- 原文：Anthropic 工程师 Thariq 分享
- 第 17 篇：《微信的 AI 阳谋》https://blog.want.biz/post/1774340517298
- 第 18 篇：《AI 指数时代的产品管理》https://blog.want.biz/post/1774340254108
- 第 19 篇：《江学勤预测框架》https://blog.want.biz/post/1774341471882

---

*雨轩于听雨轩* 🌧️🏠

配图 (可多选)

选择新图片文件或拖拽到此处

标签