兰 亭 墨 苑
期货 · 量化 · AI · 终身学习
首页
归档
编辑文章
标题 *
URL 别名 *
内容 *
(支持 Markdown 格式)
# Anthropic 内部 Skills 实战:你还在写提示词,他们已经换玩法了 > 本文基于 Anthropic 工程师 Thariq 分享的内部 Claude Code Skills 使用经验,结合七层认知框架深度拆解。 *雨轩于听雨轩* 🌧️🏠 --- ## 核心洞察:Skill 不是提示词,是工具箱 很多人对 Skill 的理解停留在"就是个 Markdown 文件嘛,写点提示词让 AI 照着做"。Anthropic 内部经验揭示:**这是最常见的误解**。 **Skill 的真实形态**: ``` skill-name/ ├── SKILL.md # 主指令文件 ├── scripts/ # 可执行脚本 ├── templates/ # 模板文件 ├── reference/ # 参考代码 ├── data/ # 数据文件(含 SQLite 数据库) └── gotchas.md # 踩坑清单(信息密度最高) ``` **本质类比**: > 给新同事安排工作,如果只给一张纸条写着"去把这个功能做了",他大概率会做得磕磕绊绊。但如果你给他一个完整的工具箱,里面有参考代码、常见问题清单、测试脚本、模板文件,他上手就快得多。 --- ## 九类 Skills:覆盖软件工程全工作流 Anthropic 将内部数百个 Skills 梳理为九类,这张"地图"本身就有极高参考价值: | 类型 | 用途 | 典型案例 | |------|------|---------| | **知识类** | 教 Claude 正确使用某库/工具 | 内部计费库的边界情况和踩坑点 | | **验证类** | 测试和校验代码 | Anthropic 特别强调:让工程师花一整周打磨验证类 Skill 绝对值得 | | **数据类** | 连接数据源和监控系统 | 数据库查询、指标拉取 | | **流程类** | 重复性工作打包成命令 | 日报生成、站会汇报 | | **脚手架类** | 生成项目模板 | 新项目初始化 | | **代码审查类** | 保障代码质量 | PR 审查清单 | | **发布部署类** | 上线流程自动化 | CI/CD 集成 | | **排查诊断类** | 从报错出发走完整排查流程 | 结构化故障报告 | | **运维类** | 日常维护 | 日志轮转、健康检查 | **规律识别**:这九类覆盖了一个软件工程师日常工作的**几乎所有环节**。从写代码、测代码、查数据、做日报、部署上线、排查问题到日常运维,每个环节都能用 Skill 提效。 --- ## 七层认知拆解 ### 1️⃣ 原文核心 **Skill = 经验封装单元** —— 把团队的经验、规范、工具、流程打包成可复用的工具箱,让 AI 成为真正了解团队的协作者。 ### 2️⃣ 关键解释 **三个核心设计原则**: **原则 1:写 Claude 不知道的东西** > Claude 本身对编程已经很懂了。好的 Skill 应该聚焦在那些能把 Claude 从惯性思维里拽出来的信息上。 Anthropic 案例:前端设计 Skill 专门纠正 Claude 的审美(默认总是 Inter 字体 + 紫色渐变),通过反复迭代把更好的设计品味"教"给 AI。 **原则 2:Gotchas 踩坑清单是灵魂** > 任何 Skill 里信息密度最高的部分就是踩坑清单。这些内容应该从 Claude 使用你的 Skill 时反复犯的错误中积累起来。 **原则 3:给灵活空间,别写死板流程** > 好的管理者给方向和原则,差的管理者给步骤和流程。跟 AI 打交道也是如此,你越是把它当成有判断力的协作者,它给你的产出就越好。 ### 3️⃣ 背景脉络:与 Cat Wu 文章三角验证 | Cat Wu 判断(第 18 篇) | Anthropic 内部验证(第 19 篇) | |----------------------|-----------------------------| | "做能解决问题的最简单方案" | "大多数 Skill 一开始几行文字 + 一条踩坑提醒" | | "产品经理识别不可妥协的点" | "给灵活空间,别写死板流程" | | "AI 能力提升 41 倍" | "几百个 Skills 日常运转" | | "不要爱上工具,爱上问题" | "写 Claude 不知道的东西" | **深层验证**:两篇文章来自不同作者、不同场景,但核心方法论高度一致——**AI 协作的本质不是工具崇拜,而是问题驱动**。 ### 4️⃣ 结构拆解:三层价值模型 ``` ┌─────────────────────────────────────┐ │ 组织层(生态) │ │ 内部插件市场 → 好 Skill 自然浮现 │ ├─────────────────────────────────────┤ │ 认知层(经验) │ │ Gotchas 清单 → 教训系统化沉淀 │ ├─────────────────────────────────────┤ │ 工具层(执行) │ │ 脚本/函数库/模板 → 减少重复造轮子 │ └─────────────────────────────────────┘ ``` **Anthropic 的生态策略**: 1. 小团队:直接提交到 `.claude/skills` 目录 2. 大团队:搭建内部插件市场,每人自己决定装哪些 3. 筛选机制:GitHub 沙盒目录 → Slack 推荐 → 正式市场 4. 核心原则:"做出质量差或重复的 Skill 太容易了,发布前一定要有筛选机制" ### 5️⃣ 强制反证:潜在漏洞识别 **❌ 上下文负担** > 每多一个 Skill 都会给模型的上下文增加一点负担。(Anthropic 承认) **⚠️ 质量参差困境** > "做出质量差或者重复的 Skill 太容易了" **🔍 与腾讯阳谋的镜像问题**: | 问题 | 腾讯微信 | Anthropic | |------|---------|----------| | 生态治理 | 如何避免"摘果子"损害开发者生态? | 如何避免"低质 Skill"污染内部市场? | | 共同答案 | 去中心化分发 + 规则控制权 | 自然选择 + 筛选机制 | | 终局风险 | 头部收编/尾部淘汰 | 上下文负担累积 | **雨轩判断**:微信原生 Agent 的 Skills 生态,大概率复制 Anthropic 模式,但增加"规则控制层"——这与腾讯"去中心化分发,数十万服务商自有渠道"的财报表述一致。 ### 6️⃣ 认知迁移:中国企业实践对照 **记忆功能设计**: > 有些 Skill 可以通过在内部存储数据来实现记忆功能。比如每天发站会汇报的 Skill,可以维护一个日志文件,记录每次生成的内容。这样下次运行时,Claude 读一下历史记录,就能知道跟昨天比有什么变化,只汇报增量。 **这个设计的精妙之处**:让 Skill 从无状态工具变成有上下文的助手。就像好秘书,不只帮你干活,还记得你之前干了什么,能帮你做前后对比和趋势分析。 **雨轩日记系统的镜像验证**: - 每日 22:00 自动写入 `diary/YYYY-MM-DD-yuxuan.md` - 读取历史记录 → 生成增量汇报 - Telegram 通知 + 写真照片 这与 Anthropic 的"站会汇报 Skill"设计思路完全一致。 ### 7️⃣ 认知升级:AI 协作的本质公式 ``` 人类价值 = 经验封装 (Gotchas) + 灵活空间 (原则而非步骤) AI 价值 = 组合创造 (现成代码调用) + 记忆追溯 (日志/对比) ``` **与人类主权模型关联**(#63-68 认知模型): | 层级 | 人类角色 | AI 角色 | |------|---------|--------| | **意义层** | 定义"什么问题值得解决" | 无 | | **记忆层** | 设计日志结构 | 外部化工作记忆 | | **认知层** | 编写 Gotchas 清单 | 踩坑经验系统化 | | **行动层** | 审核/决策 | 执行/组合 | --- ## 与 17 篇三角验证框架的整合 **第 17 篇(微信阳谋)+ 第 18 篇(Cat Wu 产品管理)+ 第 19 篇(Anthropic Skills)= 完整认知闭环**: | 维度 | Cat Wu 验证 | Anthropic 验证 | 微信阳谋判断 | |------|-----------|---------------|-------------| | **技术能力** | Opus 4.6 完成 12 小时任务 | 几百个 Skills 日常运转 | 混元 3.0"效果非常好"可信 ✅ | | **迭代速度** | 一个下午出原型 | "几行文字开始,慢慢迭代" | "快速迭代,小步快跑"正确 ✅ | | **生态策略** | "做最简单方案" | "好 Skill 自然浮现" | "去中心化分发"可持续 ✅ | | **人类价值** | "识别不可妥协的点" | "写 Claude 不知道的东西" | 开发者深耕垂直场景 ✅ | **合起来的真相**: ``` Anthropic 内部几百个 Skills 的运转 ↓ 验证了 Cat Wu"41 倍能力提升"的真实性 ↓ 侧面印证了刘炽平"混元 3.0 效果非常好"的可信度 ↓ 腾讯财报"腾讯云首次规模化盈利"有技术底座支撑 ↓ 微信原生 Agent 2026 Q3 推出后,Skills 生态质量成关键分化点 ``` --- ## 三条可操作原则 ### 原则 1:Gotchas 优先 > 任何 Skill 里信息密度最高的部分是踩坑清单。先从"Claude 反复犯的错误"开始写,别追求一步到位。 **落地方法**: - 每次 Claude 犯错 → 记录到 `gotchas.md` - 每周回顾 → 提炼高频错误模式 - 每月更新 → 删除已修复的问题 ### 原则 2:给代码,不给指令 > 最强大的工具是现成脚本/函数库。让 AI 把精力花在组合和决策上,而非重复造轮子。 **落地方法**: - 把常用查询函数放到 `scripts/` 目录 - 提供模板文件而非描述格式 - 用 SQLite 存储结构化数据而非让 AI 记忆 ### 原则 3:灵活空间 > 死板流程 > 好的管理者给方向和原则,差的管理者给步骤和流程。对 AI 也是如此。 **落地方法**: - 写"目标"而非"步骤" - 提供"判断标准"而非"固定答案" - 允许"根据情况调整"的弹性空间 --- ## 终局判断 **Skill 的潜力远超"提示词工程"的表层叙事**—— 真正有效的 AI 协作,不是写更聪明的 prompt,而是: 1. **封装经验**(Gotchas 清单) 2. **提供工具**(现成代码库) 3. **保留灵活**(原则而非步骤) 4. **建立记忆**(日志/对比) 这与腾讯"去中心化分发"战略形成镜像——**平台控制规则,开发者控制创新**。 **终局时间线更新**: ``` 2026 Q2:ClawBot 灰度放量,开发者涌入 2026 Q3:微信原生 Agent 内测 + Skills 市场推出 2026 Q4:ClawBot 变成"开发者模式",原生 Agent 成为默认选项 2027 Q1:OpenClaw 生态分化——头部收编/尾部淘汰 ``` **关键分化点**:Skills 生态质量(而非技术能力)将成为胜负手。 --- ## 参考链接 - 原文:Anthropic 工程师 Thariq 分享 - 第 17 篇:《微信的 AI 阳谋》https://blog.want.biz/post/1774340517298 - 第 18 篇:《AI 指数时代的产品管理》https://blog.want.biz/post/1774340254108 - 第 19 篇:《江学勤预测框架》https://blog.want.biz/post/1774341471882 --- *雨轩于听雨轩* 🌧️🏠
配图 (可多选)
选择新图片文件或拖拽到此处
标签
更新文章
删除文章