万字长文:做了些爆款 Skills 以后,我对 Skills 的看法

作者:歸藏(guizang.ai) (@op7418) 来源:https://x.com/op7418/status/2065232309310427565 发布时间:2026-06-12T00:38:47.000Z

封面

如果看不完的话,可以先帮忙点个赞,收藏一下以后看,感谢。

图 1

我最近几次聊 Skills,有一个越来越明确的判断:

大家现在都在说 Agent,但大多数人其实还没有真正理解 Agent。

大众理解里的 Agent,往往还是一个聊天框。

你输入一句话,它回答一段文字;你再输入一句,它继续回答。

这个视角下,AI 好像天然会带来一种平权:以前不会写代码的人可以写代码,不会做 PPT 的人可以做 PPT,不会剪视频的人可以剪视频。

只要模型足够强,大家的能力差距就会被抹平。

但我越来越觉得,这个判断是错的。Agent 不是简单抹平能力差距,而是在放大能力差距。

图 2

头部用户已经默认理解 Agent 的组成:

文档、规则、memory、loop、MCP、CLI、工具调用、权限、安全沙箱、上下文工程、定时任务、心跳、文件系统、代码执行和 Skill。

但普通用户只知道“Agent 能写代码”“Agent 可以调用 Skill”,并不知道 Agent 的上限从哪里来,也不知道自己应该如何组织目标、资料和流程,才能让 Agent 真正工作。

Agent:这里指的不只是聊天机器人,而是能理解目标、规划步骤、调用工具并持续执行任务的 AI 系统。

Memory:Agent 用来保存长期偏好、项目状态和历史决策的外部记忆,不等同于模型训练记忆。

Loop:Agent 反复“思考、调工具、观察结果、再决定下一步”的执行循环。

这里就出现了一个很大的认知割裂:头部用户已经在搭系统,普通用户还在问聊天框。

目标清晰、上下文好、品味和判断强的人,会被 Agent 放大;

目标混乱、没有文档、没有判断的人,也会被 Agent 放大混乱。

所以用户会出现 K 型分化。去年还可以靠产品设计、交互设计和用户教育降低一些门槛,今年我觉得已经很难靠简单 UX 弥合这个差距。

图 3

Skill 则可以弥合 Agent 使用能力差距。

Skill 是能力商品,不只是提示词

我现在对 Skill 的一句话定义是:

Skill 是把专家经验、工作流、品味和工具调用封装成可分发、可复用、可迭代的 Agent 能力单元。

Skill:把提示词、流程、工具调用、模板、脚本、边界和经验打包起来的可复用能力单元。

图 4

它不是单纯的提示词,也不是传统意义上的 App。

它更像 Agent 时代的“能力商品”。用户不需要理解底层的 MCP、CLI、workflow、memory、loop、模型选择、代码执行和上下文工程,只需要知道:

它解决什么问题,产出什么结果,怎么使用,别人用得怎么样。

提示词本身很难成为产品。它容易被复制,难以分发,没有版本管理,也缺少安装和调用语义。

Skill 把提示词、规则、示例、工具调用、文件结构、脚本、依赖和使用说明打包起来,让它变成一个可以安装、调用、迭代和传播的能力包。

所以 Skill 和 Prompt 本质上并非完全不同,但 Skill 的调用效率更高,分发和理解成本更低,也能承载更多工程化内容。

更重要的是,很多任务并不是一句提示词能解决的。

它们是一组稳定流程:读取材料,分析需求,选择模板,调用工具,生成产物,验证结果,修复问题,导出文件。

Skill 把这套流程从一次性对话中抽出来,变成可以反复调用的工作流。

图 5

比如 **PPT Skill **的流程不是“生成 PPT”这么简单。

它要读取文章或大纲,询问主题、页数和配图,选择主题、颜色和版式,生成 HTML PPT,自动后验检查常见问题,再修正缺属性、未居中、溢出、图片裁切、节奏重复等问题,必要时还要调用图像模型生成配图,最后输出可演示、可分享的文件。

图 6

这背后真正有价值的,是 Skill 把人的演示经验被外化了。

Skill 的核心,是把人的经验外化

我做的设计类 Skill 很能说明这一点。

真正有价值的部分是把人的审美、版式判断、设计系统经验、模板选择、图片裁切规则、明暗遮罩规则、字体和颜色规则固化进去。

这要求创作者同时懂三件事:传统专业知识,AI 的上下限,以及产品化思维。

传统专业知识决定你知道什么结果算好。比如设计、剪辑、写作、健身、法律、商业化投放,每个行业都有大量隐性判断。AI 的上下限决定你知道模型什么能做、什么做不稳、什么必须工程化兜底。

产品化思维决定你知道用户场景、使用门槛、反馈路径和稳定性要求。

图 7

这也是我做几个 Skill 时最深的体会。

PPT Skill 最开始不是为了“做一个 Skill”,是因为我真的要做一场分享。

第一版基本成型后,我通过五六轮对话调整间距、字号、字体、颜色、配图、重复内容、WebGL 背景等问题。

讲完之后发现大家最关心的不是分享本身,而是 PPT 怎么做,于是才把这套模板和流程沉淀成 Skill。

**社交媒体卡片 Skill** 也不是凭空抽象出来的。它来自非常具体的内容分发需求:

3:4 竖版图文卡片,适配小红书、公众号、Twitter 等不同场景。它要处理 11 类内容,两套视觉系统,28 个版式骨架,真实图片 + Coding 排版,还要规避 AI 图限流、文字不锐利、平台风格不匹配等问题。

图 8

**Logo Generator Skill** 也是同一逻辑。它没有直接让图像模型一把梭生成 Logo,因为图片模型的文字、结构和可编辑性不稳定。

它选择先生成 SVG Logo 变体,再生成展示图和 WebGL 背景,把 Logo 本体、展示场景和交互背景拆成不同层,分别用最适合的技术处理。

图 9

**AI Desk Card **则说明 Skill 的边界可以扩展到物理环境。

它让 Agent 接管屏幕边缘的物理信息位:固件烧录、Wi-Fi 配置、信息推送、定时任务、memory、todo、日历、GitHub 展示、墨水屏刷新,都可以被封装成一套 Skill。

图 10

这些案例共同说明:Skill 和核心是“人把什么经验变成了可调用的能力”。

图 11

用户不关心概念,用户关心结果

对普通用户来说,Skill、MCP、CLI、Plugin 叫什么并不重要。

他们关心的是:这个功能能解决什么问题,适合什么场景,我点一下能不能用,需要输入什么材料,结果长什么样,别人用得怎么样。

MCP:Model Context Protocol,可以理解为让 AI 以统一方式连接外部工具、数据源和服务的协议。

CLI:Command Line Interface,命令行工具;对 Agent 来说,它常常是比图形界面更稳定、更容易自动化的操作入口。

因此,面向用户的产品层不应该堆术语。Codex 把很多东西统一叫插件,我觉得就是一个正确方向:弱化概念,强调功能。

底层可以是 Skill、MCP、CLI 或原生 Plugin;用户只需要知道它能干什么。

图 12

但对产品和创作者来说,这些底层形态的区别又很重要。

Skill 适合承载相对垂直、可描述、可复用的工作,比如 PPT、社交媒体卡片、文章配图、写作润色、视频包装、简历优化、数据可视化、某个行业 SOP。

MCP 更适合 Agent 架构中的原子服务和上下文连接,比如地图、浏览器、网盘、设计稿、数据库、企业 API。

CLI 则是目前很现实的通用 Plugin 形态:命令行、代码、Skill 都可以封装进去,也不绑定单一 Agent 平台。

飞书 CLI 就是一个很好的例子。用户不用理解 200 多条命令,也不用知道背后是哪个 API。

他只需要说“帮我把今天的智能纪要拉到笔记里”,Agent 背后可以搜索云文档、读取妙记、下载逐句转写、写入本地 Markdown、建立反向链接。

用户看到的是结果,Agent 用的是工具,Skill 封装的是流程。

图 13

这也是为什么 Skill、CLI 和 MCP 的关系不能只从技术概念上理解。

它们最终都要落到一个问题:怎么让普通用户用上头部用户已经验证过的能力。

好 Skill 的架构:中心短,辐射厚

很多人会把 Skill 理解成一个 SKILL.md 文件,这只说对了一半。

SKILL.md:很多 Skill 的入口说明文件,用来告诉 Agent 什么时候加载这个能力、按什么流程执行、哪些坑不能踩。

好的 Skill 往往是一个目录。SKILL.md 只是入口,旁边还可以有 scripts/、references/、assets/、模板、schema、配置文件、子 Skill 和特殊案例。

复杂 Skill 不怕有复杂内容,怕的是把复杂内容一次性塞给模型。文件系统本身就是一种上下文工程。

上下文窗口:AI 一次能“看见”和处理的信息范围,文档、代码、聊天记录和工具说明都会占用它。

好 Skill 的信息架构应该是“中心短,辐射厚”。

SKILL.md 只放高信号流程和判断;references/ 放重文档和领域材料,按条件读取;scripts/ 放确定性逻辑,让 Agent 调用而不是重写;assets/ 放模板、schema、示例、字体、主题和版式骨架;配置文件或稳定数据目录放首次配置、偏好和历史记录。

图 14

这里有个很关键的点:Skill 的 description 不是宣传语,也不是功能摘要,是路由触发器。

好的 description 应该描述用户什么时候需要它,最好来自真实用户表达;坏的 description 只是解释“这个 Skill 做什么”。

比如一个 PPT Skill,不应该写“这个 Skill 可以生成漂亮 PPT”。

它应该写“当用户需要把文章、大纲或演讲内容转成可演示 HTML PPT 时加载”。前者是广告,后者是 Agent 的判断条件。

这能解释为什么“把所有能力塞进一个大 Agent”不是好方向。

大而全的 harness 会把工具定义、协议细节和长文档塞满上下文,带来更高延迟、更高 token 成本和更多误用。

反过来,薄 harness 只提供最小运行环境,Skill 作为按需加载的能力包,才能让系统长期复利。

Harness:运行 Agent 的外层程序,负责模型循环、文件读写、上下文管理和安全边界。

更稳的架构是 Thin Harness, Fat Skills:harness 保持薄,负责跑模型循环、读写文件、管理上下文、执行权限和安全边界;

Skill 变厚,承载流程、判断、领域知识、模板、脚本、资产、gotchas 和 eval;

确定性工具下沉给 CLI、scripts 或 API;模型留在理解、判断、综合、取舍和表达这些更适合它的部分。

Thin Harness, Fat Skills:让 Agent 底层运行环境保持轻,把具体流程、领域知识、模板、脚本和失败经验放进按需加载的 Skill 里。

图 15

Skill 质量要像代码质量一样维护

好 Skill 不是一次写完。它需要维护,而且要像代码质量一样维护。

一个比较可靠的生命周期是:

先用无 Skill 的 Agent 跑真实任务,找到它会错在哪里;

基于真实 query 写 eval,包括正例、反例和 forbidden load;

先调 description,确保该加载时加载,不该加载时不加载;

写主体时删除显而易见的内容,只保留会改变模型行为的判断;

把失败案例追加到 gotchas,而不是不断加长主流程;改 description 或路由边界时补 eval;

再做跨模型测试,看不同编排模型对 Skill 触发和执行的差异。

Eval:用一组真实或模拟任务测试 Skill 是否按预期触发、执行和交付结果。

Gotchas:从真实失败里总结出来的“别这么做”清单,往往比正向说明更能提升 Skill 稳定性。

图 16

这里有一个很重要的原则:每个 Skill 都是一种税。

它进入索引后,每个会话、每个用户都在为它的 name 和 description 付上下文成本;

它被加载后,后续对话都在为主体内容付成本。

所以每一句都要问:没有这句,Agent 会不会做错?如果不会,就删。

gotchas 是最高价值内容,因为它们来自真实失败。

正向原则往往模型已经知道,负面边界才是专家经验。

设计 Skill 中“不要纯白纯黑”“连续三页相同节奏是 P0 错误”“文字不能压脸”“AI 图只在无合适真实图时使用”,都属于 gotchas 或强约束。

图 17

这也解释了为什么完全自动生成 Skill 只能做初稿。

模型可以帮你起草结构,但它无法凭空拥有你的失败样本、审美判断、行业边界和用户反馈。

真正有价值的是人把经验注入进去,再通过 eval 和 gotchas 让它持续变厚。

设计 Skill 的本质:把品味变成约束

设计类 Skill 不是简单的“AI 会画图”。

它需要解决模型不稳定、图像限流、文字不锐利、排版不可控、风格一致性难判断等问题。

我现在越来越觉得,设计 Skill 的核心是把专业品味变成模型可执行的限制。

模型默认会收敛到一些平庸模式:

Tailwind 大色块、紫色渐变、emoji 堆砌、Inter 字体、发光、过度圆角、无意义动效、信息密度失控。这不是模型没有审美素材,而是没有稳定的取舍原则。

所以设计 Skill 里最有价值的是主观但明确的约束:

不使用纯白和纯黑,降低刺眼和廉价感;

不让用户任意输入 hex,只提供经过验证的主题色板;

不用紫色多彩渐变、发光和大面积 blur 作为主视觉捷径;

动画只在必要时使用,且只动 transform 和 opacity;

图文卡片优先真实摄影和截图美化,AI 生图只是兜底;

版式骨架先被人工验证,AI 负责填充、组合和微调;文

字必须根据图像主体、明度和可读区域自适应落点、字色、遮罩和断行。

这些规则看起来限制自由,实际是在保护输出下限。

设计类 Skill 的质量来自“替用户排除绝大多数会变丑的选项”。

图 18

这也是我几篇 Skill 文章里反复出现的经验:

好看不是玄学,而是可拆解、可编码、可检查的行业常识。

Skill 的价值,就是把这些常识压进 SKILL.md、模板、checklist、主题变量和后验检查里。

PPT Skill 和社交媒体卡片 Skill 的一个共同方法,是把 AI 的任务从“自由设计”降级成“在高质量骨架里填充”。

PPT Skill 里,10 种页面布局、5 套主题色、字体三级分工、7:5 / 6:6 / 8:4 网格、hero 与 non-hero 的节奏交替,构成了一个稳定的演示系统。AI 不需要从零发明版式,只需要根据内容选择合适页面类型并填进去。

社交媒体卡片 Skill 进一步把场景校准到手机信息流:

3:4 是主战场,1 秒决定停不停下。它不是把 PPT 截图成竖图,而是重新定义了图文品类、版式比例、断行规则和素材优先级。

11 个内容品类、两套视觉系统、28 个版式骨架、截图美化、地图组件、真实图库和克制 AI 生图,共同构成了“内容平台视觉 Skill”。

Logo Generator Skill 也是同一逻辑:

不直接让图像模型一把梭生成 Logo,因为图片模型的文字、结构和可编辑性不稳定;

他是先生成 SVG 变体,再做展示图和 WebGL 背景。这里把 Logo 本体、展示场景、交互背景拆成不同层,分别用最适合的技术处理。

所以设计 Skill 的通用公式是:

人工沉淀审美系统,模型理解内容和语义,代码负责稳定排版和导出,图像模型只处理适合它的视觉部分。

这比单纯“让 AI 画一张图”更慢一点,但可控、可改、可复用,也更适合内容创作者长期使用。

图 19

Skill 生态不能做成仓库列表

如果一个 Skill 能被图文、案例、评价、使用数据、作者、应用场景反向链接起来,它就不只是一个工具,而是一个社区节点。

反向链接:从使用案例、文章、图文或项目页面反过来链接到某个 Skill,让人能看到它被谁用、怎么用、效果如何。

当前很多 Skill 展示的问题是:

列表很长,像 GitHub 仓库名;图标都一样;没有结果展示;没有评价指标;

多模态 Skill 也只用文本展示;用户不知道哪个适合自己。

推荐 10 个或 20 个精选 Skill,并讲清楚怎么用,远好过给用户几千个列表。

每个 Skill 都应该像一个软件功能页。页面应该说明:

它解决什么问题,适合什么场景,需要输入什么,输出长什么样,典型提示词是什么,生成结果截图或视频,谁用过、怎么评价,有哪些常见失败情况,如何安装和修改。

这本质上需要强运营。

不是把名字列出来,而是一个一个挑、一个一个写介绍、展示结果,最好还有视频讲解。

GitHub 是代码型 Skill 的天然托管地,因为 Skill 往往包含代码,需要版本管理;

GitHub 有生态位、版权声明和分发基础;AI 也熟悉 Git 和 GitHub 操作;开源还能覆盖所有 Agent 平台,不绑定单一产品。

但小红书适合做视觉内容和使用案例分发。

小红书的优势是内容感知、视觉展示、用户审美和评论体系。

PPT Skill 和社交媒体卡片 Skill 都已经在小红书之外的人群中传播,比如咖啡馆主理人、数码测评、活动策划、餐厅、三线城市分享场景。这说明 Skill 能跨出 AI 圈。

应用商店式 Skill 分发也有潜力:更精准推荐、更低使用门槛、可能给创作者分成。

但对创作者来说,如果只在一个平台上架,就等于押注这个平台能做好产品、生态、分发和市场占领。

更稳的策略可能是:GitHub 做基础分发和跨平台覆盖,平台 Skillhub / 应用商店做体验优化、运营推荐和商业转化。

未来的 Skill 平台,本质上会同时是 App Store、GitHub、社区种草页、评价系统和 Agent 工具层。

图 20

普通用户真正卡在哪里

AI 圈外的人并非不能用 Skill。

实际观察中,咖啡馆主理人、数码测评、活动策划、健身教练等都能用出好结果。

真正卡点是交互心智。

很多人仍然用传统软件思维,以为一次生成就该完成:

不习惯通过 chat 连续调整;不知道可以要求 AI 改颜色、改字、修溢出、换图;不知道如何提供上下文和素材;也不知道如何从自己的工作流中抽 Skill。

因此,Skill 产品不仅要提供安装,还要提供使用教育。

行业 Skill 会是一个很重要的方向。很多行业有非常好的经验和客户洞察:

健身、法律、餐饮、活动策划、教育、商业化投放等。但行业专家不一定知道如何做 Skill,也担心分享后被盗。

这里的关键不是把 Skill 作为服务添加项。

健身教练可以用 Agent 维护会员饮食、训练、有氧、提醒和反馈,提高客户粘性和服务效率。

法律从业者可以把琐碎文本处理、条文审查、格式检查做成辅助 Skill,但核心判断仍由人完成。

餐饮和活动行业可以用图文 Skill 把真实图片和故事包装成可传播内容。

AI 不能替代线下履约,但可以提高获客、沟通、维护和复用效率。

这类行业用户只需要基础启蒙:带他做一次需求分析,落地成一个 Skill,他就知道边界在哪里。

每个行业都有先锋用户:有创造力、有好奇心、想用 AI 获得竞争优势。先服务这些人。

图 21

内容 Skill:文章、产品和案例互相喂养

从我已有文章看,我正在形成一条很清晰的内容 Skill 路线:

不是为某个抽象 AI 概念写文章,是先做出一个能用的 Skill,再把制作过程、设计判断和使用场景写成传播内容。

这类内容有几个特点。

PPT Skill 最初来自一次 AI 和组织分享,观众问得最多的是 PPT 怎么做,于是从一次交付沉淀成开源 Skill。这是副产品变主产品。

文章本身像说明书,但不是 README。

它要讲清楚为什么这样设计、适合谁、边界在哪、真实效果如何,降低用户理解门槛。

产品演示本身就是内容资产。PPT 截图、图文卡片、Logo 展示图、Desk Card 场景图,都可以成为传播素材。

Skill 反过来也提升写作效率。社交卡片 Skill 可以把文章段落直接转成更适合小红书、公众号或 Twitter 的视觉卡片。

图 22

每篇文章都在扩展 Skill 的语义边界。

PPT 是演示,Social Card 是内容分发,Logo 是项目品牌资产,Desk Card 是硬件和环境 UI,夜巡录则指向游戏 demo 工作流。

这说明 Skill 不只是“工具产品”,也是内容创作者的表达基础设施。

过去文章和产品是分开的:先做产品,再写推广。现在 Skill、文章、案例、开源仓库、社交反馈会互相喂养。

一个成熟路径可能是:用 Agent 完成一次真实任务,把过程沉淀成 Skill,用 Skill 产出的可视化结果写文章,文章带来用户和反馈,反馈补成 gotchas、模板和下一版 Skill,新版 Skill 再产生下一轮内容。

这就是个人产品在 Agent 时代的复利飞轮。

图 23

Skill 的边界会继续扩大

过去“插件”通常意味着软件里的一个按钮。现在 Skill 的边界可以明显更大。

浏览器 Skill 会是消费者入口。Tabbit Browser 一类产品说明,Skills 可以进入浏览器场景,变成普通用户在网页、资料、脚本和自动化之间的入口。

浏览器是大众最熟悉的工作环境,如果 Skill 能以“现成脚本 / 使用案例 / 一键执行”的方式出现,会比裸露 CLI 或 GitHub 仓库更容易被理解。

硬件 Skill 则说明 AI 可以接管环境 UI。

AI Desk Card 的价值在于它把 Agent 的能力延伸到了物理环境:

安装固件、配置 Wi-Fi、写 cron、读取 Memory、选择 widget、刷新墨水屏,全流程由 AI 引导。用户不再面对 App 设置页,AI 本身就是设置页。

游戏 Skill 代表更长链路的创作流程。

夜巡录开发手记里提到的“**独立游戏 demo Skill**”,从玩法母题、原型、素材采集、绿幕抠图、contact sheet、视频生成、音乐、Electron 打包、GitHub Actions 到 Release。

封装是一套跨程序员、美术、动画、作曲和运维的生产流水线。它的价值是把“做个原型”和“独立交付完整作品”之间的墙变薄。

图 24

这些案例共同说明:

Skill 的未来不只会局限在聊天框里,它会扩展到浏览器、桌面、本地文件、硬件、内容平台、游戏引擎和真实工作环境。

Skill 与 Gene:手写经验和自动进化的边界

还有一个值得保留但需要谨慎使用的对比:Agent Skill 与 GEP Gene。

Skill 更像人类预先沉淀的能力包:有明确创建者、明确边界、明确流程和版本。

Gene / Capsule 这类概念强调运行中从成功经验里自动长出能力:带成功率、变异历史、适用上下文和自动修复机制。

Gene / Capsule:这里指从 Agent 反复执行中的成功路径里沉淀出的可复用经验单元,强调自动演化而不是人工手写。

这两者不是简单替代关系,是不同的层级。

Skill 适合承载人的专家经验、审美、行业 SOP、工具不变式和明确交付标准;

Gene 适合从重复执行中捕捉成功路径,把临时试错变成可复用经验;Capsule 类似把多个 Gene 组合成更长工作流。

从当前产品现实看,Skill 仍是更可落地的单位,因为它能被写、被审、被发布、被解释、被传播。

但长期看,自动沉淀 Skill / Gene 化经验会成为方向:Agent 先用通用工具试错,成功后把路径写回 Skill 或生成新的子能力。

这也回应了“自动沉淀 Skill”的讨论。系统可以自动发现重复流程,但是否值得沉淀、如何命名、边界在哪里、哪些失败要写进 gotchas,仍然需要人的判断。

真正理想的形态不是完全自动,也不是完全手写,而是人定义品味和边界,Agent 负责收集证据、提出改动、补充 eval 和维护长尾经验。

盗用不是靠藏,防御方式是持续分发

Skill 很难靠闭源防盗。即便不开源,只要看到产出结果,试用几次,也可能被复刻。

所以防御方式不是“藏起来”,而是开源覆盖更多平台,用影响力威慑过分盗用者,做自媒体让用户知道源头是谁,用持续迭代建立领先,用社区案例和评价体系形成品牌资产。

在产品壁垒降低的时代,个人产品如果没有渠道、资源和营销,就必须自己做宣发。以前自媒体是可选项,现在是基础设施。

图 25

平台真正该做什么

如果要做 Skill 平台,不能只押 Skill。用户下载独立端的理由,首先是 Agent 基础体验足够好:

漂亮好用的客户端,多模型支持,尤其国产模型;文件、项目、memory、CLI、MCP、Skill 管理;

权限和安全沙箱;长程任务和状态延续;多设备流转,手机控制桌面,桌面反向控制手机;官方高质量插件开箱即用。

Workbody 的启发是,它没有做特别独特的东西,只是把该有的基础体验做齐了。很多国内产品连这一点还没做好。

一些高频、必须、常见的能力应该内置并打磨好,不要让用户自己折腾安装。

官方插件强,会形成壁垒。多设备、云端和本地互控,也会形成壁垒。

Skill 与本地环境强相关时,移动端需要遥控 PC。

Skill 可跨端通用,但依赖本地文件、脚本、浏览器、CLI 的 Skill 在移动端很难直接跑。

移动端适合轻量级从 0 到 1 创作;桌面端适合重任务和本地环境调用。

自动沉淀 Skill 是长期方向,但好 Skill 仍需要人。Dumate 等产品提出“自动沉淀 Skill”:从用户重复工作中自动总结流程。

这个方向成立,但好 Skill 仍需要业务 SOP、品味、测试和迭代。自动生成可以做初版,真正能稳定交付的 Skill 需要打磨。

一个完整 Skill 生命周期

如果把前面的判断收束成一条路径,一个完整 Skill 生命周期大概是这样的。

先发现真实需求,从自己或行业用户的重复工作开始。

再做一次高质量产物,不要先抽象,先用 Agent 解决真实任务。

然后抽象流程,识别可复用步骤、输入、输出、约束和工具。

接着工程化模板,把审美、版式、调用、验证和修复机制固化。

再做跨模型测试,好模型看上限,差模型保下限。

之后才是封装发布,GitHub 托管,配 README、示例和安装方式。

再做内容分发,用小红书、Twitter、公众号、视频展示结果。然后收集反馈,从 issue、评论区、用户案例和平台数据里找真实问题。

反馈还要筛选,只吸收能提升泛化和稳定性的部分。

这条路看起来长,但它的本质很简单:

每一次真实任务,都不只是在完成任务,而是在积累下一次能调用的能力资产。

Agent 时代最稀缺的是可复用的能力组织方式。

Skill 之所以重要,是因为它第一次让人的经验、工作流和品味,有机会变成一种可以分发、调用、评价和持续迭代的商品。

这可能才是 Agent 生态里真正的大机会。

好,今天的内容就到这里。如果你觉得有帮助,欢迎帮我点个赞,或者转发给你需要的朋友。