Skill Creator

创建新技能、修改改进现有技能并衡量技能表现。当用户想要从头创建、编辑或优化技能时使用。

安装

概览

什么是Skill Creator

Skill Creator 是一个专为创建和迭代优化 Claude 技能而设计的系统级工具。它通过结构化流程帮助用户从零开始构建新技能,或持续改进已有技能的表现。该工具的核心价值在于将技能开发过程系统化:从明确技能意图、编写初始草案,到设计测试用例、运行对比实验,再到基于用户反馈进行多轮迭代优化,最终形成可部署的高质量技能模块。整个流程强调数据驱动与人工评估相结合,确保技能既满足功能性需求,又具备良好的用户体验。无论是技术背景深浅不同的开发者,都能借助 Skill Creator 完成从概念到落地的完整闭环。 在技能创建阶段,系统首先引导用户澄清目标——即技能应实现什么功能、在何种场景下触发、输出何种格式的结果。这一步骤至关重要,因为它决定了后续所有工作的方向。随后进入技能编写环节,需遵循特定模板规范,包括 YAML 元数据(名称、描述)和 Markdown 指令正文,并可附带脚本、文档等资源文件。特别值得注意的是,技能描述必须足够‘主动’,以对抗 Claude 模型本身可能存在的‘触发不足’倾向,从而提升实际使用中的调用频率。 一旦草稿完成,便启动自动化评测流程。系统会为每个测试用例并行执行两个版本:启用技能的版本与基准对照组(如无技能状态或旧版技能)。同时,在此期间生成量化评估指标(assertions),用于客观衡量性能差异。所有运行结果会被组织进工作空间目录结构中,并通过 `eval-viewer/generate_review.py` 脚本生成可视化评审界面。用户可在浏览器中查看每项任务的详细输出、历史表现及打分情况,并留下文字评价。这些反馈被汇总后用于指导下一轮技能重写,形成典型的‘开发-测试-反馈-改进’循环。

核心功能特点

  1. 支持从零创建新技能或迭代优化现有技能的全流程管理
  2. 提供标准化的技能模板结构(SKILL.md + 资源文件),确保一致性
  3. 自动生成并运行对比测试(with-skill vs baseline),支持并行执行
  4. 集成定量评估指标(assertions)与定性评审机制,结合人工反馈
  5. 内置评测结果可视化工具,便于用户直观分析性能差距
  6. 可选技能描述优化模块,提升技能在实际对话中的触发准确率

适用场景

Skill Creator 最适用于需要频繁调用专业能力但又不愿重复造轮子的开发者和团队。例如,一个数据分析工程师希望快速搭建一个能自动解析 Excel 报表并生成图表的技能,他可以利用此工具定义输入输出格式、编写处理逻辑、设定测试案例(如‘将销售数据转为柱状图’),然后观察模型在不同版本下的表现差异,根据用户对图表美观度、数据准确性等方面的反馈不断调整提示词和脚本逻辑,直至达到满意效果。另一个典型场景是代码辅助类技能的开发:假设要创建一个能根据需求文档自动生成 Python 单元测试的技能,开发者可通过 Skill Creator 设置多个真实世界的测试用例(如边界条件、异常输入等),利用系统提供的 grading 机制验证输出是否符合预期,再结合分析师对失败模式的解读,逐步增强技能的鲁棒性和泛化能力。 对于非技术型用户而言,即使不具备编程经验,也能借助 Skill Creator 的引导式提问完成简单技能的制作。比如一位市场营销人员想要一个能一键美化 PPT 幻灯片布局的工具,她只需描述清楚操作目标(‘让页面更专业’)、指定源文件格式(.pptx)、期望结果(视觉风格统一),系统就会协助她起草说明文档、准备示例文件,并通过模拟运行展示成果,最终由她亲自判断是否接受该技能。这种低门槛的设计使得更多业务专家能够参与到 AI 能力的扩展中来,降低了对纯编码能力的依赖。 此外,在企业内部知识沉淀方面,Skill Creator 也展现出强大潜力。当某个部门积累了大量重复性任务的最佳实践(如法务合同审查流程、财务报销审批规则),可以通过此工具将其封装为标准化技能,不仅方便新人快速上手,还能作为组织记忆长期保存。后续若有政策变动或流程升级,只需按相同流程更新技能内容即可,无需每次都重新培训全员。因此,它不仅是个体开发者的得力助手,更是推动团队协作与知识复用的重要基础设施。