Agent-Skills-for-Context-Engineering

当用户请求“压缩上下文”、“总结对话历史”、“执行压缩”、“减少token使用”,或提及上下文压缩、结构化摘要、任务级token优化,以及超长Agent会话超出上下文限制时,应使用此技能。

安装

概览

什么是Agent-Skills-for-Context-Engineering

Agent-Skills-for-Context-Engineering 是一个专为解决超长对话会话和超大代码库上下文窗口限制而设计的技能模块。当 AI 代理在处理数百万 token 的对话历史、超过上下文窗口限制的代码系统(如 500 万 token 以上的项目),或需要优化任务级 token 消耗时,该技能提供了一套完整的上下文压缩策略。其核心理念并非简单地减少单次请求的 token 数量,而是通过结构化的摘要生成与增量合并机制,最小化完成整个任务所消耗的总 token 数——即‘每任务 token 成本’。传统方法往往采用激进的压缩以降低每次请求的开销,但忽略了压缩导致关键信息丢失后引发的重复获取、重新探索等额外开销。该技能强调使用锚定式迭代摘要、不透明压缩和再生式全摘要三种生产就绪的方法,并根据不同场景选择最优方案。其中,结构化摘要因其强制保留特定类型信息(如修改的文件、做出的决策)的能力,被证明在保持高压缩率的同时显著提升信息完整性。

核心功能特点

  1. 采用‘每任务 token 成本’作为核心优化指标,而非传统的‘每请求 token 节省’,避免因压缩丢失关键信息导致的重复获取开销
  2. 支持三种生产就绪的压缩方法:锚定式迭代摘要、不透明压缩和再生式全摘要,可根据会话长度、文件追踪需求和可解释性要求进行灵活选择
  3. 引入结构化摘要模板,强制包含会话意图、已修改文件列表、所做决策、当前状态和下一步行动等明确章节,防止重要技术细节(如文件路径、错误码)在压缩过程中静默丢失
  4. 提供基于探针的评估框架,通过直接提问的方式测试压缩后摘要对事实回忆、工件追踪、任务延续性和决策链保留等功能性质量,弥补传统 ROUGE 或嵌入相似度指标的不足
  5. 推荐三阶段压缩工作流:研究阶段将架构图与文档提炼为组件依赖分析;规划阶段转化为含函数签名与数据流的实现规范;执行阶段则聚焦于该精简后的规范而非原始庞大代码库

适用场景

该技能最适用于处理那些因对话历史过长或代码库规模巨大而导致上下文窗口溢出的典型场景。例如,在一个持续运行超过百轮消息的长周期开发任务中,若代理频繁‘忘记’自己之前修改过哪些文件、解决了什么问题,这正是触发此技能的信号。此时,采用带有显式‘文件修改’和‘决策记录’章节的结构化摘要,能确保后续步骤不会遗漏关键变更轨迹。对于拥有数十万行以上代码的大型系统,直接将其全部载入上下文既不现实也低效。此时应启动三阶段压缩流程:首先从设计文档中萃取出核心组件及其关系形成研究简报;接着据此编写详尽但篇幅适中的实现规格说明书;最后让代理依据这份浓缩版蓝图进行编码。另一个典型用例是调试复杂问题时的会话管理——当定位到根因并修复后,将长达数万 token 的排查过程压缩成一份包含原始错误现象、根本原因分析和已修复项的结构化总结,不仅节省空间,更为后续验证修复效果提供了清晰依据。此外,在构建自动评测体系时,利用探针式提问检验不同压缩策略下信息保留程度,是量化比较各种方法优劣的有效手段。