什么是Semantic Router
Semantic Router 是一款专为 AI 代理设计的生产级会话路由系统,旨在根据用户输入的语义内容智能选择最合适的模型池。该系统通过四层识别机制(系统过滤→关键词→指示词→语义相似度)和四池架构(高速、智能、人文、代理),实现精准的五分支路由决策。其核心优势在于支持 trigger_groups_all 非连续词组匹配,能够理解自然口语表达,无需精确关键词即可触发相应任务类型。系统采用全自动 Fallback 回路和会话隔离技术,有效解决 Cron Job 导致会话重置、跨渠道会话中断等常见问题,确保长任务和后台操作不会干扰用户正常交互流程。
核心功能特点
- 四层智能识别机制:结合系统过滤、关键词匹配、指示词检测与语义相似度评分,实现精准路由判断
- 四池模型架构:包含高速(查询检索)、智能(开发编程)、人文(内容生成)、代理(长上下文任务)四大模型池
- 五分支路由决策:A/B/B+/C/C-auto 五种路径,支持延续对话、新话题重置、漂移警告等多种会话行为
- trigger_groups_all 非连续词组命中:支持自然语言触发,如’帮我自动操作浏览器’可准确识别为代理任务
- 会话隔离架构:通过 sessionKey=null + sessionTarget=isolated 实现后台任务与用户会话完全隔离
- 智能配置合并:提供预检脚本和自动回滚机制,避免覆盖现有 OpenClaw 配置造成服务中断
适用场景
Semantic Router 特别适用于需要精细控制 AI 模型切换的生产环境场景。在 Discord/Telegram 等即时通讯平台中,当用户发起编程请求如’写个Python爬虫’时,系统会自动路由至 Intelligence 池调用 claude-opus-4.6 模型;而查询类请求如’查天气’则导向 Highspeed 池使用 gemini-2.5-flash 快速响应。对于需要延续上下文的复杂任务,系统通过 B 分支保持当前模型池不变,确保对话连贯性。当检测到低关联度消息(<0.08)时,C-auto 分支会执行 /new 命令并重置会话,防止任务混淆。在运维场景中,通过将 cloudflared-watchdog 等 Cron Job 设置为隔离会话,可避免其关键词触发 C-auto 分支导致用户长任务中断,实现后台任务与用户会话的安全共存。
