Chemistry Query Agent 是一个集成了 PubChem 数据检索与 RDKit 化学信息学处理能力的端到端化学智能工具,专为化合物信息查询、分子结构分析、可视化及合成路线规划而设计。该工具通过统一的 JSON 接口输出结构化结果,支持从化合物名称自动解析为 CID,并调用 PubChem API 获取分子式、分子量、IUPAC 命名、InChIKey 等基础信息,同时提供 SMILES、InChI 和分子图像等多种格式的结构表示。
在分子层面,Chemistry Query 利用 RDKit 引擎计算关键理化性质,包括摩尔质量(MW)、脂水分配系数(logP)、极性表面积(TPSA)、氢键供体/受体数(HBD/HBA)、可旋转键数量以及芳香环数目等,为药物设计和物性预测提供量化依据。此外,它支持 2D 分子图像的即时生成(PNG/SVG 格式),便于快速展示与分析。
更高级的功能涵盖反向合成(retrosynthesis)和多步合成路径规划,采用 BRICS 算法进行递归拆解,并结合内置的 21 种经典有机反应模板(如 Suzuki、Heck、Grignard、Wittig、Diels-Alder 等)实现正向反应模拟。系统还支持基于 Morgan 指纹的分子相似性搜索与子结构匹配,满足复杂化学空间探索需求。所有操作均可通过命令行脚本或标准链式接口调用,输出统一格式的 JSON 报告,包含置信度评分、风险提示、推荐后续任务及时间戳,适用于自动化工作流集成。
核心功能特点
- 支持通过化合物名称或 CID 查询 PubChem 数据库,获取分子式、分子量、IUPAC 名称、InChIKey 等详细信息
- 利用 RDKit 自动计算分子关键属性:摩尔质量、logP、TPSA、氢键供体/受体数、可旋转键、芳香环数
- 一键生成 2D 分子结构图(PNG/SVG 格式),便于直观展示与共享
- 基于 BRICS 算法实现递归反向合成分析,支持自定义拆解深度
- 集成 21 种常见有机反应模板(如 Suzuki、Heck、Grignard 等),支持正向反应模拟与多步合成路径规划
- 提供 Morgan 指纹相似性搜索与子结构匹配功能,助力化合物筛选与关系挖掘
适用场景
Chemistry Query 特别适用于新药研发早期阶段的靶点化合物快速评估场景。研究人员可通过输入候选分子的通用名(如‘aspirin’或‘caffeine’),立即获得其完整化学档案,包括精确结构、理化参数及可能的合成路径,从而加速先导化合物的识别与优化。例如,在虚拟筛选中,用户可利用相似性搜索找出与已知活性分子结构相近的新化合物,提高命中率。
对于合成化学家而言,该工具的反向合成与多步规划功能极具价值——只需指定目标分子(SMILES 或名称),即可自动生成可行的前体路线,并结合内置反应模板验证可行性。这在实验室合成策略制定或教学演示中尤为实用,能显著减少试错成本。同时,结合 2D 图像输出,团队可在会议或报告中清晰传达分子结构与转化逻辑。
在教育与科研协作环境中,Chemistry Query 的标准 JSON 输出接口使其易于与其他科学智能体(如药理学、毒理学分析模块)无缝衔接,形成“化学→药效→安全”的全链条分析流程。无论是高通量虚拟筛选、药物重定位研究,还是有机化学课程实验设计,该工具都能以高效、一致的方式支撑化学信息的获取、分析与决策。
