Pharmaclaw Chemistry Query 是一个集成了 PubChem 数据检索与 RDKit 化学信息学处理能力的全栈式化学智能工具。该工具能够从 PubChem 数据库中查询化合物的详细信息、结构、合成路线及相似化合物,并通过 RDKit 引擎进行分子性质计算、可视化、逆合成分析以及多步合成路径规划。所有输出均以结构化 JSON 格式呈现,便于后续流程的自动化集成与调用。 该工具支持多种输入方式,包括化合物名称、SMILES 字符串或 CID(PubChem 标识符),并能自动完成名称到标准结构的解析。其核心功能涵盖分子属性计算(如分子量、logP、极性表面积等)、2D/3D 分子图像生成、BRICS 逆合成分析、基于 SMARTS 的正向反应模拟以及 Morgan 指纹相似性搜索等。此外,系统内置了 21 种常见有机反应模板(如 Suzuki、Heck、Grignard、Wittig 等),可用于反应预测与合成设计。 作为一个高度模块化的化学智能体,Pharmaclaw Chemistry Query 提供了标准化的链式接口(chain_entry.py),允许用户通过统一的 JSON 输入触发完整的分析流程——从化合物识别到物化性质获取、结构绘图再到逆合成路径推荐。同时,它还配备了高级化学信息学模块(advanced_chem.py),支持分子标准化、超过 200 个描述符计算、最大公共子结构分析、匹配分子对分析(MMPA)以及化学空间可视化等功能,适用于药物发现、分子设计与化学教育等多种科研场景。
核心功能特点
- 支持 PubChem 化合物信息查询(分子式、IUPAC 名称、InChIKey 等)及结构数据获取(SMILES、InChI、图像链接)
- 集成 RDKit 引擎实现分子性质计算(MW、logP、TPSA、氢键供受体数等)与 2D/3D 结构可视化
- 提供 BRICS 逆合成分析与多步合成路径规划,内置 21 种常见有机反应模板(Suzuki、Heck、Grignard 等)
- 支持 Morgan 指纹相似性搜索、子结构匹配及正向反应模拟(基于 SMARTS 模板)
- 具备高级化学信息学功能:分子标准化、超过 200 个描述符计算、Murcko 骨架提取、MCS 与 MMPA 分析
- 采用结构化 JSON 输出接口,支持与其他科学智能体无缝对接与流程自动化
适用场景
Pharmaclaw Chemistry Query 特别适合需要快速获取化合物关键信息的研发场景。例如,在药物早期发现阶段,研究人员可以通过输入候选分子的名称(如 “aspirin” 或 “sotorasib”),一键获得其精确的结构、理化参数和潜在毒性风险提示,从而加速先导化合物的筛选过程。该工具还能自动生成高质量的 2D 分子图像用于报告撰写或学术交流,极大提升工作效率。 对于从事有机合成与路线设计的化学家而言,该工具的价值尤为突出。借助内置的 BRICS 逆合成算法和丰富的反应模板库,用户可以针对目标分子(如阿司匹林或咖啡因)自动生成可行的前体化合物列表,并进一步规划多步合成路径。结合 RDKit 的反应模拟能力,还能验证特定 SMARTS 规则下的转化可行性,为实验室合成提供理论支持。 此外,在药物化学与计算化学教学中,Pharmaclaw Chemistry Query 可作为强大的辅助工具。教师可利用其批量计算一组分子的 Lipinski 五规则参数或 QED 值来讲解“类药性”概念;学生则可通过交互式调用脚本学习如何从 PubChem 获取数据、使用 RDKit 分析分子特性,或通过化学空间可视化理解结构多样性。其模块化设计也便于扩展至更复杂的 ADMET 预测或文献挖掘流程中,形成完整的药物研发知识链路。
