pubchem-database

通过PUG-REST API/PubChemPy访问PubChem数据库(含1.1亿+化合物)。支持名称/CID/SMILES查询,可获取物化性质、相似性/子结构检索、生物活性数据,适用于化学信息学分析。

安装

热度:8

下载并解压到你的 skills 目录

复制命令,发送给 OpenClaw 自动安装:

下载并安装这个技能 https://openskills.cc/api/download?slug=k-dense-ai-scientific-skills-pubchem-database&locale=zh&source=copy

PubChem 化合物数据库查询工具

技能概述


PubChem Database 是一个基于 PUG-REST API 和 PubChemPy 的化学信息学工具,帮助用户快速查询全球最大的免费化学数据库,获取化合物结构、分子属性、相似性搜索和生物活性数据。

适用场景

1. 药物研发与先导化合物筛选


在药物发现过程中,研究人员需要快速找到与已知药物结构相似的化合物,或筛选含有特定药效团的分子。本技能支持通过 SMILES 进行相似性搜索和子结构检索,帮助研究人员从 1.1 亿+化合物中找到潜在候选药物,并结合 Lipinski 规则进行类药性评估。

2. 化合物属性批量获取与分析


化学家和研究人员需要同时获取多个化合物的分子属性(分子量、LogP、TPSA、氢键数等)用于构效关系分析。本技能提供批量查询功能,可一次性获取数十个化合物的完整属性列表,支持导出为 DataFrame 进行进一步统计分析。

3. 化学标识符转换与结构可视化


研究人员常需在不同化学标识符格式之间转换(如从化合物名到 SMILES,从 CID 到 InChI),或获取化合物的 2D 结构图用于论文和报告。本技能支持多种标识符类型的互相转换,并可下载 PNG/SDF/JSON 格式的结构文件。

核心功能

1. 多方式化合物检索


支持通过化学名称、CID(化合物 ID)、SMILES、InChI 或分子式查询化合物。只需输入任一标识符,即可获取对应的化合物完整信息,包括 IUPAC 名称、分子式、分子量、canonical SMILES、InChI 等标准标识符。

2. 分子属性与生物活性数据获取


可获取 30+ 种分子属性,包括基础属性(分子量、分子式)、物理化学性质(XLogP、TPSA、氢键给体/受体数)以及 2.7 亿+ 生物活性测试数据。支持按活性结果筛选,帮助快速了解化合物的生物活性概况。

3. 结构相似性与子结构搜索


基于 Tanimoto 系数进行化合物相似性搜索,找到结构相关的化合物;或通过子结构搜索定位含有特定官能团(如苯环、吡啶、羧酸、磺酰胺)的分子。这些功能适用于虚拟筛选和药效团探索。

常见问题

PubChem 数据库的数据来源是什么?


PubChem 由美国国家生物技术信息中心(NCBI)维护,整合了来自科研机构、制药公司和公开数据库的化学物质信息,包含超过 1.1 亿个化合物和 2.7 亿条生物活性记录,完全免费开放使用。

API 有请求频率限制吗?


有。PUG-REST API 限制每秒最多 5 个请求,每分钟最多 400 个请求。建议在批量查询时添加 0.2-0.3 秒的延迟,或使用 CID 代替名称查询以提高效率。相似性和子结构搜索是异步操作,可能需要 15-30 秒完成。

可以批量查询多个化合物吗?


可以。使用 PubChemPy 或内置的 compound_search.py 脚本,可以传入化合物列表进行批量查询。建议先缓存常用化合物的 CID,因为 CID 查询比名称或结构查询更快且更稳定。对于超大规模查询,建议分批次进行并添加适当延迟。