pdb-database

访问RCSB PDB获取蛋白质/核酸三维结构。支持文本/序列/结构检索,可下载坐标文件(PDB/mmCIF格式),获取元数据,服务于结构生物学与药物发现研究。

安装

热度:3

下载并解压到你的 skills 目录

复制命令,发送给 OpenClaw 自动安装:

下载并安装这个技能 https://openskills.cc/api/download?slug=k-dense-ai-scientific-skills-pdb-database&locale=zh&source=copy

PDB Database - 蛋白质结构数据库查询工具

技能概述


访问 RCSB PDB 全球蛋白质结构数据库,搜索和下载蛋白质/核酸 3D 结构数据,支持文本、序列和结构相似性搜索,适用于结构生物学和药物发现研究。

适用场景

1. 结构生物学与蛋白质工程研究


搜索目标蛋白质的实验结构,获取同源蛋白用于建模,分析突变体结构差异,研究序列-结构关系。支持按物种、分辨率、实验方法等多维度筛选,快速定位所需结构数据。

2. 药物发现与分子对接


获取靶标蛋白的 3D 结构用于虚拟筛选和分子对接,分析配体结合位点特征,比较蛋白-配体复合物结构,识别相似药物靶点。支持批量处理多个靶点结构,提高药物研发效率。

3. 计算化学与生物信息学分析


下载 PDB/mmCIF 格式坐标文件用于分子动力学模拟,构建结构比对和进化分析,整合结构数据到计算流程。提供 Python API,便于自动化处理大规模结构数据。

核心功能

1. 多维度结构搜索


支持文本搜索、属性过滤、序列相似性和结构相似性四种搜索方式。可按生物物种、分辨率、实验方法等属性精确筛选,支持组合查询构建复杂搜索条件。可访问超过 200,000 个实验测定结构和计算模型。

2. 结构文件下载


提供 PDB、mmCIF、BinaryCIF 多种格式下载,支持单个结构或生物组装文件获取。可直接通过 API 或 URL 下载坐标文件,集成到自动化工作流中。

3. 元数据检索与批量处理


获取结构标题、实验方法、分辨率、物种来源等元数据信息,支持 GraphQL 灵活查询。可批量处理多个 PDB ID,提取结构摘要和质量指标,便于大规模数据分析。

常见问题

什么是 PDB 数据库?


RCSB PDB 是全球蛋白质数据银行(Protein Data Bank)的官方门户,收录生物大分子(蛋白质、核酸等)的 3D 结构数据。目前包含超过 200,000 个通过 X 射线晶体学、冷冻电镜、核磁共振等实验测定的结构,以及 AlphaFold 等计算预测模型。

如何下载蛋白质结构文件?


可通过 RCSB PDB 网站直接下载,或使用 Python API(rcsb-api 包)自动获取。下载链接格式为 https://files.rcsb.org/download/{PDB_ID}.pdb(PDB 格式)或 .cif(mmCIF 格式)。推荐使用 mmCIF 格式,它是现代标准格式,支持更大的结构。

RCSB PDB 和 AlphaFold 有什么区别?


RCSB PDB 收录的是实验测定的结构(真实观测数据),而 AlphaFold 提供的是人工智能预测的结构模型。实验结构准确性高但覆盖有限,预测模型覆盖广但可能存在局部错误。对于药物发现等关键应用,建议优先使用实验结构;预测模型可用于初步分析和模板搜索。

PDB 和 mmCIF 格式应该选择哪个?


推荐使用 mmCIF(也称 PDBx)格式。mmCIF 是现代标准格式,支持更大结构、更完整元数据,无列宽限制。PDB 是遗留格式,仅适用于小分子结构且字段固定宽度限制严格。大多数现代结构生物学软件都支持 mmCIF。

这个技能有限制吗?


需要网络连接访问 RCSB PDB API,部分高级功能可能有请求频率限制。技能本身仅提供数据访问接口,结构分析和可视化需要配合 BioPython、PyMOL 等工具使用。