pdb-database
访问RCSB PDB获取蛋白质/核酸三维结构。支持文本/序列/结构检索,可下载坐标文件(PDB/mmCIF格式),获取元数据,服务于结构生物学与药物发现研究。
分类
其他工具安装
热度:3
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
下载并安装这个技能 https://openskills.cc/api/download?slug=k-dense-ai-scientific-skills-pdb-database&locale=zh&source=copy
PDB Database - 蛋白质结构数据库查询工具
技能概述
访问 RCSB PDB 全球蛋白质结构数据库,搜索和下载蛋白质/核酸 3D 结构数据,支持文本、序列和结构相似性搜索,适用于结构生物学和药物发现研究。
适用场景
1. 结构生物学与蛋白质工程研究
搜索目标蛋白质的实验结构,获取同源蛋白用于建模,分析突变体结构差异,研究序列-结构关系。支持按物种、分辨率、实验方法等多维度筛选,快速定位所需结构数据。
2. 药物发现与分子对接
获取靶标蛋白的 3D 结构用于虚拟筛选和分子对接,分析配体结合位点特征,比较蛋白-配体复合物结构,识别相似药物靶点。支持批量处理多个靶点结构,提高药物研发效率。
3. 计算化学与生物信息学分析
下载 PDB/mmCIF 格式坐标文件用于分子动力学模拟,构建结构比对和进化分析,整合结构数据到计算流程。提供 Python API,便于自动化处理大规模结构数据。
核心功能
1. 多维度结构搜索
支持文本搜索、属性过滤、序列相似性和结构相似性四种搜索方式。可按生物物种、分辨率、实验方法等属性精确筛选,支持组合查询构建复杂搜索条件。可访问超过 200,000 个实验测定结构和计算模型。
2. 结构文件下载
提供 PDB、mmCIF、BinaryCIF 多种格式下载,支持单个结构或生物组装文件获取。可直接通过 API 或 URL 下载坐标文件,集成到自动化工作流中。
3. 元数据检索与批量处理
获取结构标题、实验方法、分辨率、物种来源等元数据信息,支持 GraphQL 灵活查询。可批量处理多个 PDB ID,提取结构摘要和质量指标,便于大规模数据分析。
常见问题
什么是 PDB 数据库?
RCSB PDB 是全球蛋白质数据银行(Protein Data Bank)的官方门户,收录生物大分子(蛋白质、核酸等)的 3D 结构数据。目前包含超过 200,000 个通过 X 射线晶体学、冷冻电镜、核磁共振等实验测定的结构,以及 AlphaFold 等计算预测模型。
如何下载蛋白质结构文件?
可通过 RCSB PDB 网站直接下载,或使用 Python API(rcsb-api 包)自动获取。下载链接格式为
https://files.rcsb.org/download/{PDB_ID}.pdb(PDB 格式)或 .cif(mmCIF 格式)。推荐使用 mmCIF 格式,它是现代标准格式,支持更大的结构。RCSB PDB 和 AlphaFold 有什么区别?
RCSB PDB 收录的是实验测定的结构(真实观测数据),而 AlphaFold 提供的是人工智能预测的结构模型。实验结构准确性高但覆盖有限,预测模型覆盖广但可能存在局部错误。对于药物发现等关键应用,建议优先使用实验结构;预测模型可用于初步分析和模板搜索。
PDB 和 mmCIF 格式应该选择哪个?
推荐使用 mmCIF(也称 PDBx)格式。mmCIF 是现代标准格式,支持更大结构、更完整元数据,无列宽限制。PDB 是遗留格式,仅适用于小分子结构且字段固定宽度限制严格。大多数现代结构生物学软件都支持 mmCIF。
这个技能有限制吗?
需要网络连接访问 RCSB PDB API,部分高级功能可能有请求频率限制。技能本身仅提供数据访问接口,结构分析和可视化需要配合 BioPython、PyMOL 等工具使用。