reactome-database

查询Reactome REST API用于通路分析、富集分析、基因-通路映射、疾病通路、分子相互作用、表达分析,以支持系统生物学研究。

安装

热度:5

下载并解压到你的 skills 目录

复制命令,发送给 OpenClaw 自动安装:

下载并安装这个技能 https://openskills.cc/api/download?slug=k-dense-ai-scientific-skills-reactome-database&locale=zh&source=copy

Reactome Database - 生物通路分析与富集分析工具

技能概述


Reactome Database 是一个免费开源的通路数据库技能,通过 REST API 和 Python 客户端提供通路富集分析、基因表达分析、分子相互作用查询和通路可视化功能,适用于系统生物学研究。

适用场景

  • 基因/蛋白质富集分析

  • 当你有一组基因或蛋白质列表,需要识别它们参与的生物通路和显著富集的通路时,使用此技能可快速完成 Overrepresentation Analysis,获得统计显著的通路结果。

  • 基因表达数据通路分析

  • 当你有基因表达数据集(如 RNA-seq 或微阵列数据),需要分析哪些通路在特定条件下被激活或抑制时,使用此技能的表达数据分析功能,结合定量值进行通路层面的解读。

  • 生物通路查询与可视化

  • 当你需要查询特定通路信息、探索分子相互作用、或需要将分析结果在 Reactome Pathway Browser 中可视化展示时,使用此技能可获取完整的通路层级、参与分子和反应细节。

    核心功能

  • Content Service - 通路数据查询

  • 通过 REST API 查询 Reactome 数据库中的通路信息、分子实体、反应和相互作用。支持获取数据库版本、通路层级结构、参与分子、事件详情等,返回 JSON 格式数据便于程序化处理。

  • Analysis Service - 通路富集与表达分析

  • 提供 Overrepresentation Analysis(基因列表富集分析)和 Expression Data Analysis(表达数据分析)两种分析类型。支持多种基因标识符格式(UniProt、Gene Symbol、Ensembl、EntrezGene),分析结果包含 p-value、FDR 等统计指标,token 有效期 7 天。

  • reactome2py Python 客户端

  • 提供 Python 包封装 API 调用,简化与 Reactome 的交互。虽然当前版本(3.0.0,2021年发布)维护状态有限,但基础功能完整可用。对于最新特性建议直接使用 REST API。

    常见问题

    Reactome 支持哪些基因标识符格式?


    Reactome 支持多种主流标识符,包括 UniProt 登录号(如 P04637)、基因符号(如 TP53)、Ensembl ID(如 ENSG00000141510)、EntrezGene ID(如 7157)以及小分子的 ChEBI ID。系统会自动检测标识符类型,无需手动指定。

    reactome2py 包和直接调用 REST API 有什么区别?


    reactome2py 是 Reactome API 的 Python 封装库,安装后可以更简洁地调用功能。但该包(版本 3.0.0)自 2021 年后不再积极维护,可能缺少最新特性。直接使用 REST API 虽然代码稍多,但能获取最新功能。建议简单任务使用 reactome2py,复杂或新功能场景使用 REST API。

    Reactome 分析结果如何可视化?


    分析完成后会获得一个 token(有效期 7 天),通过构建特定 URL 可在 Reactome Pathway Browser 中可视化结果。格式为:https://reactome.org/PathwayBrowser/#{pathway_id}&DTAB=AN&ANALYSIS={token}。这允许交互式浏览通路图、查看基因在通路中的位置以及统计信息。

    Reactome 当前包含多少数据?


    截至 2025 年 9 月的版本 94,Reactome 包含 2,825 条人类通路、16,002 个反应、11,630 个蛋白质、2,176 个小分子、1,070 种药物以及 41,373 篇文献参考文献。数据库持续更新,可通过 Content Service 查询当前版本号。

    表达数据分析的输入格式有什么要求?


    表达数据需要使用 TSV 格式,首行必须以 # 开头的表头。第一列为基因标识符,后续列为数值型表达值,使用小数点作为分隔符。例如:#Gene Sample1 Sample2 后接数据行。注意标识符必须与 Reactome 数据库兼容。