gene-database

通过E-utilities/Datasets API查询NCBI基因数据库。支持基因符号/ID检索,获取基因信息(RefSeq序列、基因本体注释、染色体位置、表型数据),支持批量查询,适用于基因注释与功能分析。

安装

热度:12

下载并解压到你的 skills 目录

复制命令,发送给 OpenClaw 自动安装:

下载并安装这个技能 https://openskills.cc/api/download?slug=k-dense-ai-scientific-skills-gene-database&locale=zh&source=copy

Gene Database - NCBI 基因信息查询工具

技能概述


Gene Database 是一个便捷的 NCBI Gene 数据库查询工具,支持通过 E-utilities 和 Datasets API 检索基因信息,包括基因符号查询、序列获取、功能注释和批量处理功能。

适用场景

1. 基因注释与功能分析


研究人员在进行基因组学项目时,需要快速获取基因的详细注释信息。本工具可以检索基因的命名、别名、参考序列(RefSeqs)、基因本体(GO)注释、染色体位置等完整信息,适用于基因功能研究、通路分析和变异解读。

2. 批量基因数据处理


当项目涉及大量基因时,逐个查询非常耗时。本工具提供批量查询功能,可以一次性处理数百个基因符号或 Gene ID,自动处理速率限制,适用于基因面板验证、注释表构建和基因标识符交叉引用等场景。

3. 序列数据获取


无论是转录本序列、蛋白序列还是基因组序列,都可以通过本工具快速获取。支持 JSON、XML、FASTA 等多种格式输出,满足下游序列分析、比对和可视化的需求。

核心功能

1. 灵活的基因搜索


支持通过基因符号、Gene ID、疾病关联、GO 术语、染色体位置等多种方式进行搜索。可指定物种范围,避免基因符号歧义。提供 E-utilities 和 Datasets API 两种查询方式,满足从简单到复杂的各种查询需求。

2. 完整的基因信息检索


获取包括基因命名、别名、参考序列(mRNA 和蛋白)、染色体定位、GO 注释、相关文献在内的全面信息。Datasets API 可在一次请求中返回元数据和序列,简化数据处理流程。

3. 高效的批量处理


内置批量查询脚本,支持从文件读取基因列表或直接提供 ID 列表。自动处理 API 速率限制(使用 API key 时可达 10 次/秒),确保大量查询稳定进行。适用于基因列表验证、注释信息批量获取等场景。

常见问题

如何获取 NCBI API 密钥?


注册 NCBI 账户后,访问 https://www.ncbi.nlm.nih.gov/account/ 即可免费获取 API 密钥。使用 API 密钥可将查询速率从 3 次/秒提升至 10 次/秒,大幅提高批量处理效率。

E-utilities 和 Datasets API 有什么区别?


E-utilities 是 NCBI 的传统 API,支持所有 Entrez 数据库的复杂查询和跨数据库搜索,灵活性更高。Datasets API 是较新的接口,专门为基因数据优化,可在单次请求中获取完整的元数据和序列数据,使用更简单。推荐简单查询使用 Datasets API,复杂跨数据库查询使用 E-utilities。

支持哪些数据输出格式?


工具支持 JSON、XML、GenBank、FASTA 和纯文本等多种格式。JSON 适合程序化处理,XML 保留完整的元数据层次结构,FASTA 专为序列分析优化。可根据下游工具的需求选择合适的输出格式。