gene-database
通过E-utilities/Datasets API查询NCBI基因数据库。支持基因符号/ID检索,获取基因信息(RefSeq序列、基因本体注释、染色体位置、表型数据),支持批量查询,适用于基因注释与功能分析。
分类
其他工具安装
热度:12
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
下载并安装这个技能 https://openskills.cc/api/download?slug=k-dense-ai-scientific-skills-gene-database&locale=zh&source=copy
Gene Database - NCBI 基因信息查询工具
技能概述
Gene Database 是一个便捷的 NCBI Gene 数据库查询工具,支持通过 E-utilities 和 Datasets API 检索基因信息,包括基因符号查询、序列获取、功能注释和批量处理功能。
适用场景
1. 基因注释与功能分析
研究人员在进行基因组学项目时,需要快速获取基因的详细注释信息。本工具可以检索基因的命名、别名、参考序列(RefSeqs)、基因本体(GO)注释、染色体位置等完整信息,适用于基因功能研究、通路分析和变异解读。
2. 批量基因数据处理
当项目涉及大量基因时,逐个查询非常耗时。本工具提供批量查询功能,可以一次性处理数百个基因符号或 Gene ID,自动处理速率限制,适用于基因面板验证、注释表构建和基因标识符交叉引用等场景。
3. 序列数据获取
无论是转录本序列、蛋白序列还是基因组序列,都可以通过本工具快速获取。支持 JSON、XML、FASTA 等多种格式输出,满足下游序列分析、比对和可视化的需求。
核心功能
1. 灵活的基因搜索
支持通过基因符号、Gene ID、疾病关联、GO 术语、染色体位置等多种方式进行搜索。可指定物种范围,避免基因符号歧义。提供 E-utilities 和 Datasets API 两种查询方式,满足从简单到复杂的各种查询需求。
2. 完整的基因信息检索
获取包括基因命名、别名、参考序列(mRNA 和蛋白)、染色体定位、GO 注释、相关文献在内的全面信息。Datasets API 可在一次请求中返回元数据和序列,简化数据处理流程。
3. 高效的批量处理
内置批量查询脚本,支持从文件读取基因列表或直接提供 ID 列表。自动处理 API 速率限制(使用 API key 时可达 10 次/秒),确保大量查询稳定进行。适用于基因列表验证、注释信息批量获取等场景。
常见问题
如何获取 NCBI API 密钥?
注册 NCBI 账户后,访问 https://www.ncbi.nlm.nih.gov/account/ 即可免费获取 API 密钥。使用 API 密钥可将查询速率从 3 次/秒提升至 10 次/秒,大幅提高批量处理效率。
E-utilities 和 Datasets API 有什么区别?
E-utilities 是 NCBI 的传统 API,支持所有 Entrez 数据库的复杂查询和跨数据库搜索,灵活性更高。Datasets API 是较新的接口,专门为基因数据优化,可在单次请求中获取完整的元数据和序列数据,使用更简单。推荐简单查询使用 Datasets API,复杂跨数据库查询使用 E-utilities。
支持哪些数据输出格式?
工具支持 JSON、XML、GenBank、FASTA 和纯文本等多种格式。JSON 适合程序化处理,XML 保留完整的元数据层次结构,FASTA 专为序列分析优化。可根据下游工具的需求选择合适的输出格式。