dnanexus-integration
DNAnexus云基因组学平台。构建应用程序/小程序,管理数据(上传/下载),dxpy Python SDK,运行工作流,支持FASTQ/BAM/VCF格式,用于基因组学流程开发与执行。
分类
开发工具安装
热度:31
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
下载并安装这个技能 https://openskills.cc/api/download?slug=k-dense-ai-scientific-skills-dnanexus-integration&locale=zh&source=copy
DNAnexus Integration - 云基因组平台与生物信息学分析工具
技能概述
DNAnexus Integration 是一个面向云端基因组分析和生物信息学工作流开发的 AI 技能,帮助用户在 DNAnexus 云平台上构建应用、管理数据、运行分析流程,并使用 dxpy Python SDK 进行自动化操作。
适用场景
1. 基因组数据分析与流程开发
当您需要在云端处理测序数据(FASTQ、BAM、VCF 等格式)、构建生物信息学分析流程、或开发自定义基因组应用时,此技能提供完整的 DNAnexus 平台支持,涵盖从数据上传到结果输出的全流程。
2. 大规模数据管理与批处理
当您需要管理大量测序样本、组织多项目数据、或需要并行处理多个分析任务时,此技能帮助您使用 DNAnexus 的数据对象系统和作业执行功能,实现高效的云端批处理。
3. Python 自动化脚本开发
当您需要编写自动化脚本来管理 DNAnexus 项目、批量操作文件、监控作业状态,或集成 DNAnexus 到现有工作流中时,此技能提供完整的 dxpy SDK 参考和代码模式。
核心功能
1. 应用开发与部署
提供 DNAnexus 应用和应用程序(applet)的完整开发流程,包括使用 dx-app-wizard 生成项目骨架、编写 Python/Bash 入口点、配置 dxapp.json、以及使用
dx build 部署到平台。支持 Docker 集成、依赖管理和实例类型配置。2. 数据操作与管理
涵盖 DNAnexus 平台上所有数据操作,包括文件上传下载、记录创建管理、数据对象搜索、项目文件夹组织、以及跨项目数据克隆。支持添加元数据和标签,便于数据发现和组织。
3. 作业执行与工作流编排
提供在 DNAnexus 上运行分析、监控作业状态、创建子作业并行处理、以及构建多步骤工作流的完整指导。支持作业链式调用和输出引用,适用于复杂的基因组分析流程。
4. dxpy Python SDK
完整的 dxpy 库参考,包括 DXFile、DXRecord、DXApplet 等数据对象处理器,高级实用函数,以及直接 API 调用方法。提供常见代码模式和错误处理示例。
5. 配置与依赖管理
详细的 dxapp.json 规范说明,包括输入输出定义、运行规格配置、系统包安装、自定义资源打包、Docker 集成,以及实例类型和超时设置。
常见问题
DNAnexus 是什么?需要什么条件使用?
DNAnexus 是一个云端生物医学数据分析和基因组平台。使用此技能需要您拥有有效的 DNAnexus 账户。平台支持开发可执行程序(apps/applets)、管理数据对象、运行分析工作流,并提供 dxpy Python SDK 进行程序化访问。常见用途包括序列比对、变异检测、质量控制和格式转换等生物信息学流程。
DNAnexus 支持哪些文件格式?
DNAnexus 作为通用数据平台,支持所有文件格式。在基因组学领域,常用格式包括:FASTQ(测序 reads)、BAM/CRAM(比对结果)、VCF(变异调用)、BED(基因组区间)、GFF/GTF(基因注释)等。此技能提供这些格式处理的最佳实践和常见工具集成示例。
如何开始使用 DNAnexus 进行开发?
首先安装 dxpy:
uv pip install dxpy。然后使用 dx login 进行身份验证。您可以使用 dx-app-wizard 快速生成应用骨架,编写 Python 或 Bash 入口点代码,配置 dxapp.json 文件,最后使用 dx build 部署。此技能包含完整的开发参考文档和代码示例,涵盖从入门到高级的所有场景。