scvi-tools
单细胞组学深度生成模型。适用于需要概率批次校正(scVI)、迁移学习、不确定性差异表达分析或多模态整合(TOTALVI、MultiVI)的场景。最擅长高级建模、批次效应处理及多模态数据分析。常规分析流程建议使用scanpy。
分类
AI 技能开发安装
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
scvi-tools - 单细胞组学深度生成模型框架
技能概述
scvi-tools 是基于 PyTorch 和 PyTorch Lightning 构建的 Python 框架,专为单细胞基因组学设计,提供深度生成模型和变分推断方法,用于处理多种单细胞数据模态的分析任务。
适用场景
1. 单细胞测序数据的批量校正与整合
当您需要整合来自不同批次、不同实验室或不同平台产生的单细胞数据时,scvi-tools 提供的概率批量校正方法可以有效去除技术噪音,保留生物学变异。适用于处理多个实验来源的数据集合并分析。
2. 多模态单细胞数据联合分析
当您拥有 CITE-seq、multiome 等多模态数据时,scvi-tools 的 totalVI 和 MultiVI 模型可以对蛋白质和 RNA、或配对/非配对的多组学数据进行联合建模,实现更全面的生物学发现。
3. 带不确定性的高级统计推断
当您需要进行差异表达分析、细胞类型注释或 RNA 速度分析,并希望获得概率化的不确定度量时,scvi-tools 基于贝叶斯推断的方法可以提供比传统方法更严谨的统计结论。
核心功能
1. 统一 API 的深度生成模型
scvi-tools 提供超过 20 种预训练模型,涵盖单细胞 RNA-seq(scVI、scANVI)、ATAC-seq(PeakVI、PoissonVI)、多模态整合(totalVI、MultiVI)和空间转录组学(DestVI、Stereoscope)等场景。所有模型遵循一致的 API 模式:数据注册 → 模型训练 → 结果提取,并可与 scanpy 无缝集成。
2. 概率批量校正与数据整合
通过变分自编码器(VAE)架构,scvi-tools 能够学习数据的潜在表示,自动分离技术变异(如批次效应、供体差异)和生物学变异。支持在 setup_anndata 阶段注册分类和连续协变量,灵活建模已知的技术因子。
3. 带不确定性的差异表达分析
不同于传统频率学派的 DE 方法,scvi-tools 提供基于复合假设检验的概率化差异表达分析,可以同时估计效应大小和统计不确定性,支持设定最小效应阈值,获得更可靠的生物学结论。
常见问题
scvi-tools 和 scanpy 有什么区别?应该选择哪个?
scanpy 是单细胞分析的标准流程工具,适用于常规的数据预处理、可视化和基础分析。scvi-tools 专注于高级统计建模和深度学习方法,适合需要批量校正、多模态整合或带不确定性量化分析的场景。许多用户会结合使用:用 scanpy 做预处理,用 scvi-tools 做高级建模,再用 scanpy 做下游可视化。
如何用 scVI 进行单细胞数据的批量校正?
首先确保使用原始计数数据(未经 log-normalization),然后调用 scvi.model.SCVI.setup_anndata() 注册批次信息,创建模型并训练,最后用 get_latent_representation() 获取批量校正后的潜在表示。整个过程只需几行代码,模型会自动学习去除批次效应。
scvi-tools 支持 GPU 吗?
是的,scvi-tools 基于 PyTorch Lightning,可以自动检测并利用可用的 GPU 加速训练。对于大型数据集(数万到数十万个细胞),启用 GPU 可以显著缩短训练时间。安装时可使用 pip install scvi-tools[cuda] 获取 GPU 支持。