pyhealth

综合性医疗人工智能工具包,用于利用临床数据开发、测试和部署机器学习模型。该技能适用于处理电子健康记录(EHR)、临床预测任务(死亡率、再入院率、药物推荐)、医疗编码系统(ICD、NDC、ATC)、生理信号(EEG、ECG)、医疗数据集(MIMIC-III/IV、eICU、OMOP),或为医疗应用实施深度学习模型(RETAIN、SafeDrug、Transformer、GNN)。

安装

热度:2

下载并解压到你的 skills 目录

复制命令,发送给 OpenClaw 自动安装:

下载并安装这个技能 https://openskills.cc/api/download?slug=k-dense-ai-scientific-skills-pyhealth&locale=zh&source=copy

PyHealth: 医疗 AI 工具包 - 临床机器学习与医疗数据处理框架

技能概述


PyHealth 是一个专为医疗 AI 设计的 Python 工具包,帮助开发者快速处理电子健康记录(EHR)、构建临床预测模型、进行医疗编码转换,支持从数据加载到模型部署的完整工作流程。

适用场景

1. 医疗数据集分析与处理


当你需要处理 MIMIC-III/IV、eICU、OMOP 等主流医疗数据集时,PyHealth 提供统一的标准化接口,支持患者、就诊、事件三层数据结构,比 pandas 快 3 倍的数据处理性能,让你专注于模型开发而非数据清洗。

2. 临床预测模型开发


当你需要构建死亡率预测、再入院风险、药物推荐、住院时长预测等临床任务时,PyHealth 内置 20+ 预定义任务和 33+ 模型(包括 RETAIN、SafeDrug、Transformer 等医疗专用模型),简化建模流程,加速研究迭代。

3. 医疗编码转换与标准化


当你需要在不同医疗编码系统之间转换时(如 ICD-9/10、NDC、ATC、RxNorm),PyHealth 提供 InnerMap 和 CrossMap 工具,支持跨系统翻译和层级分类,无需手动维护复杂的编码映射表。

核心功能

1. 一站式医疗数据加载


支持 10+ 医疗数据集的自动加载和标准化,包括 EHR 数据(MIMIC、eICU、OMOP)、生理信号(睡眠 EEG、心电 ECG)、医学影像和临床文本,提供按患者分割的训练/验证/测试集划分功能,有效防止数据泄露。

2. 丰富的临床预测任务


内置死亡率预测、医院再入院、药物推荐、住院时长、医疗编码等 20+ 临床任务,支持自定义任务定义。每个任务自动处理输入输出格式、标签过滤和样本生成,适配不同的数据类型(EHR、信号、影像、文本)。

3. 医疗专用深度学习模型


提供 33+ 模型选择,包括通用基线(逻辑回归、MLP、CNN、RNN、Transformer)和医疗专用模型(RETAIN、SafeDrug、GAMENet、StageNet、AdaCare),支持可解释性分析、模型校准、不确定性量化等临床部署必需功能。

常见问题

PyHealth 是什么?主要用途是什么?


PyHealth 是一个开源的医疗 AI 工具包,专门用于处理临床数据和开发医疗机器学习模型。它主要用于电子健康记录(EHR)分析、临床预测任务(如死亡率预测、药物推荐)、医疗编码转换(ICD、NDC、ATC 等)以及生理信号处理(EEG、ECG)。相比通用机器学习框架,PyHealth 针对医疗数据的特点进行了优化,提供了标准化接口和预置模型。

PyHealth 支持哪些医疗数据集?


PyHealth 支持 10+ 主流医疗数据集,包括:EHR 数据(MIMIC-III、MIMIC-IV、eICU、OMOP CDM)、生理信号(SleepEDF、SHHS 睡眠 EEG 数据)、医学影像(COVID-19 胸部 X 光)、临床文本(MIMIC 临床笔记)。所有数据集通过统一接口加载,自动处理数据格式差异,方便跨数据集研究。

使用 PyHealth 需要什么基础?


PyHealth 适合具备 Python 基础和机器学习概念的用户。虽然医疗背景知识有助于理解业务场景,但不是必需的——PyHealth 的文档提供了详细的领域知识说明。技术要求方面,需要 Python ≥ 3.7、PyTorch ≥ 1.8,推荐使用 GPU 加速深度学习训练。如果你熟悉 PyTorch,上手 PyHealth 会非常快。