statsmodels
Python统计模型库。适用于需要特定模型类(如OLS、GLM、混合模型、ARIMA)并附带详细诊断、残差分析和推断功能的场景。特别适合计量经济学、时间序列分析及需要严谨系数表推断的研究。若需基于APA格式的统计检验指导与报告生成,请使用statistical-analysis工具。
分类
其他工具安装
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
Statsmodels - Python 统计建模与计量经济学分析工具
技能概述
Statsmodels 是 Python 专业的统计建模库,提供从线性回归、广义线性模型到时间序列分析的完整统计工具链,适用于需要严谨统计推断和模型诊断的计量经济学、时间序列分析和学术研究场景。
适用场景
适合需要严谨统计推断的经济数据分析,包括 OLS/WLS/GLS 回归、工具变量估计、面板数据模型等,提供完整的系数表、标准误、t 检验等统计推断输出。
支持 ARIMA、SARIMAX、VAR 等时间序列模型,提供平稳性检验、ACF/PACF 分析、预测区间计算等完整的时间序列建模流程。
涵盖广义线性模型(Logistic、Poisson、Gamma 等)、离散选择模型、混合效应模型,以及各种残差诊断、异方差检验、正态性检验等统计测试。
核心功能
支持 OLS、WLS、GLS、分位数回归等线性模型,以及 Logit/Probit、Poisson、负二项等广义线性模型,提供模型假设检验、影响点识别、稳健标准误等诊断功能。
包含 ARIMA、SARIMAX、VAR、指数平滑等单变量和多变量时间序列模型,支持平稳性检验、Granger 因果检验、脉冲响应分析,并提供带置信区间的预测。
提供残差诊断(异方差、自相关、正态性检验)、影响点分析(Cook's 距离、杠杆值)、多重比较校正、功效分析等完整的统计验证工具。
常见问题
Statsmodels 和 scikit-learn 有什么区别?应该选哪个?
Statsmodels 专注于统计推断和模型解释,输出完整的统计表(系数、标准误、p 值、置信区间),适合学术研究和需要理解变量关系的场景。scikit-learn 专注于预测精度和机器学习流程,提供更丰富的模型选择和工程化工具。如果你的目标是理解变量间关系、做严谨的统计检验,选 Statsmodels;如果目标是构建预测模型,选 scikit-learn。
如何用 Statsmodels 进行线性回归?
使用 sm.OLS(y, X) 拟合模型,注意必须先用 sm.add_constant(X) 添加截距项。拟合后调用 fit() 方法获取结果,summary() 查看完整的统计表。可以使用 get_prediction() 获取带置信区间的预测值,用 results.resid 访问残差进行诊断分析。
Statsmodels 支持哪些统计模型?
Statsmodels 支持广泛的统计模型:线性模型(OLS、WLS、GLS、分位数回归)、广义线性模型(Logistic、Poisson、Gamma、负二项)、离散选择模型(Logit、Probit、多项 Logit)、时间序列模型(ARIMA、SARIMAX、VAR、指数平滑)、混合效应模型,以及各种统计检验和诊断工具。