statsmodels

Python统计模型库。适用于需要特定模型类(如OLS、GLM、混合模型、ARIMA)并附带详细诊断、残差分析和推断功能的场景。特别适合计量经济学、时间序列分析及需要严谨系数表推断的研究。若需基于APA格式的统计检验指导与报告生成,请使用statistical-analysis工具。

安装

热度:11

下载并解压到你的 skills 目录

复制命令,发送给 OpenClaw 自动安装:

下载并安装这个技能 https://openskills.cc/api/download?slug=k-dense-ai-scientific-skills-statsmodels&locale=zh&source=copy

Statsmodels - Python 统计建模与计量经济学分析工具

技能概述

Statsmodels 是 Python 专业的统计建模库,提供从线性回归、广义线性模型到时间序列分析的完整统计工具链,适用于需要严谨统计推断和模型诊断的计量经济学、时间序列分析和学术研究场景。

适用场景

  • 计量经济学与经济数据分析

  • 适合需要严谨统计推断的经济数据分析,包括 OLS/WLS/GLS 回归、工具变量估计、面板数据模型等,提供完整的系数表、标准误、t 检验等统计推断输出。

  • 时间序列分析与预测

  • 支持 ARIMA、SARIMAX、VAR 等时间序列模型,提供平稳性检验、ACF/PACF 分析、预测区间计算等完整的时间序列建模流程。

  • 统计建模与假设检验

  • 涵盖广义线性模型(Logistic、Poisson、Gamma 等)、离散选择模型、混合效应模型,以及各种残差诊断、异方差检验、正态性检验等统计测试。

    核心功能

  • 完整的回归模型家族

  • 支持 OLS、WLS、GLS、分位数回归等线性模型,以及 Logit/Probit、Poisson、负二项等广义线性模型,提供模型假设检验、影响点识别、稳健标准误等诊断功能。

  • 时间序列建模与预测

  • 包含 ARIMA、SARIMAX、VAR、指数平滑等单变量和多变量时间序列模型,支持平稳性检验、Granger 因果检验、脉冲响应分析,并提供带置信区间的预测。

  • 统计检验与诊断工具

  • 提供残差诊断(异方差、自相关、正态性检验)、影响点分析(Cook's 距离、杠杆值)、多重比较校正、功效分析等完整的统计验证工具。

    常见问题

    Statsmodels 和 scikit-learn 有什么区别?应该选哪个?

    Statsmodels 专注于统计推断和模型解释,输出完整的统计表(系数、标准误、p 值、置信区间),适合学术研究和需要理解变量关系的场景。scikit-learn 专注于预测精度和机器学习流程,提供更丰富的模型选择和工程化工具。如果你的目标是理解变量间关系、做严谨的统计检验,选 Statsmodels;如果目标是构建预测模型,选 scikit-learn。

    如何用 Statsmodels 进行线性回归?

    使用 sm.OLS(y, X) 拟合模型,注意必须先用 sm.add_constant(X) 添加截距项。拟合后调用 fit() 方法获取结果,summary() 查看完整的统计表。可以使用 get_prediction() 获取带置信区间的预测值,用 results.resid 访问残差进行诊断分析。

    Statsmodels 支持哪些统计模型?

    Statsmodels 支持广泛的统计模型:线性模型(OLS、WLS、GLS、分位数回归)、广义线性模型(Logistic、Poisson、Gamma、负二项)、离散选择模型(Logit、Probit、多项 Logit)、时间序列模型(ARIMA、SARIMAX、VAR、指数平滑)、混合效应模型,以及各种统计检验和诊断工具。