statsmodels 0.10.0中文文档

为什么翻译

本人会计出身,转行数据分析(更多是用excel、sql、spss等工具),30岁开始入坑python,在学习statsmodels包的过程中,在知乎、百度、CSDN和github上均没有找到statsmodels的中文文档,一开始以为 ApacheCN 开源组织(号称一群有想法,爱装逼,爱斗图,有活力,爱搞事,爱吃辣条的朋友)已经翻译了该包的文档,最后发现他们只是翻译该文档的目录,为了更好地入坑,我只好用我那拙劣的英语、再加上谷歌翻译,经过三四个月时间的翻译,目前docs和example文件均已翻译,目前翻译ing,水平有限,请大家多担待。翻译这个活没有什么技术可言,但真的很苦逼。所以真的非常的感谢 ApacheCN 开源组织在我学习的过程中贡献的各种中文文档,非常感谢!

项目github链接地址:https://github.com/Squidxwh/statsmodels

关于统计模型

statsmodels是一个Python软件包,为scipy提供了补充,以进行统计计算,包括描述性统计以及统计模型的估计和推断。

statsmodels主要包括如下子模块:

回归模型:线性回归,广义线性模型,稳健的线性模型,线性混合效应模型等等。

方差分析(ANOVA)。

时间序列分析:AR,ARMA,ARIMA,VAR和其它模型。

非参数方法: 核密度估计,核回归。

统计模型结果可视化。

比较statsmodels更关注统计推断,提供不确定估计和参数p-value。相反的,scikit-learn注重预测

主要特点

线性回归模型:

-普通最小二乘法
-广义最小二乘法
-加权最小二乘法
-具有自回归误差的最小二乘
-分位数回归
-递归最小二乘法

具有混合效应和方差成分的混合线性模型
GLM:支持所有单参数指数族分布的广义线性模型
用于二项式和泊松的贝叶斯混合GLM
GEE:单向聚类或纵向数据的广义估计方程
离散模型:

-Logit 和 Probit
-多项 logit (MNLogit)
-泊松和广义泊松回归
-负二项式回归
-零膨胀计数模型

RLM: 鲁棒的线性模型,支持多个 M 估计器。
时间序列分析:时间序列分析模型

-完整的StateSpace建模框架
	-季节性ARIMA和ARIMAX模型
	-VARMA和VARMAX模型
	-动态因子模型
	-未观测到的组件模型

马尔可夫切换模型(MSAR),也称为隐马尔可夫模型(HMM)
单变量时间序列分析:AR,ARIMA
矢量自回归模型,VAR和结构VAR
矢量误差修正模型,VECM
指数平滑,Holt-Winters
时间序列的假设检验:单位根,协整和其他
用于时间序列分析的描述性统计数据和过程模型

生存分析:

-比例风险回归(Cox模型)
-生存者函数估计(Kaplan-Meier)
-累积发生率函数估计

多变量:

-缺失数据的主成分分析
-旋转因子分析
-MANOVA
-典型相关

非参数统计:单变量和多变量核密度估计
数据集:用于示例和测试的数据集
统计:广泛的统计检验

-诊断和规格检验
-拟合优度和正态性检验
-多元测试函数
-各种其他统计检验

使用MICE进行插补,秩序统计回归和高斯插补
调解分析
图形包括用于数据和模型结果的可视化分析的绘图功能
输入/输出

-用于读取Stata .dta文件的工具,但pandas具有较新的版本
-表输出到ascii,latex和html

其他模型
Sandbox:statsmodels包含一个 sandbox 文件夹,其中包含处于开发和测试各个阶段的代码, 因此不被视为“生产就绪”。其中包括:

-广义矩法(GMM)估计器
-核回归
-scipy.stats.distributions的各种扩展
-面板数据模型
-信息理论测度

你可能感兴趣的:(python,中文文档)