常用的统计模型

1.广义线性模型(是多数监督机器学习方法的基础,如逻辑回归和Tweedie回归)

2.时间序列方法(ARIMA ,SSA,基于机器学习的方法)

3.结构方程建模(针对潜变量之间关系进行建模)

4.因子分析(调查设计和验证的探索型分析)

5.功效分析/实验分析(特别是基于仿真的实验设计,以避免分析过度)

6.非参数检验(MCMC)
7.K均值聚类

8.贝叶斯方法(朴素贝叶斯、贝叶斯模型平均/Bayesian model averaging、贝叶斯适应型实验/Bayesian adaptive trials)

9.惩罚性回归模型(弹性网络/Elastic Net,LASSO,LARS),以及对通用模型(SVM\XGboost等)加惩罚,这对于预测变量多与观测值的数据很有用,在基因组学和社会科学研究中较为常用。

10.样条模型/SPline-based models(MARS等):主要用于流程建模。

11.马尔可夫链和随机过程(时间序列建模和预测建模的替代方法)

12.缺失数据插补方法及其假设(missFores,MICE)

13.生存分析/survival analysis(主要特点是考虑了每个观测出现某一结局的时间长短)

14.混合建模

15.统计推理和组群测试

建议读者根据自己所学领域重点学习面向特定领域的专用模型

##以上内容均来自《python 编程从数据分析到数据科学》

你可能感兴趣的:(python,数据挖掘)