Awesome Data Science in Python | 一文整理Python常用数据科学第三方模块

1. 机器学习

EDA

特征工程

模型解释

通用

自动化机器学习

2. 统计方法

通用

  • StatsModels:通用概率派
  • Scipy:含常见分布、统计量计算
  • pyro:基于pyTorch的通用统计模型库
  • Edward:基于tensorflow的通用统计模型库

贝叶斯

  • PyStan:贝叶斯模型(stan实现)
  • pymc3/pymc4(还在pre-release版本):贝叶斯模型(theano/tensorflow实现)

3. 特殊算法集

时间序列

  • pyflux:实现常用时间序列模型
  • Prophet:基于强解释的GAM(线性可加模型)

生存模型

聚类

网络

GBM

4. 可视化

5. NLP

通用

主题模型

常用Embedded集

6. ETL

7. 因果推理

8. 符号运算

你可能感兴趣的:(统计学,数据科学,机器学习,python)