Python统计建模分析工具包statsmodels的使用简介

       在Python中,statsmodels是统计建模分析的核心工具包,其包括了几乎所有常见的各种回归模型、非参数模型和估计、时间序列分析和建模以及空间面板模型等,其功能是很强大的,使用也相当便捷,当然前提是知道怎么去使用。最实用最有效的方式自然是自己去看官方的文档,学习里面的例子,学会如何去使用,但是对于刚开始的学习者来说,这种大的文档难免显得有点庞杂,因此本文旨在从大的方向上去介绍一下使用方法,不会具体的讲里面的细节,以给初学者一个大概的方向。

       我们在统计分析和建模的过程中,大致可以分为数据获取和处理、数据分析和建模及预测、结果可视化这三个步骤。下面我们就这三个步骤来一一简单的说明statsmodels可以起到的作用。

一、数据的获取

       我们当然可以有自己的数据,带着处理好的数据去使用这个包,但是实际上statsmodels提供了丰富的数据库接口,可以获取R里面可以获取的数据库数据,以及其他各种数据库的数据,详见下图。对于具体的接口,读者可以自己看官方文档。

Python统计建模分析工具包statsmodels的使用简介_第1张图片

二、统计建模

       这部分其实不用多说,读者根据文档目录选择自己需要的模型即可。

三、结果可视化

       对于可视化,我们自然可以用其他的包来实现,但是有些可视化是有一定的统计限制的,比如对于ACF和PACF的可视化,除了要求系数的bar图,还需要画出置信区间,这时候自己实现就相当麻烦。对此,statsmodels提供了Graphics工具,让我们可以直接画出这些图。

Python统计建模分析工具包statsmodels的使用简介_第2张图片

       当然,最后对于一些常见的模型的使用,statsmodels还提供了例子进行讲解,读者可以参考文档的Exampes这一项,里面有比较丰富的各种例子,可以学习使用方法。对于一些比较具体的方法或函数,如果文档没有详细说明,读者还可以自己点击Source看源码。

你可能感兴趣的:(量化投资,数据分析)