python面板数据分析代码_对于大面板数据,回归就绪格式的Excel到Python?

试图从Excel中获取一些大面板数据到python中,所以我可以做一些GMM /横截面面板数据回归分析(想想sci-kit软件包)。我把我的数据从excel移到了Python,但是回归分析的格式不正确(见下文)。 Scikit网站上有一些可供玩家使用的数据集,但对于讨论格式以及如何将数据转换为类似的格式以便将数据导入到Python中来说,并不是那么有用。对于大面板数据,回归就绪格式的Excel到Python?

有没有人有任何使用Excel(.xlsx)数据并将其转化为Python的经验,“回归就绪”?

我已经在R和Stata中完成了我所需的回归分析,但是我想在使用Python进行回归分析方面做得更好,因为它有一些很好的属性。

这是我迄今为止的数据帧格式,从excel到Python。 (这是从10000×60形状的数据集截断)

BANKS YEARS CIR DSF EQCUS EQLI EQNT EQUITY

0 CR1 2005 65.46 927915.00 28.553 23.948 37.542 264946.50

1 CR1 2006 65.98 1026491.00 30.491 26.584 36.143 312986.00

2 CR1 2007 60.26 1437615.00 27.003 23.413 28.238 388197.20

3 CR1 2008 58.08 1605464.00 24.024 20.160 25.828 385696.80

4 CR1 2009 65.21 1538570.00 28.160 22.850 27.907 433267.30

5 CR1 2010 54.45 1822863.00 31.009 24.555 28.274 565254.60

6 CR1 2011 57.38 2075505.00 30.905 24.861 29.618 641440.50

7 CR1 2012 62.12 2533641.00 29.595 24.509 28.883 749821.50

数据类型:

>>>df.dtypes

BANKS object

YEARS int64

CIR float64

DSF float64

EQCUS float64

EQLI float64

EQNT float64

EQUITY float64

的Unicode中的列(我不认为科幻套件喜欢这一点!)

>>>df.columns.tolist()

[u'BANKS', u'YEARS', u'CIR', u'DSF', u'EQCUS', u'EQLI', u'EQNT', u'EQUITY']

+0

我没有看到数据集的任何问题。这是一个熊猫数据框,它可以用于scikit-learn。使用这个数据集时你面临的问题是什么? –

+0

我想在scikit-learn页面上,我没有看到任何输入excel数据的文档。我看到的只是他们已经加载的数据集,然后他们开始提取特征,并适合模型。我如何为上面的这些数据运行基本的OLS?我在scikit页面上的任何地方都没有看到。 Statsmodels有类似的文档问题。 –

你可能感兴趣的:(python面板数据分析代码)