学习笔记:写在开头

总结这几天的教训——“好记性不如烂笔头”,像我这种记忆力堪比金鱼的脑子,相当适用。

最近就是遇到问题现去百度,解决了也就丢了,导致遇到一次去百度一次,解决一次忘一次,总之留了个印象,具体代码怎么写,老记不住,毕竟一会儿有时候在eclipse上写代码,一会儿为了方便分析处理数据又在Jupyter notebook上写,文件命名也随性,反正乱七八糟,效率极低,所以有了开头。

记下遇到的问题和解决方案,方便自己回顾(降低检索成本),利己利人。

时间紧,任务中,先粗略写一丢丢,有时间了再细细整理。

一、有关pandas

1、分组聚合:http://www.cnblogs.com/zephyr-1/p/5874678.html

2、去重函数:http://blog.csdn.net/xinxing__8185/article/details/48022401

3、缺失值定位:http://blog.csdn.net/u012387178/article/details/52571725

二、有关Python计量包stats models

statsmodels模块简介:http://jingyan.baidu.com/article/3d69c5518fd2e2f0cf02d73a.html

import numpy as np

import statsmodels.api as sm

[1]Linear Regression Model

lrm_data =sm.datasets.spector.load()

lrm_data.exog=sm.add_constant(lrm_data.exog,prepend=False)

lrm_model = sm.OLS(lrm_data.endog,lrm_data.exog)

res = lrm_model.fit()

print(res.summary())

[2]Generalized Linear Model:主要用于各种设计的方差分析

data = sm.datasets.scotland.load()

data.exog = sm.add_constant(data.exog)

gamma_model = sm.GLM(data.endog,data.exog,family=sm.families.Gamma())

results = gamma_model.fit()

[3]Robust Linear model

data = sm.datasets.stackloss.load()

data.exog = sm.add_constant(data.exog)

rlm = sm.RLM(data.endog,data.exog,M=sm.robust.norms.HuberT())

res =rlm.fit()

print(res.params)

[4]Discrete Chioce Model:离散选择模型,Logit模型属于离散选择模型,主要用于微观计量经济学范畴

data = sm.datasets.spector.load()

data.exog = sm.add_constant(data.exog)

logit = sm.Logit(data.endog,data.exog)

res = logit.fit()

print(res.summary())

[5]ANOVA 方差分析

[6]Time series analysis:时间序列分析

[7]Nonparametric estimators:非参检验

[8]各种统计检验

[9]以各种方式输出表格

你可能感兴趣的:(学习笔记:写在开头)