20170525 周四 pandas

code: pandas入门与时间序列分析.ipynb

  1. 完成 http://www.icourse163.org/learn/BIT-1001870002?tid=1001963001#/learn/examlist
    上的考试

体会: pandas 的相关用法是在是太多了!随用随查:
参考中文网站:
https://zhuanlan.zhihu.com/p/25630700
http://www.th7.cn/Program/Python/201412/329841.shtml
http://www.cnblogs.com/zuizui1204/p/6423069.html
和下载的 pandas-cheat-sheet

  1. 趁热打铁,学习 pandas:
    https://yq.aliyun.com/articles/81469

dataframe 可以直接用 df.plot() 作图,然后 plt.show() 显示

聚合: 往往根据索引 index 来 groupby, 可以根据日期,也可以根据周; 比如这里的index已经是 to_datatime 得到的;
df.groupby(df.index.week).counts() 或 means()
df.index.date

意思就是:对这张含时的二维数据表中的信息进行处理,先按天或周聚合,得到的对象自然可以计数或求其平均值


  1. http://www.julyedu.com/video/play/66/614
    kaggle实战

模型融合:
1.bagging 解决过拟合
如: 1:10的正负样本,可以将负样本分为10份,每份和正样本训练得出一个分类器/回归器,

20170525 周四 pandas_第1张图片
1.JPG

使用 sklearn.ensemble.BaggingClassifier
随机森林是其中的一种。

Adaboost 调样本的权重

你可能感兴趣的:(20170525 周四 pandas)