Python量化学习记录(持更)

目录

Intro:

数据处理(Numpy和Pandas)

Intro:

入门量化不久的菜鸡,主攻基本面量化。python半系统性自学,有些小功能靠自己实现,代码效率可能较低或者存在错误,还请各位看官不吝赐教。

数据处理(Numpy和Pandas)

  1. 求累积移动平均值(标准差),应用.expanding()命令:对dataframe的某一列X,对每一行,建立新的一列X_mean求第一行到前一行的均值(标准差)

    data['X_mean'] = data['X'].expanding().mean().shift(1)
    data['X_mean'] = data['X'].expanding().std().shift(1)
  2. data[‘xxx’].plot()报错no numeric data to plot,解决方案:转化为浮点型,

    data['xxx'].astype('float').plot()
  3. 整数补零,注意区分类型为字符串还是整数:

    df['xxx'].zfill(2)
  4. df中X列有连续重复数字,可删掉后仅保留第一个或最后一个重复数字:

    df.drop_duplicates('X',keep = 'first') # or keep = 'last'

你可能感兴趣的:(学习)