python常用命令

  1. 打开csv文件
    import pandas as pd
    df=pd.read_csv(r’data/data.csv’)
  2. dataframe index 重新排序
    data=df.sort_index(axis=0,ascending=False)
    http://bluewhale.cc/2016-08-06/use-pandas-filter-and-sort.html
  3. dataframe 按照某一列进行升序或者降序排列
    data=df.sort([‘date’],ascending=True升序,False降序)
  4. dataframe 的index重新从0开始
    data=data.reset_index(drop=True)
  5. 画横坐标是日期的图
    import matplotlib.pyplot as plt
    x=data[‘date’]#日期是字符串形式
    y=data[‘close price’]
    plt.plot_date(x,y)
  6. 求标准差
    import numpy as np
    np.std
  7. 注意除法要加上:
    from future import division
  8. 下取整
    import math
    math.floor
    上取整:math.ceil
  9. 希尔伯特变换
    from scipy import fftpack
    hx= fftpack.hilbert(price)
  10. 值排序
    data.order()
  11. 差分
    data.diff(1)#一阶差分
  12. dataframe 删除元素
    data.drop(元素位置)
  13. 嵌套的array处理方法
    import itertools
    a = [[1,2,3],[4,5,6], [7], [8,9]]
    out = list(itertools.chain.from_iterable(a))
  14. dataframe修改列名
    简单粗暴式:data.columns=[‘num’,’price’]
  15. set:无序不重复元素集
    http://blog.csdn.net/business122/article/details/7541486
  16. pd.concat 数据合并和重塑
    http://blog.csdn.net/stevenkwong/article/details/52528616
  17. excel表导入以后有空行解决办法
    import numpy as np
    data= data.drop(data.loc[np.isnan(data.name.values)].index)
  18. diff用法
    一.是dataframe或者series格式,直接就用data.diff()
    二.是list格式,先转换成转换成list格式data=data.tolist() 然后dif=np.diff(data)
  19. dataframe中的日期type不是date格式,不能直接相加减,所以先转换成list格式
    t=data.time.tolist()
    date_time = datetime.datetime.strptime(str(t),’%Y-%m-%d %H:%M:%S’)
    date_time=datetime.date(date_time.year,date_time.month,date_time.day)
    past= date_time - datetime.timedelta(days=n*365)
  20. 符号化
    np.sign
  21. count计数
    数据是dataframe格式,data.count(‘x’)
  22. 字典的使用
    label={‘11’:’TP’,’1-1’:’FN’,’-11’:’FP’,’-1-1’:’TN’}
    for i in range(len(data1)):
    state=str(int(data1[i]))+str(int(data2[i]))
    result.append(label[state])
  23. 检验是否符合哪种分布
    http://blog.csdn.net/QimaoRyan/article/details/72861387
  24. 用plt画图的时候中文不显示的解决办法
    from matplotlib.font_manager import FontProperties
    font_set = FontProperties(fname=r”c:\windows\fonts\simsun.ttc”, size=15)
    plt.title(u’中文’, fontproperties=font_set)

  25. 获取当前程序运行的时间
    from time import time
    time1=time()
    time2=time()
    print(time2-time1)

  26. 数组保存
    https://www.cnblogs.com/ice-daigua/archive/2012/11/16/2772674.html

你可能感兴趣的:(python编程)