pandas中的几个重要函数

推荐参考网站:https://my.oschina.net/lionets/blog/279785#OSC_h3_15

类SQL操作请参考这里:http://blog.csdn.net/weixin_37226516/article/details/64137043

1. read_csv读取文件 +++++++++++++++ to_csv写入csv文件

import pandas as pd
data = pd.read_csv("./data/a.csv",encoding="gbk")
data.to_csv('./data/ans.csv', index=False, index_label=False) # index=True 将每一行的行标号写入文件,index_label:行标号的列名写入文件

2. get_dummies获取某一列的one-hot向量

pd.get_dummies(data["age"], prefix="age")  #prefix为前缀
3. merge/concat数据表的拼接
#merge
data = pd.merge(df1,df2,on="A") #"A"这一列不变,将df1和df2连接
#concat
data = pd.concat([df1,df2,df3],axis=0) #按行拼接
data = pd.concat([df1,df2,df3],axis=1) #按列拼接
4. groupby分组

类SQL操作请参考这里:http://blog.csdn.net/weixin_37226516/article/details/64137043

#合并"A"列,并且"A"不作为索引,重复的数字加和 
data.groupby(['A'], as_index=False).sum() 
#合并"A"列,并且"A"作为索引,重复的数字加和
data.groupby(['A'], as_index=True).sum() 

5. merge

使用c=merge(a,b,how='left',on=['one','two'])时,想让c的行数与a相同,必须先对b进行b.groupby(['one','two'])操作。

6. 画图工具

参考网址:http://blog.csdn.net/fennvde007/article/details/37693523




你可能感兴趣的:(pandas中的几个重要函数)