Pandas文件读取常用的数据操作方法

Pandas文件读取常用的数据操作方法

本篇博客是接着上篇博客python数据分析处理库-Pandas数据读取、索引与计算

import pandas
food_info = pandas.read_csv("food_info.csv") #读取与本python文件同一目录下的food_info.csv文件
food_info.sort_values("列名", inplace=True) #对文件该列进行排序,inplace=True表示排序后覆盖此列
                                             (默认从小到大排序)
food_info.sort_values("列名", inplace=True,ascending=False) #同上,区别是从大到小排序

-----除去列中的为空NaN(NaN)的元素
lie = food_info["列名"]
lie.loc[0:10] #切片方式查看前10个元素
lie_is_null = pandas.isnull(lie) #查看该列为空(NaN)的所有元素,是空的返回true,不空返回false
lie_null_true = lie[lie_is_null] #查看该列为空(NaN)的所有元素,当然返回都是NaN
len(lie_null_true) #查看该列为空(NaN)的元素有多少个
lie_not_null = food_info["列名"].[lie_is_null == False] #查看该列不为空(NaN)的所有元素

food_info["列名"].mean() #求该列的平均值

-----以列名1为索引,将列名1中相同的元素对应的列名2中的值加起来求平均值,默认是aggfunc=np.mean
food_info.pivot_table(index="列名1", values="列名2", aggfunc=np.mean)

-----以列名1为索引,将列名1中相同的元素对应的列名2和列名3中的值加起来分别求和
food_info.pivot_table(index="列名1", values=["列名2", "列名3"], aggfunc=np.sum)

-----将列名1和列名2中为空(NaN)的丢掉
food_info.dropna(axis=0, subset=["列名1", "列名2"])

-----定位到某个元素,行列分别是:83为行数和列名
food_info.loc(83, "列名")

希望对大家有帮助

你可能感兴趣的:(深度学习,Pandas常用预处理方法,Pandas的dropna方法)