用python的pandas库对CSV格式的文件进行简单的统计分析操作

首先我使用的是jupyter notebook,要实现python的pandas库对CSV文件的操作,首相肯定需要导入库,然后就是要拥有一个CSV文件的样本啦,因为CSV文件的数据样本很多人可能没有,所以我是直接搜索的成绩单样本,然后写一些简单的脚本从百度文档爬取得到的。

现在开始进入流程:

先导入pandas库:

import pandas as pd
df = pd.read_csv('C:/Users/asus/Desktop/data.csv')

调用pandas库中的read_csv函数,读取电脑上的csv文件,如果是使用的jupyter notebook的话,可以尝试在‘  '中写入地址时,输入  ~/ 再按tab键可以获取地址提示,看看效果:

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第1张图片

获取列名与索引:

# 列名
print(df.columns)
# 索引
print(df.index)

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第2张图片

按照某一列筛选:

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第3张图片

按照某一列或者某几列进行排序:

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第4张图片

其中的head函数不加任何参数的话就是默认取前5列。

取出某一列的值(返回值为array数列):

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第5张图片

简单的个数统计:

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第6张图片

将表格中的某几列拆分出来:

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第7张图片

pandas中的map函数:

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第8张图片

pandas中的applymap函数:

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第9张图片

索引(前面的索引并不都是从0开始步长为1的,有时候会有一些特殊的索引,如下图):

用python的pandas库对CSV格式的文件进行简单的统计分析操作_第10张图片

这次的分享就到这里,希望能给大家带来一些帮助,人生苦短,我用python!感谢大家的阅读!

你可能感兴趣的:(用python的pandas库对CSV格式的文件进行简单的统计分析操作)