python处理csv文件(上)

一、什么是csv文件

逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列.

特点

  • 读取出的数据一般为字符类型,如果是数字需要人为转换为数字
  • 以行为单位读取数据
  • 列之间以半角逗号或制表符为分隔,一般为半角逗号
  • 一般为每行开头不空格,第一行是属性列,数据列之间以间隔符为间隔无空格,行之间无空行

行之间无空行十分重要,如果有空行或者数据集中行末有空格,读取数据时一般会出错,引发[list index out of range]错误。

、下载安装pandas

一开始在命令行中pip install pandas,总是会失败。怀疑是因为下载了anaconda的原因(并不确定,还有待探究。)

后来手动下载所有需要的脚本文件,将后缀改为zip,解压后放入python\lib中。

详见https://blog.csdn.net/qins_superlover/article/details/44803303

再在python文件中import pandas;import csv;

注意:csv文件地址的分隔符为/而不是系统复制粘贴出的\

二、一个panda处理csv文件的简单实操

python处理csv文件(上)_第1张图片

csv_data.shape用于读取文件行列数

csv_data.tail/head(N)用于读取末尾/开头N行

部分行数据名[list(range(m,n))]读取该数据块的m到n列

 

 

你可能感兴趣的:(python)