读取CSV文件数据

一 Python读取CSV文件的全部数据

1.1 CSV文件:
纯文本文件,存储空间占用小,其内容一般默认用逗号分隔,可用记事本和EXCEL打开、编辑。
读取CSV文件内容可用pandas模块中的read_csv()函数。
1.2 read_csv()函数的语法(选取部分主要参数):
pandas.read_csv(filepath_or_buffer,sep,header,names,index_col,usecols,nrows,encoding)
参数释义:
filepath_or_buffer:(必选参数),CSV文件的路径
sep:指定分隔符,如不指定,默认为逗号
header:指定列标签在第几行及数据读取的起点行,从0开始计数,如header=0,则指定列标签和读取数据起点行在第一行
names:指定自定义的列标签,一般为一个列表
index_col:行标签的列,可以是列名或列索引号(从0开始)
usecols:要读取的列,一般列名或列索引号写在列表中,如[0,2,4,5]、[‘数量’,‘面积’]
nrows:要读取的行数
encoding:指定CSV文件的编码方式,如’utf-8’,‘gbk’
1.3 以下是读取CSV文件的全部数据示例代码:

import pandas as pd		#导入pandas模块
data=pd.read_csv('CSV文件的路径')	#从指定路径中读取CSV文件中的全部数据
print(data)		#输出读取的数据

二 读取CSV文件中指定列的数据

示例:读取CSV文件中第2列和第5列的数据,由参数usecols实现。

import pandas as pd		#导入pandas模块
data = pd.read_csv('CSV文件的路径',usecols=[1,4])	#从指定路径中读取CSV文件中的第2列和第5列数据
print(data)		#输出读取的数据

另外,除了可以按照列序号读取数据外,还可以根据列的名称读取该列的数据,如:usecols=[‘姓名’,‘性别’]

三 读取CSV文件的前几行数据

示例:要读取CSV文件的前5行数据,可由参数nrows实现。

import pandas as pd		#导入pandas模块
data = pd.read_csv('CSV文件的路径',nrows=5)	#从指定路径中读取CSV文件中前5行数据
print(data)		#输出读取的数据

你可能感兴趣的:(python,pandas,数据分析)