Python | Pandas | csv 选定指定列、行、元素

此文总结如何使用 pandas 读取 csv 文件的指定行、列或元素。

Last Modified Date: 2022 / 6 / 17


Python | Pandas | csv 选定指定列、行、元素

  • 示例数据
    • 指定标签
      • 单列
  • 参考链接


示例数据

参考1,使用 pandas 读取 csv 示例数据:

data = pd.read_csv(filepath_or_buffer=path, header=None)

print(data.columns)
# Int64Index([0, 1, 2], dtype='int64')

print(data.index.names)
# [None]

print(data)
# 		   0    	  1 	  2
# 0		ABCD		NaN		All
# 1  	EFGH	    NaN  	All
# ...
# 1657  OPQR 		NaN		All
# 1658  XYZN		NaN		All

[1659 rows x 3 columns]

参考 23 对指定列进行提取

指定标签

单列

  1. loc
col_0 = data.loc[:, 0]
# 提取第1列的内容
# 其他列,以此类推
  1. pd.read_csv(..., usecols=[])
col_0 = pd.read_csv(filepath_or_buffer=path, header=None, usecols=[0])
# 为了确保读到的数据是正确的,可以写入excel,然后查看写入的数据
# writer = pd.Excelwriter('./trial.xlsx')
# data.to_excel(writer, index = False, header = False)
# writer.save()
  1. np.array
col_0 = np.array(data[0])
# 第1列数据将会以数组形式存储

参考 23 对指定列进行提取

  1. pd.read_csv(..., nrows=10)
row_0to10 = pd.read_csv(filepath_or_buffer=path, header=None, nrows=10)
# 只读取前10行
  1. pd.read_csv(...,skiprows=9, nrows=5)
row_10to15 = pd.read_csv(..., skiprows=9, nrows=5)
# 忽略前9行,往下读5行

参考链接


  1. Python | Pandas | 多种类型文件的读取写入及初步处理 ↩︎

  2. Python从csv中读取和提取数据的方法 ↩︎ ↩︎

  3. pandas读取指定行/列的几种操作 ↩︎ ↩︎

你可能感兴趣的:(Python,Pandas,数据分析,pandas,python,数据分析)