Python 读取csv的某列

假设“A.csv“文件内容是:

  1. No., Name,Age,Score
  2. 1,Apple, 12, 98
  3. 2,Ben, 13, 97
  4. 3,Celia, 14, 96
  5. 4,Dave, 15, 95

利用Python自带的 https://docs.python.org/2/library/csv.html模块 ,有两种方法可以提取其中的一列:

方法一 reader函数

第一种方法使用reader函数,接收一个可迭代的对象(比如csv文件),能返回一个生成器,就可以从其中解析出csv的内容:比如下面的代码可以读取csv的全部内容,以行为单位:

  1. import csv
  2. with open( 'A.csv', 'rb') as csvfile:
  3. reader = csv.reader(csvfile)
  4. rows= [row for row in reader]
  5. print rows

得到:

  1. [[ 'No.', 'Name', 'Age', 'Score'],
  2. [ ' 1 ', 'Apple', ' 12 ', ' 98 '],
  3. [ ' 2 ', 'Ben', ' 13 ', ' 97 '],
  4. [ ' 3 ', 'Celia', ' 14 ', ' 96 '],
  5. [ ' 4 ', 'Dave', ' 15 ', ' 95 ']]

要提取其中某一列,可以用下面的代码:

  1. import csv
  2. with open( 'A.csv', 'rb') as csvfile:
  3. reader = csv.reader(csvfile)
  4. column = [row[ 2] for row in reader]
  5. print column

得到:

['Age', '12', '13', '14', '15']

注意从csv读出的都是str类型。这种方法要事先知道列的序号,比如Age在第2列,而不能根据’Age’这个标题查询。这时可以采用第二种方法:

方法二 DictReader

第二种方法是使用DictReader,和reader函数类似,接收一个可迭代的对象,能返回一个生成器,但是返回的每一个单元格都放在一个字典的值内,而这个字典的键则是这个单元格的标题(即列头)。用下面的代码可以看到DictReader的结构:

  1. import csv
  2. with open( 'A.csv', 'rb') as csvfile:
  3. reader = csv.DictReader(csvfile)
  4. column = [row for row in reader]
  5. print column

得到:

  1. [{ 'Age': '12', 'No.': '1', 'Score': '98', 'Name': 'Apple'},
  2. { 'Age': '13', 'No.': '2', 'Score': '97', 'Name': 'Ben'},
  3. { 'Age': '14', 'No.': '3', 'Score': '96', 'Name': 'Celia'},
  4. { 'Age': '15', 'No.': '4', 'Score': '95', 'Name': 'Dave'}]

如果我们想用DictReader读取csv的某一列,就可以用列的标题查询:

  1. import csv
  2. with open( 'A.csv', 'rb') as csvfile:
  3. reader = csv.DictReader(csvfile)
  4. column = [row[ 'Age'] for row in reader]
  5. print column

就得到:

['12', '13', '14', '15']

你可能感兴趣的:(Python笔记)