读取 CSV 文件

目前了解到,读取 CSV 文件两种方式,建议第二种

  • 1, csv.reader
  • 2, pd.read_csv

1,csv.reader

import csv
data = []

n_row = 0
path = r'E:\李宏毅\机器学习\hw2\cc.csv'
text = open(path, 'r')
row = csv.reader(text)
for r in row:
    if n_row != 0:   # 第一行(索引 0),是列标签,不用读取
        data.append([])
        for i in range(0, 4):
            data[n_row - 1].append(r[i])
    n_row = n_row + 1
print(np.array(data))

2,pd.read_csv

import pandas as pd
  • pd.read_csv
    • 1,sep 指定分隔符。如果不指定参数,则会尝试使用逗号分隔。即默认为逗号分隔
    • 2,header 表头,默认不为空(为 0,也即将第一行视为表头)。
      如果我们要读取的文件,直接就是数据,没有所谓的表头。就需指定 header=None
      header=0 表示文件第0行(即第一行,索引从0开始)为列索引,这样加names会替换原来的列索引。
      header=None 即指明原始文件数据没有列索引,这样read_csv为自动加上列索引,除非你给定列索引的名字。
path = r'E:\李宏毅\机器学习\hw2\cc.csv'
obj = pd.read_csv(path, sep = ',', header = 0)
print(obj)
obj = np.array(obj)
print(obj)
print(obj.shape)

参考

  • cc.csv

你可能感兴趣的:(读取 CSV 文件)