python中csv文件的创建、读取、修改等操作总结

1. python中创建新的csv文件

(1). 使用csv.writer()创建:

代码如下:

import csv

headers = ['学号','姓名','分数']
rows = [('202001','张三','98'),
        ('202002','李四','95'),
        ('202003','王五','92')]
with open('score.csv','w',encoding='utf8',newline='') as f :
    writer = csv.writer(f)
    writer.writerow(headers)
    writer.writerows(rows)

会在相同路径下生成一个score.csv文件 

 VScode中打开如下:

python中csv文件的创建、读取、修改等操作总结_第1张图片

 用excel打开如下:

python中csv文件的创建、读取、修改等操作总结_第2张图片

可以发现,逗号','在csv文件中代表换格。除此以外,还有'\n'在csv文件中代表换行。 

(2). 使用csv.Dictwriter()创建:

代码如下:

import csv

headers = ['学号','姓名','分数']
rows = [{'学号':'202001','姓名':'张三','分数':'98'},
        {'学号':'202002','姓名':'李四','分数':'95'},
        {'学号':'202003','姓名':'王五','分数':'92'}]
with open('score.csv','w',encoding='utf8',newline='') as f :
    writer = csv.DictWriter(f,headers)
    writer.writeheader()
    writer.writerows(rows)

会发现结果和方式1相同。

(3). 使用writelines()创建:

import csv

headers = ['学号,姓名,分数','\n']
csv = ['202001,张三,98','\n',
        '202002,李四,95','\n',
        '202003,王五,92']
with open('score.csv', 'w',encoding='utf8',newline='') as f:
    f.writelines(headers) # write() argument must be str, not tuple
    f.writelines(csv)

会发现结果和方式1、方式2相同。 

 综合上述三种方式,csv文件的创建灵活多样,主要依赖于自己创建的原来数据的存放形式,比如方式1、2中的rows和方式3中的csv,以此选择适合的创建csv文件的函数和方式。

  • 实际示例(要灵活使用','、'\n'、append()等):

csv = []
for line in lines:
    scores = result[line[0]]
    for wav, scores in scores.items():
        # csv.append(line[0])
        # csv.append(wav)
        # csv.append(str(i) for i in scores)
        # csv.append('\n')
        #csv.append(','.join([wav] + [str(i) for i in scores] + '\n'))
        csv.append(line[0] +','+ wav )
        for i in scores:
            csv.append(','+ str(i))
        csv.append('\n')
with open('task3-result.csv', 'w') as f:
    f.writelines(csv)

2. python中读取csv文件

原score.csv文件在excel中打开如下:

python中csv文件的创建、读取、修改等操作总结_第3张图片

(1). 使用pandas.read_csv()读取

代码如下: 

import pandas as pd 

my_matrix = pd.read_csv('score.csv')#,header=None,index_col=None)
'''
header : int or list of ints, default ‘infer’,指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0,
index_col : int or sequence or False, default None,用作行索引的列编号或者列名
'''
print(my_matrix)
print(my_matrix.shape)

此时的输出结果为:

python中csv文件的创建、读取、修改等操作总结_第4张图片 

若代码参数改为:

my_matrix = pd.read_csv('score.csv',header=None,index_col=None)

结果如下:

python中csv文件的创建、读取、修改等操作总结_第5张图片 

若代码参数改为:

my_matrix = pd.read_csv('score.csv',header=0,index_col=0)

结果如下:

python中csv文件的创建、读取、修改等操作总结_第6张图片 

为了方便后续分析,可以将数据类型改为np.array型,代码如下:

import pandas as pd 
import numpy as np

my_matrix = pd.read_csv('score.csv')#,header=0,index_col=0)
my_matrix = np.array(my_matrix)
print(my_matrix)
print(my_matrix.shape)
print(my_matrix[0][0])

结果如下:

python中csv文件的创建、读取、修改等操作总结_第7张图片 

 (2). 使用csv.reader()进行读取

代码如下:

import csv
#读取csv文件
with open('score.csv', "r",encoding='utf8',newline='') as f:
	reader = csv.reader(f)
	for row in reader:
		print(row)

结果如下:

 

如果想获取某一列,可以通过指定的列标号来查询,代码如下:

for row in reader:
    print(row[0])

可以输出某一指定的列 ,结果如下:

 (3). 使用csv.DictReader()进行读取

代码如下:

import csv
#读取csv文件
with open('score.csv', "r",encoding='utf8',newline='') as f:
	reader = csv.DictReader(f)
	for row in reader:
		print(row)

结果如下:

 

如果想获取某一列,可以通过指定的标题来查询,代码如下:

for row in reader:
	print(row['学号'])

可以输出指定的某一列,结果如下:

 

 

 

 

你可能感兴趣的:(python,python,csv,数据分析)