简介:CSV (Comma Separated Values) 格式是电子表格和数据库中最常见的输入、输出文件格式。又称逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。
数据较复杂的场景更推荐读写excel。
参考:Python:xlrd和xlwt模块操作Excel表格
特定规则:
开头是不留空,以行为单位。
可含或不含列名,含列名则居文件第一行。
一行数据不跨行,无空行。
以半角逗号(即,)作分隔符,列为空也要表达其存在。
列内容如存在半角引号(即"),替换成半角双引号("")转义,即用半角引号(即"")将该字段值包含起来。
文件读写时引号,逗号操作规则互逆。
内码格式不限,可为 ASCII、Unicode 或者其他。
不支持数字
不支持特殊字符
读取范例1:使用csv模块
# -*- coding: UTF-8 -*-
import csv
file = "demo.csv"
with open(file, "r")as f:
f_csv = csv.reader(f)
for row in f_csv:
print(row)
读取范例2:使用pandas模块,若内容存在中文需要增加encoding=“gbk”
import pandas as pd
file = "demo.csv"
data = pd.read_csv(file, encoding="gbk")
print(data.head(2)) # 打印前2行
print("*" * 100)
print(data.columns) # 返回全部列名
print("*" * 100)
print(data.shape) # 返回csv文件形状 例如(4, 3) => 4行3列
print("*" * 100)
print(data.loc[1:2]) # 打印第1到2行
写入范例1:请注意,会造成换行。
# -*- coding: UTF-8 -*-
import csv
csvFile = open("test.csv", "w")
writer = csv.writer(csvFile)
# 写入列名。
writer.writerow(["id", "name", "age"])
row1 = ["1001", "Tom", 30]
row2 = ["1002", "David", 25]
row3 = ["1003", "Lily", 20]
row4 = ["1004", "韩梅梅", 15]
writer.writerows([row1, row2, row3, row4])
csvFile.close()
写入范例2:使用newline=“”来解决换行问题
# -*- coding: UTF-8 -*-
import csv
import csv
headers = ['id', 'name', 'age']
row1 = {"id": "1001", "name": "Tom", "age": 30}
row2 = {"id": "1002", "name": "Lily", "age": 35}
row3 = {"id": "1003", "name": "李雷", "age": 40}
row4 = {"id": "1004", "name": "韩梅梅", "age": 45}
rows = [row1, row2, row3, row4]
with open('test2.csv', 'w', newline='')as f:
f_csv = csv.DictWriter(f, headers)
f_csv.writeheader()
f_csv.writerows(rows)