python csv数据读取-转换-保存:
参考:https://blog.csdn.net/bryanwang_3099/article/details/119731390
https://www.jb51.net/article/217415.htm
这个较为详细 许多小操作都有详尽记载
CSV是一种以逗号分隔数值的文件类型,在数据库或电子表格中,常见的导入导出文件格式就是CSV格式,CSV格式存储数据通常以纯文本的方式存数数据表。
csv 库中有4个常用的对象:
csv.reader:以列表的形式返回读取的数据。
csv.writer:以列表的形式写入数据。
csv.DictReader:以字典的形式返回读取的数据。
csv.DictWriter:以字典的形式写入数据。
csv形状如下所示:上面为表头 下面为数据
代码如下(示例):
import csv
csv_reader = csv.reader(open("data.csv"))
for row in csv_reader:
print(row)
注意 这里读取的为每一行
代码如下(示例):
import pandas as pd
df = pd.read_csv("data.csv",encoding="utf-8")
print(df)
该处df为结构体 DataFrame(x,y)。
如 data.csv 文件中 有多个表头,多列。
写入的时候提取出的 DataFrame 需要转为列表
两者是可以相互转换的
如 tolist()等是十分好用的。
import pandas as pd
df = pd.read_csv("data.csv",encoding="utf-8")
df_array = np.array(df)#将pandas读取的数据转化为array
df_list = data_array.tolist()#将数组转化为list
import pandas as pd
path = 'data.csv'
data = pd.read_csv(path)
#data为结构体
#读取某两列
x = data[['top', 'left']]
print(x)
#读取某一列
y = data[['top']]
print(y)
实际上如果只读取一列数据
可以通过 data[i] 来读取
import csv
csv_reader = csv.reader(open("data.csv"))
i= 0
for row in csv_reader:
if i % 2 == 0:
print(row)
读取某几行 如第一行 第二行和第四行的所有数据
import pandas as pd
path = 'data.csv'
data = pd.read_csv(path)
print(data.ix[[0,1,3],:])
# 1. 创建文件对象(指定文件名,模式,编码方式)a模式 为 下次写入在这次的下一行
with open("file.csv", "a", encoding="utf-8", newline="") as f:
# 2. 基于文件对象构建 csv写入对象
csv_writer = csv.writer(f)
# 3. 构建列表头
name=['top','left']
csv_writer.writerow(name)
# 4. 写入csv文件内容
z = [
[0, 31],
[1, 30],
[2, 32]
]
csv_writer.writerow(z)
print("写入数据成功")
# 5. 关闭文件
f.close()
关于写入,需要注意:
当然可以以便读取文件,一边写入。
在打开文件时,需要添加newline = “”。否则,会在每2行有效内容之间添加一行空白。
如果要保存的内容有中文,而且之后需要用Excel打开文件,那么需要选用utf-8-sig编码。如果使用utf-8编码,会导致使用Excel查看文件时中文乱码。
数据会有很多问题,主要是要看数据类型,调试的时候看清楚