基于数据处理的CSV格式行列变换及数据清洗

一维数据由对等关系的有序或无序数据构成,采用线性方式组织,对应列表、数组和集合等概念

二维数据由多个一维数据构成,是一维数据的组合形式,表格是典型的二维数据,表头是二维数据的一部分

多维数据由一维或二维数据在新维度上扩展形成

高维数据仅利用最基本的二元关系展示数据间的复杂结构(键值对)

二维数据的表示
使用二维列表类型:它本身是一个列表,列表中的每个元素也是一个列表,每个元素可以代表二维数据的一行或者一列
使用两层for循环遍历每个元素,外层列表中每个元素可以对应一行,也可以对应一列

SCV(Comma-Separated Values)格式
国际通用的一二维数据存储格式,一般.csv扩展名,每行一个一维数据,采用逗号分隔,无空行,Excel和一般编辑软件都可以读入或另存为csv文件

二维数据的处理

从CSV格式的文件中读入数据

fo = open(fname)
ls = []
for line in fo:
	line = line.replace("\n","")
	ls.append(line.split(","))
fo.close()

将数据写入CSV格式的文件

ls = [[],[],[]]
f = open(fname,'w')
for item in ls:
	f.write(','.jion(item)+'\n')
f.close()

CSV格式列逆序变换

f = open("data.csv")
for line in f:
	line = line.strip("\n")
	ls = line.split(",")
	ls = ls[::-1]
	print(",".join(ls))
f.close()

CSV格式数据清洗
有一组数据中每个数据前后存在空格,清除空格再输出

f = open("data.csv")
s = f.read()
s = s.replace(" ","")
print(s)
f.close()

你可能感兴趣的:(笔记,python,列表,csv)