CSV (Comma Separated Values)逗号分隔值格式,是一种常见的数据格式,以纯文本形式存储表格数据。
本练习初衷是为了处理实验中常用的数据,该数据默认格式为.csv,其中包含冗长的文件头和其他一些参数,在导出作图的过程中不得不重复性地打开、选中、关闭数据。这里将先以最简单的处理方式修改单个文件,未能实现批量处理。
详细标准库文档:csv doucument
csv.reader(csvfile,dialect ='excel',** fmtparams)
返回一个读取器对象,它将迭代给定csv文件中的行。 csvfile可以是支持迭代器协议的任何对象,并在每次调用__next __()方法时返回一个字符串 。文件对象和列表对象都适用。
如果csvfile是文件对象,则应使用newline =''打开它。 [1]可以给出一个可选的dialect参数-用于定义特定于CSV的一组参数。它可能是Dialect类的子类的实例,也可能是list_dialects()函数返回的字符串之一。可以给出其他可选的fmtparams关键字参数来覆盖当前方言中的各个格式参数。有关dialects和formatting参数的完整详细信息,请参阅相应章节。
从csv文件读取的每一行都作为字符串列表返回。除非指定了QUOTE_NONNUMERIC格式选项(在这种情况下,未加引号的字段将转换为浮点数),否则不会执行自动数据类型转换。
import csv
filename = 'E:/data/程序化计算/30um-no10.csv'
with open( filename ,encoding='gb18030', errors='ignore') as data:
reader = csv.reader(data)
i=0
result=[]
while i<383:
header_row=next(reader)
i=i+1
print(header_row)
if i>=222:
result.append(header_row)
#这里的一些数字是为了简化,按常见数据长度确定的
i=0
while i<162:
result[i].pop(0)
i=i+1
i=0
filename='E:/data/程序化计算/30um-no10.txt'
with open(filename, 'w')as datafile:
while i<162:
j=0
while j<3:
datafile.write(str(result[i][j]))
j=j+1
datafile.write('\n')
i=i+1
print('finsh!')