2.5.1 含有“脏数据”的制表符分隔的文件导入数据

2.5.1 含有“脏数据”的制表符分隔的文件导入数据

基于CSV格式读取数据的方式没有办法处理有“脏数据”的情况。换言之,如果有几行不是仅以换行符结尾,而是有多余的\t(制表符)标记,这时就需要在切分前对特殊行的数据进行单独清理。ch02datadirty.tab是含有“脏数据”的制表符分隔的文件。

代码实现如下

datafile='ch02-data-dirty.tab'
with open(datafile,'r') as f:
    for line in f:
        #删除行开始或结束中的任何空格
        line=line.strip()
        #现在我们用制表符分隔行
        print(line.split('\t'))

运行测试

2.5.1 含有“脏数据”的制表符分隔的文件导入数据_第1张图片
测试文件如下,可以到我的主页资源那里下载!!!喜欢的话就给我点个赞哦!嘿嘿
2.5.1 含有“脏数据”的制表符分隔的文件导入数据_第2张图片

你可能感兴趣的:(Python数据可视化,csv,python)