python 内置模块csv 处理 CSV文件

一、介绍

csv 模块是 Python 标准库中用于处理 CSV(逗号分隔值)文件的模块。CSV 文件是一种常见的文本文件格式,用于存储表格数据,Python 的内置模块,无需额外安装

二、基本使用
import csv

with open('test.csv','w',newline='') as csv_file:
     writer= csv.writer(csv_file)
     writer.writerow(['id', 'name', 'age'])
     writer.writerow(['10001', 'Mike', 20])
     writer.writerow(['10002', 'Bob', 22])
     writer.writerow(['10003', 'Jordan', 21])
三、方法和属性
  1. csv.reader(csvfile, dialect=‘excel’, **fmtparams):创建一个 reader 对象,用于从 CSV 文件中逐行读取数据
  • csvfile:要写入的文件对象。可以是文件对象(例如通过open()函数打开的文件)或者支持写入操作的类似文件的对象。
  • dialect:可选参数,指定使用的CSV方言。默认为’excel’方言。您可以使用预定义的方言(如’excel’、'excel-tab’等),也可以使用自定义的方言。
  • **fmtparams:可选参数,用于指定额外的格式化参数。这些参数可以覆盖方言的默认设置。常用的格式化参数包括:
    • delimiter:字段分隔符的字符,默认为逗号(,)
    • quotechar:引号字符,默认为双引号(")
    • quoting:引用风格的设置,默认为QUOTE_MINIMAL,可选值有QUOTE_ALL、QUOTE_MINIMAL、QUOTE_NONNUMERIC和QUOTE_NONE
    • escapechar:转义字符,默认为无
    • doublequote:是否将引号字符双写,默认为True
    • lineterminator:行终止符的字符,默认为系统的默认行终止符
    • skipinitialspace:是否跳过字段前的空格,默认为False
    • strict:指定是否启用严格的CSV格式验证。默认为False,表示 允许非标准的CSV格式
    import csv
    
    with open('test.csv','r',newline='') as csv_file:
         reader = csv.reader(csv_file)
         for item in reader:
              print(item)
    
  1. csv.DictReader(csvfile, dialect=‘excel’, **fmtparams):用于从CSV文件中读取数据,并将每一行数据转换为字典形式
  • csvfile:要写入的文件对象。可以是文件对象(例如通过open()函数打开的文件)或者支持写入操作的类似文件的对象。
  • dialect:可选参数,指定使用的CSV方言。默认为’excel’方言。您可以使用预定义的方言(如’excel’、'excel-tab’等),也可以使用自定义的方言。
  • **fmtparams:可选参数,用于指定额外的格式化参数。这些参数可以覆盖方言的默认设置。常用的格式化参数包括:
    • delimiter:字段分隔符的字符,默认为逗号(,)
    • quotechar:引号字符,默认为双引号(")
    • quoting:引用风格的设置,默认为QUOTE_MINIMAL,可选值有QUOTE_ALL、QUOTE_MINIMAL、QUOTE_NONNUMERIC和QUOTE_NONE
    • escapechar:转义字符,默认为无
    • doublequote:是否将引号字符双写,默认为True
    • lineterminator:行终止符的字符,默认为系统的默认行终止符
    • skipinitialspace:是否跳过字段前的空格,默认为False
    • strict:指定是否启用严格的CSV格式验证。默认为False,表示 允许非标准的CSV格式
  1. csv.writer(csvfile, dialect=‘excel’, **fmtparams):创建一个 writer 对象,用于将数据逐行写入 CSV 文件
  • csvfile:要写入的文件对象。可以是文件对象(例如通过open()函数打开的文件)或者支持写入操作的类似文件的对象。
  • dialect:可选参数,指定使用的CSV方言。默认为’excel’方言。您可以使用预定义的方言(如’excel’、'excel-tab’等),也可以使用自定义的方言。
  • **fmtparams:可选参数,用于指定额外的格式化参数。这些参数可以覆盖方言的默认设置。常用的格式化参数包括:
    • delimiter:字段分隔符的字符,默认为逗号(,)
    • quotechar:引号字符,默认为双引号(")
    • quoting:引用风格的设置,默认为QUOTE_MINIMAL,可选值有QUOTE_ALL、QUOTE_MINIMAL、QUOTE_NONNUMERIC和QUOTE_NONE
    • escapechar:转义字符,默认为无
    • doublequote:是否将引号字符双写,默认为True
    • lineterminator:行终止符的字符,默认为系统的默认行终止符
    • skipinitialspace:是否跳过字段前的空格,默认为False
    • strict:指定是否启用严格的CSV格式验证。默认为False,表示 允许非标准的CSV格式
  1. csv.DictWriter(csvfile, fieldnames, restval=‘’, extrasaction=‘raise’, dialect=‘excel’, **fmtparams) 将字典数据写入CSV文件,返回DictWriter对象
  • csvfile:要写入的文件对象。可以是文件对象(例如通过open()函数打开的文件)或者支持写入操作的类似文件的对象
  • fieldnames:一个字符串列表,指定CSV文件的列名。列表中的每个字符串对应一个列名。列名的顺序将决定CSV文件中列的顺序
  • restval:可选参数,指定当字典中缺少某个键时,该键对应的默认值。默认为空字符串
  • extrasaction:可选参数,指定当字典中存在额外的键时的处理方式。默认为’raise’,表示引发ValueError异常。还可以设置为’ignore’,表示忽略额外的键
  • dialect:可选参数,指定使用的CSV方言。默认为’excel’方言。可以使用标准的方言名称(如’excel’、‘excel-tab’、'unix’等),也可以创建自定义方言对象
  • **fmtparams:可选参数,用于指定额外的格式化参数。这些参数可以覆盖方言的默认设置。常用的格式化参数包括:
    • delimiter:字段分隔符的字符,默认为逗号(,)
    • quotechar:引号字符,默认为双引号(")
    • quoting:引用风格的设置,默认为QUOTE_MINIMAL,可选值有QUOTE_ALL、QUOTE_MINIMAL、QUOTE_NONNUMERIC和QUOTE_NONE
    • escapechar:转义字符,默认为无
    • doublequote:是否将引号字符双写,默认为True
    • lineterminator:行终止符的字符,默认为系统的默认行终止符
    • skipinitialspace:是否跳过字段前的空格,默认为False
    • strict:指定是否启用严格的CSV格式验证。默认为False,表示 允许非标准的CSV格式
  1. csv.register_dialect(name, dialect=None, **fmtparams):注册一个新的 CSV 方言,或者更新现有方言的参数
  2. csv.unregister_dialect(name):取消注册指定名称的 CSV 方言
  3. csv.get_dialect(name):返回指定名称的 CSV 方言对象
  4. csv.list_dialects():返回所有已注册的 CSV 方言的名称列表
  5. csv.field_size_limit([new_limit]):获取或设置解析 CSV 文件时字段大小的限制
  6. csv.QUOTE_ALL:引用所有字段的常量,用于写入 CSV 文件时将所有字段都放在引号中
  7. csv.QUOTE_MINIMAL:最小引用常量,用于写入 CSV 文件时只在必要时才引用字段
  8. csv.QUOTE_NONNUMERIC:非数字引用常量,用于写入 CSV 文件时将非数字字段放在引号中
  9. csv.QUOTE_NONE:不引用常量,用于写入 CSV 文件时不引用任何字段
  10. csv.Error:CSV 模块中的异常基类
  11. csv.fieldnames:CSV 文件的字段名称列表
  12. csv.reader.line_num:当前读取的行号
  13. csv.Dialect.delimiter:字段分隔符的字符
  14. csv.Dialect.quotechar:引号字符
  15. csv.Dialect.escapechar:转义字符
  16. csv.Dialect.doublequote:是否将引号字符双写
  17. csv.Dialect.skipinitialspace:是否跳过字段前的空格
  18. csv.Dialect.lineterminator:行终止符的字符
  19. csv.Dialect.quoting:引用风格的设置
  20. csv.Dialect.ignore:忽略的字符
  21. csv.Dialect.strict:是否启用严格模式
四、 writer 对象
  1. writer.dialect:返回当前使用的CSV方言对象
  2. writerwriterow(row):将一行数据写入CSV文件。row是一个可迭代对象,表示一行的数据
  3. writer.writerows(rows):将多行数据写入CSV文件。rows是一个可迭代的对象,每个元素表示一行的数据
import csv

with open('test.csv','w',newline='') as csv_file:
     writer= csv.writer(csv_file)
     writer.writerow(['id', 'name', 'age'])
     writer.writerow(['10001', 'Mike', 20])
     writer.writerows([['10002', 'Bob', 22],['10003', 'Jordan', 21]])
五、 DictWriter 对象
  1. dictWriter.writeheader():写入CSV文件的列名行。该方法将使用fieldnames属性指定的列名,并将其作为CSV文件的第一行
  2. dictWriter.writerow(rowdict):写入一行数据到CSV文件。rowdict是一个字典,其中键是列名,值是对应的数据。该方法将根据fieldnames属性的顺序将数据写入CSV文件的相应列
  3. dictWriter.writerows(rowdicts):写入多行数据到CSV文件。rowdicts是一个字典列表,其中每个字典表示一行数据。与writerow()方法类似,该方法将根据fieldnames属性的顺序将数据写入CSV文件的相应列
import csv

with open('test.csv','w',newline='') as csv_file:
     fieldnames = ['id', 'name', 'age']
     dict_writer= csv.DictWriter(csv_file,fieldnames=fieldnames)
     dict_writer.writeheader()
     dict_writer.writerow({'id':'10001','name':'Mike','age':20})
     dict_writer.writerows([{'id':'10002','name':'Bob','age':22},{'id':'10003','name':'Jordan','age':22}])

你可能感兴趣的:(python)