pandas 数据读取与保存

pandas 数据读取与保存

一:读取表格数据

例:在一个text.xlsx文件中,有text1,text2,text3三张表格

  1. sheetname

    切换sheet表格

    • 可以传入整形,表示从0开始的索引
    pd.read_excel(r"text.xlsx",sheetname=1)
    
    • 可以传入表名称
    pd.read_excel(r"text.xlsx",sheetname="text1")
    
    • 可以传入list,混合使用,如[“sheetname”,2]
    pd.read_excel(r"text.xlsx",sheetname=[1,"text1"])
    
    • 可以传入None,表示一次性获取所有表格,返回的是一个字典类型,字典的key为表的名称,字典的value为表格数据
    pd.read_excel(r"text.xlsx",sheetname=None)
    

    查看当前表格的名字

    keys()方法仅限于读取多个表格时使用

    list(data.keys()
    

    查看某张表的数据

    仅限读取了多个表格时使用

    data["text1"]
    
  2. header

    指定表格中的某一行作为表头,即列索引。默认header=0,将第一行作为表头,当headers不为0时,会将表头行之前的行全部删掉。

    pd.read_excel(r"text.xlsx",header=1)
    
  3. names

    当我们需要自定义表头时,可以用names传递一个列表来作为表头。传递前必须将header的值设置为None。列表中headername的个数必须与列数相等。

    pd.read_excel(r"text.xlsx",header=None,names=[header_name])
    
  4. skiprows

    跳过(删除)指定的行数,将剩下的行数中的第一行作为表头,并且剩下的表格的行索引会重新进行排序

    # 将第1行和第10行删除,然后将剩下的第一行作为表头
    data = pd.read_excel(r"text.xlsx",skiprows=[1,10])
    
  5. head

    默认取表格前5行数据,可指定行数

    data.head(10)
    
  6. tail

    默认取表格后5行数据,可指定行数

    data.tail(10)
    

二:读取csv文件

  1. csv属于文本文件,逗号分隔符文件,编码一般为gbk

    sep:元素分隔符,在csv文件中默认分隔符为","

    engine:底层编译方式,默认为c语言,如果遇到编码问题,可以尝试将engine改为python

    csv_file = pd.read_csv(r"file_name",sep=",",encoding="gbk",engine="python")
    
  2. 保存文件

    文件名要加后缀

    # 保存为xlsx文件
    csv_file.to_excel("file_name")
    # 保存为csv文件
    csv_file.to_csv("file_name")
    

你可能感兴趣的:(DataAnalysis,python,excel,数据分析,pandas,csv)