Pandas处理文件基础excel

1.使用环境

     anaconda环境(自带pandas)。如果是pycharm,在命令窗口输入  pip install pandas  自动安装。

2.Pandas的两种数据结构

     (1) Series, 是一种类似于一维数组的对象,由一组数据和一组数据标签(索引值)组成。

     (2)DataFrame,是由一组数据和一对索引(行索引和列索引)组成的表格型数据结构,常用于表达二维数据,同时也可以表达多维数据,行列索引有自动索引和自定义索引。

3.excel文件的读取

    pandas.read_excel( ' 文件路径 ',sheet_name = ' 指定工作表名称或索引,默认第一个工作表 '  )

     注:注意绝对路径和相对路径的区别。相对路径:基于  .ipynb_checkpoints  文件所在为相对                路径起始点。 必要时加上  r   ,路径则不会报错。

4.创建一个DataFrame数据结构

    pandas.DataFrame()

  eg:pandas.DataFrame({'a':[1,2,3],'b':[4,5,6]} , index = [101,102,103] )

       使用index改变索引序列

5.数组的相关操作(建立在读取excel基础上,数据读取在sheet1—data中)

(1)查看形状

         sheet1_data.shape   -->   返回一个行列数组

(2)查看 DataFrame  数据类型中的  列  的数据

         sheet1_data.dtypes

  (3)  查看 行索引

        sheet1_data.index

(4) 查看  列索引

        sheet1_data.columns

  (5)   查看  每一行对应的数值

        sheet1_data.values

  (6)  查看 一共有多少个数据

        sheet1_data.size  -->   返回 行数*列数

(7)查看  前五项

        sheet1_data.head()  -->  后面可以添加参数,显示想要展示多少行

(8) 查看  部分列数据

       sheet1_data[ ' 列参数  ' ]

       sheet1_data[ ' 列参数  ' ] .head()

 (9)查看  多列数据访问

          sheet1_data[ [  ' 列参数 ' ,' 列参数 ' ] ] .head()

     注: 此时必须是二维的列表才能运行 

(10) 通过  布尔类型  控制显示(默认行显示)

            sheet1_data [ [ True , False , True ] ]  --> True 显示

(11)筛选出符合参数的行信息

           sheet1_data [ sheet1_data [ ' 参数 ' ]  ==  参数 ] .head()

  (12) 行和列数据 的访问

      <1> 使用 loc 函数(二维列表作为参数,字段名称进行访问)

             sheet1_data.loc[ [ 数字参数 , 数字参数 , 数字参数 ]  , [ 名称参数 ,  名称参数 ] ]

      <2> 使用 iloc 函数(索引数字进行访问)

             sheet1_data.iloc [ [ 0 , 1 , 2 , 3 ] , [ 1 , 2 ] ]

注: 可以使用 :(冒号) 表示一个范围类的数据,此时不用加中括号

      <3> 直接访问

             sheet1_data [ 列参数 , 列参数 ] [ 行参数 , 行参数 ]

(13)多个表格的数据合并(数据格式保证一致)

            fianl_data = pandas.concat( [ 表格数据来源,表格数据来源 ] )

(14)统计每一列数据的总数

           final_data.count()

  (15) 查看数据详情

          final_data.info()

 (16) 写入数据excel(默认相对路径)

        final_data.to_excel('文件名 ' , sheet_name = ' 表格名称 ' )

(17)新增行数据(赋值)

            sheet1_data.loc [ 数字参数] = [ 参数 ]

(18) 新增列参数(赋值)

            sheet1_data[ 参数 ] = [ 参数 ]

(19)  删除数据(默认删除行数据,不会作用于原数据)

         sheet1_data.drop(参数,inplace = True , axis = 0)

注:

参数:为横轴直接为数字,竖轴为中文需要添加 [ ] 中括号

inplace 默认为Fales

axis默认为0 ——>作用于横轴。等于1,作用于竖轴

          

你可能感兴趣的:(基本操作,数据分析)