8 pandas模块,多层索引

 
1 创建多层索引
    1)隐式构造
        最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组
 
        · Series也可以创建多层索引
8 pandas模块,多层索引_第1张图片

8 pandas模块,多层索引_第2张图片

 

            一般情况下,两层索引就够用了
 
    2)显式构造 pd.MultiIndex
           · 使用数组
  8 pandas模块,多层索引_第3张图片

 

            · 使用tuple
8 pandas模块,多层索引_第4张图片

 

            · 使用product     最简单,推荐使用
  8 pandas模块,多层索引_第5张图片

 

 
2 对DataFrame列同样可以设置多层索引
  8 pandas模块,多层索引_第6张图片

 

 
============================
练习8:
    1 创建一个DataFrame,表示张三、李四期中、期末各科成绩。
 
============================
 
3 多层索引对象的索引与切片操作
 
    1)Series的操作
        【重要】对于Series来说,直接中括号[]与使用.loc()完全一样,因此,推荐使用中括号索引和切片。
        (1)索引
8 pandas模块,多层索引_第7张图片

8 pandas模块,多层索引_第8张图片

 

    #第一个参数相当于多层索引的第一维,第二个参数就是第二维了
  8 pandas模块,多层索引_第9张图片

 

    #把两个参数写在一起,会将整体作为一个参数,就把整体中的所有的参数都作为一维参数,能查到的就返回,查不到的就不返回,一维中没有期中,所以只返回了张三的查询结果,看看那下面这张截图就知道怎么回事了。
  8 pandas模块,多层索引_第10张图片

 

        (2)切片
  8 pandas模块,多层索引_第11张图片

8 pandas模块,多层索引_第12张图片

 

    2)DataFrame的操作
        (1)可以直接使用列名来进行索引
  8 pandas模块,多层索引_第13张图片

8 pandas模块,多层索引_第14张图片

8 pandas模块,多层索引_第15张图片

 

        (2)使用行索引需要用ix(),loc()等函数
  8 pandas模块,多层索引_第16张图片

8 pandas模块,多层索引_第17张图片

 

 
 
        【及其重要】推荐使用loc()函数
 
        注意在对行索引的时候,若一级行索引还有多个,对二级行索引会遇到问题!也就是说,无法直接对二级索引进行索引,必须让二级索引变成一级索引后才能对其进行索引!
  8 pandas模块,多层索引_第18张图片

 

            同时对一二级索引进行检索
  8 pandas模块,多层索引_第19张图片

8 pandas模块,多层索引_第20张图片

 

===============================
练习:
    1 分析比较Series和DataFrame各种索引的方式,熟练掌握.loc()方法
    2 假设张三再一次在其中考试的时候因为特殊原因放弃Python考试,如何实现
===============================
 
4 索引的堆(先入后出)(stack)
    
    · stack()
    · unstack()
 
    【小技巧】使用stack()的时候,level等于哪一个,哪一个就消失,出现在行里。
  8 pandas模块,多层索引_第21张图片

8 pandas模块,多层索引_第22张图片

8 pandas模块,多层索引_第23张图片

8 pandas模块,多层索引_第24张图片

 

 
    【小技巧】使用unstack()的时候,level等于哪一个,哪一个就消失,出现在列里。
  8 pandas模块,多层索引_第25张图片

8 pandas模块,多层索引_第26张图片

 

 
==========================================
练习:
    1,使用unstack()将ddd变成两行,分别为期中期末
    2,使用unstack()将ddd变成四行,分别为四个科目
==========================================
 
5 聚合操作
【注意】
    · 需要指定axis
    · 【小技巧】和unstack()相反,聚合的时候,axis等于哪一个,哪一个就保留。
 
    所谓的聚合操作:平均数,方差,最大值,最小值 ......
  8 pandas模块,多层索引_第27张图片

8 pandas模块,多层索引_第28张图片

8 pandas模块,多层索引_第29张图片

8 pandas模块,多层索引_第30张图片

8 pandas模块,多层索引_第31张图片

8 pandas模块,多层索引_第32张图片

8 pandas模块,多层索引_第33张图片

8 pandas模块,多层索引_第34张图片

8 pandas模块,多层索引_第35张图片

 

 
 
 
 
 
=======================================
练习:
    1 计算各个科目中期末平均成绩
  8 pandas模块,多层索引_第36张图片

 

    2 计算各个科目张三李四的最高分
 
  8 pandas模块,多层索引_第37张图片

转载于:https://www.cnblogs.com/avention/p/9086539.html

你可能感兴趣的:(8 pandas模块,多层索引)