如何对DataFrame的索引按指定顺序进行排序?

       有时候,我们需要改变DataFrame的索引的顺序,特别是对分层索引进行unstack()或pivot()操作后,其columns不再按原顺序排列,而是默认按columns内容的升序排列,这不是我们想要的结果,我们希望的是按原来的顺序进行排列。那么这时就会有一个问题,即如何改变其索引顺序呢?特别是按照特定的顺序进行排序,而这个特定顺序我们可以通过一个由索引组成的列表进行指定。具体可以看下图的一个例子。

如何对DataFrame的索引按指定顺序进行排序?_第1张图片(图一)

       这个例子中,最初的df的index的顺序是['a','b','c'],但是我们的目的是让其以['c','a','b']排列,当然不能改标索引对应的值。这里的方法是先给df添加和index内容一样的列‘st’,然后最关键的一步是把列'st'的元素转成‘category’类型,这个类型的用处在于可以对这个类型的元素进行任意特定顺序的赋值,图一的代码df['st'].cat.reorder_categories(l,inplace=True)中,就是对‘st’中的元素进行重新指定顺序,这个顺序以参数l指定,l是一个列表,其中对应‘st’元素,l中的顺序就是‘st’中元素对应的新的顺序。指定新顺序后,然后再用df的sort_values()方法,并指定列参数‘st’进行排序,就会按照l指定的顺序重新排列,经过重新设置index,就可以得到新的排列后的df,如图二。

如何对DataFrame的索引按指定顺序进行排序?_第2张图片(图二)

你可能感兴趣的:(数据分析,pandas)