Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()


    在前面几小节中,已经简单的说了Pandas 模块里面的数据结构,如何创建数据,如何和外界交互读取,但是我们使用 Pandas 的主要目的还是为了清洗数据,整理数据,然后得到我们想要的结果。

1.  重命名

1.1 .rename() 函数-修改 Dataframe 数据的行名和列名

1.1.1 .rename() 函数语法

DataFrame.rename(self, mapper=None, index=None, columns=None, axis=None, copy=True, inplace=False, level=None, errors='ignore')


  • mapper: 类似字典或函数,类似Dict或函数的转换,以应用于该轴的值。要么 使用 mapper 和 axis 与指定axis 的目标 进行 mapper 转换,要么使用 index 和 columns。
  • index: 类似字典或函数,指定axis (mapper, axis=0 相当于 index=mapper)的替代方法。
  • columns: 类似字典或函数,指定axis (mapper, axis=1 相当于 columns=mapper)的替代方法。
  • axis:{0 or 'index', 1 or 'columns'}, 默认为0(即' index ')
  • int 或 str,轴到目标与mapper。可以是轴名(' index ', ' columns ')或数字(0,1),
  • copy:bool, 默认 True,还要复制底层数据。
  • inplace:bool, 默认为 False,是否返回一个新的DataFrame。如果为真,则忽略copy的值。
  • level:int 或 level name, 默认 None,对于多索引,只能在指定的级别重命名标签。
  • errors:{‘ignore’, ‘raise’}, 默认 ‘ignore’。如果‘raise’,则在类似于 dict 的映射器、索引或列包含正在转换的索引中不存在的标签时引发键错误。如果 ‘ignore’,现有的键将被重命名,额外的键将被忽略。
df = pd.DataFrame({"A": [0, 1, 2], "B": [3, 4, 5]})

Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()_第1张图片

1.1.2 .rename() 函数范例-参数 index 和 columns 

index 和 columns ,这两者既可以单独用,也可以组合在一起用。

如果是index 和 columns 使用 dict 形式

df.rename(index={0: "x", 1: "y", 2: "z"},# dict 替换名字
          columns={"A": "a", "B": "b"}) # dict 格式替换名字


Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()_第2张图片

 如果是index 和 columns 使用 函数形式

df.rename(index=lambda x:x+1,# lambda 函数 对 index 进行操作
          columns=lambda x:x*2) # 同上

Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()_第3张图片

 如果代码中的 lambda 函数换成其他内置函数或者用户定义的函数也是可以的。

例如将 index 转换成 str 类型

Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()_第4张图片

1.1.3 .rename() 函数范例-参数 mapper 和 axis

mapper 和 axis ,这两者需要组合在一起使用,即使 axis 没有指定,也是默认为 0 即 “index” 的。

只明确指定 mapper 参数,mapper 为 dict 

df.rename(mapper={0: "x", 1: "y", 2: "z"})# axis 为默认 0 即 index

Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()_第5张图片

明确指定 mapper 参数,mapper 为 dict ,明确指定 axis,采用数值方式

df.rename(mapper={"A": "a", "B": "b"},
            axis=1)# axis 为默认 1 即 index

 Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()_第6张图片

 明确指定 mapper 参数,mapper 为 函数,明确指定 axis,采用字符串方式

df.rename(mapper=lambda x:x.upper(),
            axis="columns")# axis 为默认 1 即 index

 Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()_第7张图片

1.1.4 .rename() 函数范例-参数 copy 和 inplace

  • copy:bool, 默认 True,还要复制底层数据。
  • inplace:bool, 默认为 False,是否返回一个新的DataFrame。如果为真,则忽略copy的值。

Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()_第8张图片

1.1.5  .rename() 函数范例-参数  level  

level : int or level name, default None In case of a MultiIndex, only rename labels in the specified level

1.1.6  .rename() 函数范例-参数  errors

errors : {'ignore', 'raise'}, default 'ignore'

If 'raise', raise a `KeyError` when a dict-like `mapper`, `index`, or `columns` contains labels that are not present in the Index being transformed.

If 'ignore', existing keys will be renamed and extra keys will be ignored.

errors 这个参数非常好理解,它加强了对 error 的错误控制。

Pandas 模块-操纵数据(1)-重命名-rename()-rename_axis()_第9张图片

1.2 .rename_axis() 函数-设置索引或列的axis名称。

1.2.1 .rename_axis() 函数语法

DataFrame.rename_axis(self, mapper=None, index=None, columns=None, axis=None, copy=True, inplace=False)


1.2.2 .rename_axis() 函数范例

在已经介绍 DataFrame.rename 的基础上,安装包里面的 rename_axis() 范例就足够了

    >>> s = pd.Series(["dog", "cat", "monkey"])
    >>> s
    0       dog
    1       cat
    2    monkey
    dtype: object
    >>> s.rename_axis("animal")
    0    dog
    1    cat
    2    monkey
    dtype: object
    >>> df = pd.DataFrame({"num_legs": [4, 4, 2],
    ...                    "num_arms": [0, 0, 2]},
    ...                   ["dog", "cat", "monkey"])
    >>> df
            num_legs  num_arms
    dog            4         0
    cat            4         0
    monkey         2         2
    >>> df = df.rename_axis("animal")
    >>> df
            num_legs  num_arms
    dog            4         0
    cat            4         0
    monkey         2         2
    >>> df = df.rename_axis("limbs", axis="columns")
    >>> df
    limbs   num_legs  num_arms
    dog            4         0
    cat            4         0
    monkey         2         2
    >>> df.index = pd.MultiIndex.from_product([['mammal'],
    ...                                        ['dog', 'cat', 'monkey']],
    ...                                       names=['type', 'name'])
    >>> df
    limbs          num_legs  num_arms
    type   name
    mammal dog            4         0
           cat            4         0
           monkey         2         2
    >>> df.rename_axis(index={'type': 'class'})
    limbs          num_legs  num_arms
    class  name
    mammal dog            4         0
           cat            4         0
           monkey         2         2
    >>> df.rename_axis(columns=str.upper)
    LIMBS          num_legs  num_arms
    type   name
    mammal dog            4         0
           cat            4         0
           monkey         2         2

