pd.Categorical 用法

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Categorical.html    网址

class pandas.Categoricalvaluescategories = Noneordered = Nonedtype = Nonefastpath = False [source]


代表经典的R / S +时尚中的分类变量

分类只能采用有限的(通常是固定的)数量的可能值(类别)。与统计分类变量相比,分类可能会有一个顺序,但数字操作(添加,分割......)是不可能的。

分类的所有值都在分类np.nan中类别外分配值会引发ValueError订单由类别的顺序定义,而不是数值的词汇顺序。

参数:

:像列表一样

分类的值。如果给出类别,那么不在类别中的值将被NaN取代。

类别索引(唯一),可选

此类别的唯一类别。如果没有给出,这些类别被假定为值的唯一值。

命令:布尔值,(默认为False)

这个分类是否被视为一个有序的分类。如果没有给出,则最终的分类将不会被排序。

dtype:CategoricalDtype

CategoricalDtype用于此分类的实例

新版本0.21.0。

举:

ValueError异常

如果类别不验证。

类型错误

如果ordered=True给出了明确的但没有分类并且 不可排序。

也可以看看

pandas.api.types.CategoricalDtype
输入分类数据
CategoricalIndex
具有基础的索引  Categorical

笔记

请参阅用户指南了解更多信息。

例子

>>> pd.Categorical([1, 2, 3, 1, 2, 3])
[1, 2, 3, 1, 2, 3]
Categories (3, int64): [1, 2, 3]
>>> pd.Categorical(['a', 'b', 'c', 'a', 'b', 'c'])
[a, b, c, a, b, c]
Categories (3, object): [a, b, c]

有序分类可以根据类别的自定义顺序进行排序,并且可以有最小值和最大值。

>>> c = pd.Categorical(['a','b','c','a','b','c'], ordered=True,
...                    categories=['c', 'b', 'a'])
>>> c
[a, b, c, a, b, c]
Categories (3, object): [c < b < a]
>>> c.min()
'c'

属性

categories 这个类别的类别。
codes 这个分类的分类代码。
ordered 类别是否具有有序关系
dtype CategoricalDtype此实例

方法

from_codes(代码,类别[,订购]) 从代码和类别数组中创建一个分类类型。
__array__([D型])

numpy数组接口。

你可能感兴趣的:(python)