pandas.cut()用法

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.cut.html

 

pandas.cut 

pandas.cut(xbinsright=Truelabels=Noneretbins=Falseprecision=3,include_lowest=False)

bins  [bɪn]  n. 箱子;素材屉;工具屉(bin的复数形式)

v. 把…放入箱子中(bin的三单形式)

(计算机) 箱、尔资讯网路 (bell information network)、进制、进数

pecision  [prɪ'sɪʒ(ə)n]  n. 精度,[数] 精密度;精确

adj. 精密的,精确的

indices  ['ɪndɪsiːz]  n. 指数;目录(index的复数)

                                     (计算机) 索引、指数

 

返回半开箱的索引,每个x值都属于该值。

 

 

array [ə'reɪ] n. 数组,阵列;排列,列阵;大批,一系列;衣服

vt. 排列,部署;打扮  

(计算机) 阵列eg:

Designing optimum array processing toolbox based on MATLAB.

实现了基于MATLAB的最优阵列处理工具包。

(计算机) 队列eg:

Special attention was given to the data array packaging,transmission, lost package recovering and data flow control. These assured thereal-time transmission in LAN, for which the time delay of video transfer wascontrolled below 0.1s.3.

重点解决了视频数据队列的拆包、传输与丢包恢复及流量控制问题,保证了局域网环境中的实时传输,时延小于0.1秒。

dimensional  [daɪ'mɛnʃənl]  adj. 空间的;尺寸的

                                               (计算机) 尺寸的、维的

x:类似数组排列

         输入要binned的阵列。 它必须是一维的。

scalar  ['skeɪlə]  adj. 标量的;数量的;梯状的,分等级的

n. [数] 标量;[数] 数量

(计算机) 图像缩放 - 引用次数:2

In the third important part,video scalar and gamma correcting are needed before displaying in the TFT-LCD.

显示部分,研究了图像缩放,伽玛校正,以及模拟屏的通用接口程序。

(计算机) 纯量、纯量的

interval  ['ɪntəv(ə)l]  n. 间隔;间距;幕间休息

                                     (计算机) 时距、间隔、间歇

intervalIndex  区间索引

extended  [ɪk'stendɪd; ek-]  adj. 延伸的;扩大的;长期的;广大的

v. 延长;扩充(extend的过去分词)

(计算机) 扩展、延伸、扩充

niform  ['juːnɪfɔːm]  adj. 统一的;一致的;相同的;均衡的;始终如一的

n. 制服

vt. 使穿制服;使成一样

extension  [ɪk'stenʃ(ə)n; ek-]  n. 延长;延期;扩大;伸展;电话分机

bins : int,标量序列,或区间索引

         如果bins取一个int整数,它定义了在x范围内的等宽bins的数量。然而,在这种情况下,x的范围在每一边扩展了0.1%,包含了x的最小值或最大值。如果bins是一个序列,它就定义了bins的边界即宽度,允许不均匀的bins宽度。在这种情况下没有扩展x的范围。

right:boolean 值,可选

         表明bins是否包括最右边缘。 如果right == True(默认值),则bin[1,2,3,4]表示(1,2],(2,3],(3,4]。

labels :数组或布尔,默认无

indicators ['ɪndə,ketɚ] n. 指示器(indicator的复数);指示灯

                                     (计算机) 指示剂、指针

         用作结果bins的标签。 必须与得到的bins的长度相同。 如果为False,则只返回bin的整数指示符。

retbins:boolean值,可选

         是否返回bins? 如果bins是给定的一个标量,可以使用它。(自己:retbins就是return bins的缩写,即这个参数是表示是否返回bins参数的内容,true就返回,false就不返回

precision :int,可选的

         存储和显示bins标签的精度

include_lowest :bool,可选

interval ['ɪntəv(ə)l] n. 间隔;间距;幕间休息

inclusive [ɪn'kluːsɪv] adj. 包括的,包含的

                                     (计算机)可兼的、包含

left-inclusive interval 左闭合区间

         第一个间隔是否应该是左边的。

Returns

out:分类或系列或整数数组,如果标签为False

categorical  [kætɪ'gɒrɪk(ə)l]  dj. 绝对的(名词categoricalness,副词categorically,异体字categoric);直接了当的;无条件的;属于某一范畴的

                                                             (计算机) 分类属性 - 引用次数:25

One airborne radar databasewith a large scale contains massive continuous attributes and categoricalattributes.

某机载雷达数据库中包含大量连续属性和分类属性,且数据库规模庞大。

 

         返回类型(分类或系列)取决于输入:一系列类型类别,如果输入是系列其他类别。当分类数据被返回时,仓表示为类别。

bins:浮子的阵列

         仅当retbins为True时返回。

笔记

剪切函数可用于从连续变量到分类变量。 例如,切割可以将年龄转换成年龄范围。

 

结果中的任何NA值都为NA。 在结果的Categorical对象中,超出范围的值将为NA

例子

>>>pd.cut(np.array([.2, 1.4, 2.5, 6.2, 9.7, 2.1]), 3, retbins=True)

([(0.191,3.367], (0.191, 3.367], (0.191, 3.367], (3.367, 6.533],

  (6.533, 9.7], (0.191, 3.367]]

Categories(3, object): [(0.191, 3.367] < (3.367, 6.533] < (6.533, 9.7]],

array([0.1905    ,  3.36666667, 6.53333333,  9.7       ]))

>>>pd.cut(np.array([.2, 1.4, 2.5, 6.2, 9.7, 2.1]), 3,

          labels=["good","medium","bad"])

[good,good, good, medium, bad, good]

Categories(3, object): [good < medium < bad]

>>>pd.cut(np.ones(5), 4, labels=False)

array([1,1, 1, 1, 1], dtype=int64)

 

你可能感兴趣的:(python)