Pandas连续数据的离散化,cut、qcut

先创建一个DataFrame测试

import pandas as pd
import numpy as np
d = pd.DataFrame(np.random.randint(0, 50, (10, 6)),
                index=list('ABCDEFGHIJ'),
                columns=list('abcdef'))

Pandas连续数据的离散化,cut、qcut_第1张图片

1、等宽法、将数据划分为n等份

把a列的每一个元素的区间都分出来
Pandas连续数据的离散化,cut、qcut_第2张图片
展示每一个区间的元素个数
Pandas连续数据的离散化,cut、qcut_第3张图片
对结果不排序
Pandas连续数据的离散化,cut、qcut_第4张图片

2、等频法、 以相同数量的记录放进每个区间

qcut()是按照分位数对样本进行划分的,这样划分的结果是的每个区间的大小基本相同,但不一定完全相同。例如把a列分成4等份,就是按照四分位数划分的
Pandas连续数据的离散化,cut、qcut_第5张图片

你可能感兴趣的:(数据分析,python,pandas,数据分析)