数据挖掘 打乱数据(DataFrame)

一、假设有一个10行的数据(DataFrame)
数据挖掘 打乱数据(DataFrame)_第1张图片
二、生成随机序列
在这里插入图片描述
三、将数据分成训练集和测试集
训练集:8行数据
测试集:2行数据
数据挖掘 打乱数据(DataFrame)_第2张图片

四、代码

import pandas as pd
import numpy as np

d = np.arange(10) + 1
data = pd.DataFrame({
    "A": d,
    "B": d * 0.1,
    "C": d * 0.01
})
data
random_mask = np.random.permutation(data.shape[0])
random_mask
# 训练集
train_set = data.loc[random_mask[:8], :]
train_set
# 测试集
test_set = data.loc[random_mask[8:], :]
test_set

你可能感兴趣的:(数据挖掘,数据挖掘)