机器学习 数据预处理之二值化

1、什么是二值化

用0和1来表示样本矩阵中相对于某个给定阈值高于或者低于它的元素

2、作用

作用:一般用在图像处理 (将图像分成黑和白 常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群)

3、示例代码

import  numpy as np
sample = np.array([
    [2, 4, 5, -1],
    [3, 1, 7, -2],
    [6, -3, 2, -1],
], dtype="float")
s = sample.copy()
s[s<=3] = 0     #必须先对小的阈值进行判
s[s>3] = 1
print(s)

4、调用库包代码

import  numpy as np
import  sklearn.preprocessing as sp


sample = np.array([
    [2, 4, 5, -1],
    [3, 1, 7, -2],
    [6, -3, 2, -1],
], dtype="float")
bin = sp.Binarizer(threshold=3)  #生成一个阈值为3的二值化器
new_sample = bin.transform(sample)   #用二值化器对样本进行转换
print(new_sample)

你可能感兴趣的:(PYTHON,数据分析,数据预处理,python,机器学习)