scikit-learn特征选择

重要函数摘抄:
train_test_split
np.random.uniform
np.random.choice
np.random.normal
一、train_test_split
导入
from sklearn.model_selection import train_test_split
语法
X_train,X_test,Y_train,Y_test = train_test_split(train_data,train_target,test_size=0.25,random_state=0)
含义
train_test_split是交叉验证中常用的函数,功能是从样本中随机地按比例选取train_data和test_data;
参数test_size和training_size是指允许指定放入测试/训练集中的数据的百分比;
random_state可以接受一个Numpy RandomState生成器或一个整数种子,为了保证程序每次运行都分割一样的训练集和测试集。
二、np.random.uniform,np.random.choice
导入
from numpy import np
语法
X = np.random.uniform(x,y,size=(a,b))
Y = np.random.choice((‘Male’,‘Female’),size=©)
含义
np.random.uniform(x,y,size=(a,b)),随机生成x和y之间的数,构成size为(a,b)的数组;
np.random.choice((‘Male’,‘Female’),size=©),随机从集合(‘Male’,‘Female’)中选择一个,组成size为©的数组;其中(‘Male’,‘Female’)也可以是数字,如5,也可以是range(5).
三、np.random.normal()
导入
from numpy import np
语法
np.random.normal(loc=0.0,scale=1.0,size=None)
含义
Dram random samples from a normal (Gaussian) distribution.
loc = mean,均值;scale = standard,标准差;
size=Output shape, If the given shape is, e.g., (m, n, k), then m * n * k samples are drawn.
Returns:ndarray(多维数组) or scalar(标量)

你可能感兴趣的:(神经网络)