机器学习专题:R实现(2)

1. 数据集划分和预处理

setwd()
library(readr)

# 完整矩阵
sampleTraits<-read_csv("2-datTraits_95.csv", col_names = T) 
datExpr<-read_csv("3-normdatExpr_DEseq_95_miRBAse_batch.csv", col_names = T) # 标准化矩阵
head(names(sampleTraits));head(names(datExpr))

# 矩阵转置
miR<-as.vector(unlist(datExpr[,1]))
datExpr_t<-t(datExpr[,-1])
colnames(datExpr_t)<-miR 
rownames(datExpr_t)<-sampleTraits$Diagnosis
datExpr_t[c(1:3),c(1:3)]  # 列为样本,行为变量

#数据集划分
library(caret)
miR1<-read_csv("7.4-for_svm_sec_log2fc.csv") #加上oob方法结果不变7

miR<-unlist(miR1) #**1、7
F_svm<-datExpr_t[,miR];dim(F_svm)

set.seed(1)
devide_sub<-createDataPartition(y = rownames(F_svm), p=0.65, list=FALSE)
train_data<-F_svm[devide_sub, ];dim(train_data) #65%的german_credit数据作为训练数据
test_data<-F_svm[-devide_sub, ];dim(test_data)  #35%的german_credit数据作为测试数据

#数据预处理
group_train = row.names(train_data)
group_test = row.names(test_data)
input_train<-data.frame(group = group_train, train_data)
input_test<-data.frame(group = group_test, test_data)

一、k近邻模型

二、随机森林模型

三、支持向量机模型

四、神经网络模型

五、LR回归模型

六、贝叶斯模型

你可能感兴趣的:(机器学习专题:R实现(2))