本问使用的数据集与R语言实现决策树的数据集相同,详情可参考这篇文章.
本文实现SVM及相关图形绘制的R包如下:
library(e1071)
library("pROC")
read.table("D:\\Rprojects\\tree.csv",header=TRUE,sep=",")->mydata #读取数据
mydata$group<-factor(mydata$group)
sub<-sample(1:392,260)#260个样例作为训练集,其余作为测试集
train<-mydata[sub,]
test<-mydata[-sub,]
利用SVM包实现:支持向量机
svm_model = svm(group~.,data=train,knernel = "radial")
模型信息显示:
summary(svm_model)
对测试集数据进行预测,并输出混淆矩阵
svm_pred=predict(svm_model,test,decision.values = TRUE)
test$svm_pred = svm_pred
head(test)
table(test$group,test$svm_pred)
混淆矩阵 | case | control |
---|---|---|
case | 33 | 1 |
control | 0 | 98 |
绘制ROC曲线图及分类情况显示图:
#绘制ROC曲线
ran_roc <- roc(test$group,as.numeric(svm_pred))
plot(ran_roc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),grid.col=c("green", "red"), max.auc.polygon=TRUE,auc.polygon.col="skyblue", print.thres=TRUE,main='SVM模型ROC曲线')
attr(svm_pred,"decision.values")[1:9,]
plot(cmdscale(dist(test[,-10])),
col = as.integer(test[,10]),
pch=c("o","+")[1:132 %in% svm_model$index+1])
完整代码如下:
#SVM
library(e1071)
library("pROC")
read.table("D:\\Rprojects\\tree.csv",header=TRUE,sep=",")->mydata #读取数据
mydata$group<-factor(mydata$group)
sub<-sample(1:392,260)#260个样例作为训练集,其余作为测试集
train<-mydata[sub,]
test<-mydata[-sub,]
#模型建立
svm_model = svm(group~.,data=train,knernel = "radial")
summary(svm_model)
#模型预测
svm_pred=predict(svm_model,test,decision.values = TRUE)
test$svm_pred = svm_pred
head(test)
table(test$group,test$svm_pred)
#绘制ROC曲线
ran_roc <- roc(test$group,as.numeric(svm_pred))
plot(ran_roc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),grid.col=c("green", "red"), max.auc.polygon=TRUE,auc.polygon.col="skyblue", print.thres=TRUE,main='SVM模型ROC曲线')
attr(svm_pred,"decision.values")[1:9,]
plot(cmdscale(dist(test[,-10])),
col = as.integer(test[,10]),
pch=c("o","+")[1:132 %in% svm_model$index+1])
支持向量机具有很高的预测准确率,其思想直观,但细节异常复杂,内容设计凸分析算法,核函数,神经网络等领域。其对于简单的线性可分情况将问题转化为凸优化问题,用拉格朗日乘子法简化,然后用既有的算法解决;对于复杂的线性不可分情况,用映射函数将样本投射到高维空间,使其变成线性可分的情况,利用核函数减少高维度计算量。