R语言实现支持向量机(SVM)

R语言实现SVM

  • 数据介绍
  • 一、相关R包的下载
  • 二、实现过程
    • 1.数据读取与数据集划分
    • 2.构建SVM模型
    • 3.模型验证
  • 总结


数据介绍

本问使用的数据集与R语言实现决策树的数据集相同,详情可参考这篇文章.


一、相关R包的下载

本文实现SVM及相关图形绘制的R包如下:

library(e1071)
library("pROC")

二、实现过程

1.数据读取与数据集划分

read.table("D:\\Rprojects\\tree.csv",header=TRUE,sep=",")->mydata #读取数据
mydata$group<-factor(mydata$group)
sub<-sample(1:392,260)#260个样例作为训练集,其余作为测试集
train<-mydata[sub,]
test<-mydata[-sub,]

2.构建SVM模型

利用SVM包实现:支持向量机

svm_model = svm(group~.,data=train,knernel = "radial")

模型信息显示:

summary(svm_model)

R语言实现支持向量机(SVM)_第1张图片

3.模型验证

对测试集数据进行预测,并输出混淆矩阵

svm_pred=predict(svm_model,test,decision.values = TRUE)
test$svm_pred = svm_pred
head(test)
table(test$group,test$svm_pred)
混淆矩阵 case control
case 33 1
control 0 98

绘制ROC曲线图及分类情况显示图:

#绘制ROC曲线
ran_roc <- roc(test$group,as.numeric(svm_pred))
plot(ran_roc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),grid.col=c("green", "red"), max.auc.polygon=TRUE,auc.polygon.col="skyblue", print.thres=TRUE,main='SVM模型ROC曲线')


attr(svm_pred,"decision.values")[1:9,]
plot(cmdscale(dist(test[,-10])),
    col = as.integer(test[,10]),
    pch=c("o","+")[1:132 %in% svm_model$index+1])

R语言实现支持向量机(SVM)_第2张图片

R语言实现支持向量机(SVM)_第3张图片


完整代码如下:

#SVM

library(e1071)
library("pROC")

read.table("D:\\Rprojects\\tree.csv",header=TRUE,sep=",")->mydata #读取数据
mydata$group<-factor(mydata$group)
sub<-sample(1:392,260)#260个样例作为训练集,其余作为测试集
train<-mydata[sub,]
test<-mydata[-sub,]

#模型建立
svm_model = svm(group~.,data=train,knernel = "radial")
summary(svm_model)

#模型预测
svm_pred=predict(svm_model,test,decision.values = TRUE)
test$svm_pred = svm_pred
head(test)
table(test$group,test$svm_pred)

#绘制ROC曲线
ran_roc <- roc(test$group,as.numeric(svm_pred))
plot(ran_roc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),grid.col=c("green", "red"), max.auc.polygon=TRUE,auc.polygon.col="skyblue", print.thres=TRUE,main='SVM模型ROC曲线')


attr(svm_pred,"decision.values")[1:9,]
plot(cmdscale(dist(test[,-10])),
    col = as.integer(test[,10]),
    pch=c("o","+")[1:132 %in% svm_model$index+1])


总结

支持向量机具有很高的预测准确率,其思想直观,但细节异常复杂,内容设计凸分析算法,核函数,神经网络等领域。其对于简单的线性可分情况将问题转化为凸优化问题,用拉格朗日乘子法简化,然后用既有的算法解决;对于复杂的线性不可分情况,用映射函数将样本投射到高维空间,使其变成线性可分的情况,利用核函数减少高维度计算量。

你可能感兴趣的:(R语言学习,支持向量机,r语言,机器学习)