R语言 逻辑回归模型与混淆矩阵

逻辑回归模型(Logistic Regression Model)

建模

逻辑回归模型是一种 基于线性回归模型 的分类模型,将回归(regression)模型数值化(numeric)的优势用在了分类(classification)上。借助glmnet包,以iris的前100位的两种花 setosa 和 versicolor 为例

library(glmnet)

## 数据处理
data <- iris[1:100,]
data$Species <- as.factor(as.numeric(data$Species)-1)  
n=dim(data)[1]
set.seed(12345)
id <- sample(1:n, floor(n*0.5))
train <- data[id,]           # 训练集 50%
test <- data[-id,]          # 测试集 50%

## 建模
glm <- glm(formula = Species~.,      # 以Species为y,其他特征为X
	family = binomial(link = "logit"),       # 适用于逻辑回归的二项分布
	data = train)                         # 训练集训练数据
	
## 输出predication
ptrain <- predict(glm, train, type = "response") 
ptest <- predict(glm, test, type = "response")

## 判正:概率大于0.5为正(positive),小于等于0.5为负(negative)
train$predict <- as.numeric(ptrain>0.5)        
test$predict <- as.numeric(ptest

你可能感兴趣的:(机器学习,R编程)