批量建模:单因素二分类logistic回归

二分类问题生活中很常见,不像彩票要5个、6个或者更多个数字全中才能拿大奖,很多问题只要"是"或"否"就可以做预言家了。

 Logistic回归是一种十分常见的分类模型,严格来说这是一个分类模型,不是回归。不同于线性回归中对于参数的推导,我们在这里运用的方式不再是最小二乘法,而是极大似然估计。

logistic回归适用的因变量为二分类的分类变量。

在寻找某疾病危险因素中为二分变量即患病与不患病;自变量为分类变量或连续变量。


本次编程设计“批量”系列的第二章,主要完成的是很多个变量和一个二分类响应变量之间的关系。

第三章来讲一下不同数据子集下不同变量间批量单因素有序分类logistic建模。

#logistic二分类数据
#那么10个响应变量就要变成分类变量
#logistic回归适用的因变量为二分类的分类变量或某事件的发生率,数值型变量。
#在寻找某疾病危险因素中为二分变量即患病与不患病;自变量为分类变量或连续变量
#第一步建立模拟数据
set.seed(1) 
n=10
outcome<- factor(sample(c(1,2),n,TRUE),levels = c("1","2"),labels = c("poor","good"))
blood.pressure<- rnorm(n, 125, 15)
blood.glucose<-rnorm(n, 8, 3)
psa<-rnorm(n,3,1)
age<-round(rnorm(n,60,10)) 
sex<-factor(sample(c(1,2),n,TRUE),levels = c("1",

你可能感兴趣的:(批量建模,大数据)