sas一元回归分析_SAS系列27:线性回归

导读

      系列26介绍了处理两个变量间存在线性依存关系的统计分析方法,即线性回归。今天介绍两个变量间存在线性相关关系的统计分析方法及其SAS实现。

三、双变量数据的假设检验

sas一元回归分析_SAS系列27:线性回归_第1张图片

图9-81 双变量数据假设检验方法选择

      单变量数据的统计分析着重于描述某一个变量的统计特征,比较各组间该变量是否存在差异。在医学研究和实践中,也经常会遇到两个变量间关系的研究,如儿童体重与体表面积间的关系,某人群发硒值与血硒值间的关系等,这类数据的分析常用回归与相关。

(二)直线相关

      当一个变量X由小到大,另一个变量Y亦相应地由小到大(或由大到小),两变量的散点图呈直线趋势,即这变量X与变量Y间有直线关系,如健康儿童的发硒值和血硒值间有直线关系,发硒高,血硒也高,发硒低,血硒亦低。这种直线关系,或分析这种直线关系的理论和方法,称为直线相关。两个变量间直线相关的性质和密切程度,用直线相关系数来描述。直线相关系数亦称积差相关系数或积矩相关系数,简称相关系数,创用于F. Y. Edgeworth(1892),符号为r。r值在-1到+1之间,没有单位,相关性质与r值的关系详见图9-89。等级资料的直线相关分析称等级相关,是一种非参数统计方法,常用的分析方法有Spearman和Kendall法。

sas一元回归分析_SAS系列27:线性回归_第2张图片

图9-89 相关系数示意图

      在生物界,由于影响因素众多,很少存在完全相关的。相关系数r是根据样本计算出来的,是总体相关系数ρ的估计值。相关系数的假设检验一般通过PROC CORR过程步实现,常用语法如下: 

sas一元回归分析_SAS系列27:线性回归_第3张图片

1. 直线相关

*===导入数据;PROC IMPORT DATAFILE="E:\Jindingtongji\SAS\DATA\CORR\CORR.CSV"  OUT=CORR  DBMS=CSV REPLACE;RUN;*===正态性检验;PROC UNIVARIATE DATA=CORR NORMAL;  VAR WEIGHT RENAL;  QQPLOT WEIGHT RENAL;RUN;

sas一元回归分析_SAS系列27:线性回归_第4张图片

图9-90 变量WEIGHT正态性检验结果

sas一元回归分析_SAS系列27:线性回归_第5张图片

图9-91 变量RENAL正态性检验结果

*===散点图判断线性趋势;PROC SGPLOT DATA=CORR;  SCATTER X=WEIGHT Y=RENAL/MARKERATTRS=(SYMBOL=CIRCLEFILLED);  XAXIS VALUES=(20 TO 100 BY 20) LABEL='WEIGHT(KG)';  YAXIS VALUES=(210.00 TO 360.00 BY 30) LABEL='THE VOLUME OF DOUBLE KIDNEY(ML)';RUN;

sas一元回归分析_SAS系列27:线性回归_第6张图片

          图9-92  变量WEIGHT与变量RENAL的散点图           

       图9-90与图9-91分别是变量WEIGHT和RENAL的正态性检验结果,结果显示:WEIGHT(W=0.970456,P=0.8647),RENAL(W=0.950221,P=0.5279)服从正态分布。图9-92显示变量WIGHT与RENAL变量有线性趋势。该资料符合PEARSON线性相关分析。

*===PEARSON相关分析;PROC CORR DATA=CORR;  VAR WEIGHT RENAL;RUN;

sas一元回归分析_SAS系列27:线性回归_第7张图片

图9-93 PROC CORR过程步的统计描述结果

sas一元回归分析_SAS系列27:线性回归_第8张图片

图9-94 PROC CORR过程步的相关分析结果

图9-93是两个变量的统计描述结果,图9-94是两变量间的相关分析结果,相关系数r=0.87543(P<0.0001),可认为体重与双肾体积之间存在正相关,相关程度较为密切。

2. 秩相关(等级相关) 

等级相关的两种方法(SPEARMAN法和KENDALL法)的共同点:(1)都是用一个等级相关系数来说明两变量间直线关系的方向和密切程度,两种方法的相关系数值都在+1到-1之间,数据为正表示正相关,为负表示负相关;(2)两种方法的相关系数间有无直线关系必须经假设检验。两种方法计算相关系数r不同。

*===导入数据;PROC IMPORT DATAFILE="E:\Jindingtongji\SAS\DATA\CORR\SPEARMAN.CSV"  OUT=SPEAR  DBMS=CSV REPLACE;RUN;*===正态性检验;PROC UNIVARIATE DATA=SPEAR NORMAL;  VAR DEATH WYPLL;  QQPLOT DEATH WYPLL;RUN;

sas一元回归分析_SAS系列27:线性回归_第9张图片

图9-95 变量DEATH的正态性检验结果

sas一元回归分析_SAS系列27:线性回归_第10张图片

图9-96 变量WYPLL的正态性检验结果

图9-95和图9-96结果显示:变量DEATH(W=0.675817,P<0.0001)和变量WYPLL(W=0.654047,P<0.0001)不服从正态分布,可考虑进进行秩相关分析。 

*===等级相关分析;PROC CORR DATA=SPEAR SPEARMAN KENDALL;  VAR DEATH WYPLL;RUN;

sas一元回归分析_SAS系列27:线性回归_第11张图片

图9-97 PROCCORR过程步的统计描述结果

sas一元回归分析_SAS系列27:线性回归_第12张图片

图9-98 PROCCORR过程步的SPEARMAN相关分析结果

sas一元回归分析_SAS系列27:线性回归_第13张图片

图9-99 PROCCORR过程步的KENDALL相关分析结果

图9-97是两个变量的统计描述结果;图9-98是SPEARMAN相关分析结果:rs=0.90506,P<0.0001;图9-99是KENDALL相关分析结果:rk=0.73856,P<0.0001。SPEARMAN相关分析和KENDALL相关分析的结果都显示两个变量间存在直线相关。

(三)直线回归与相关的关系

直线回归与相关是分析两变量间直线关系的两种统计方法。直线回归用直线回归方程描述两变量变化的数量关系,回归系数b说明自变量每变动一个单位,因变量Y平均变量的单位数。直线相关用相关系数r说明两变量间的直线关系的方向和密切程度。直线回归与相关即有区别又有联系:

1. 区别

(1)在资料要求上,回归要求因变量Y是随机变量,自变量X可以是随机变量也可以非随机变量;相关要求两变量均为随机变量。

(2)在意义上,回归反映依存关系;相关反映相互关系。

(3)在应用上,分析两变量间变化的数量关系用回归;分析两变量间的相关程度用相关。

2.联系

(1)同一资料的r,b正负号相同。

(2)r的假设检验与b的假设检验均用t检验,但其计算公式不同,但同一资料的数值相等,即tr=tb,故结论相同,因而可用r的假设检验代替b的假设检验,较为简便。

(3)r与b可以相互转换:

因:

6c9eb351bf993bddc3eeb4483106c510.png

故:

sas一元回归分析_SAS系列27:线性回归_第14张图片

     (4)回归与相关可相互解释,r2是相关系数的平方,又称决定系数,定义为回归平方各与总平方和之比,其取值在0-1之间且无单位,其数值大小反映回归贡献的相对程度,即在Y的总变异中回归关系所能解释的百分比。回归平方和越接近总平方和,则r绝对值越接近1,说明相关的实际效果越好。决定系数除了作为相关或回归拟合效果的概括统计量,还可利用它对回归或相关作假设检验。

      整理不易,欢迎点亮再看哦!

参考文献:

[1] Marfio F. Triola. ElementaryStatistics[M]. New York: Christine Stavrou, 2010.

[2] 夏庄坤, 徐唯 , 潘红莲, 等. 深入解析SAS——数据处理、分析优化与商业应用[M]. 

[3] 高惠璇. SAS系统Base SAS软件使用手册[M]. 北京:中国统计出版社, 1997.

[4] 孙振球, 徐勇勇. 医学统计学(第4版)[M]. 北京: 人民卫生出版社, 2014.

整理不易,欢迎点亮再看! 【赠人玫瑰,手留余香】

----------------------------------------------

SAS系列26:双变量数据假设检验

SAS系列25:双向有序列联表检验

SAS系列24:单向有序列联表资料的假设检验

SAS系列23:列联表资料假设检验方法

SAS系列22:定性数据假设检验

SAS系列21:SAS统计推断(六)

SAS系列20:SAS统计推断(五)

SAS系列19:SAS统计推断(四)

SAS系列18:SAS统计推断(三)

SAS系列17:SAS统计推断(二)

SAS系列16:SAS统计推断(一)

SAS系列15:SAS数据可视化结果输出

SAS系列14:SAS数据可视化(三)

SAS系列13:SAS数据可视化(二)

SAS系列12:SAS数据可视化(一)

SAS系列11:SAS基础统计过程(三)

SAS系列10:SAS基础统计过程(二)

SAS系列09:SAS 基础统计计算过程

SAS系列08:SAS函数

SAS系列07:SAS数据整理(三)

SAS系列06:SAS数据整理(二)

SAS系列05:SAS数据整理(一)

SAS系列04:SAS数据导入

SAS系列03:SAS入门(二)之SAS编程语言基础

SAS系列02:SAS入门(一)

SAS系列01:统计分析航空母舰-SAS简介

----------------------------------------------

精鼎特邀

sas一元回归分析_SAS系列27:线性回归_第15张图片

sas一元回归分析_SAS系列27:线性回归_第16张图片

你可能感兴趣的:(sas一元回归分析)