相关性分析 01

哎呀,今天上班的时候突然就碰到了这个问题,一些关于相关性的问题,就简单地分析下吧!


相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。

例如,人的身高和体重之间;空气中的相对湿度与降雨量之间的相关关系都是相关分析研究的问题。

相关分析与回归分析之间的区别:回归分析侧重于研究随机变量间的依赖关系,以便用一个变量去预测另一个变量;相关分析侧重于发现随机变量间的种种相关特性。

相关分析在工农业、水文、气象、社会经济和生物学等方面都有应用。


相关分析就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。

它是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。

在一段时期内出生率随经济水平上升而上升,这说明两指标间是正相关关系;

而在另一时期,随着经济水平进一步发展,出现出生率下降的现象,两指标间就是负相关关系。


为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。

例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为“散点图”。

根据散点图,当自变量取某一值时,因变量对应为一概率分布,如果对于所有的自变量取值的概率分布都相同,则说明因变量和自变量是没有相关关系的。

反之,如果,自变量的取值不同,因变量的分布也不同,则说明两者是存在相关关系的。

两个变量之间的相关程度通过相关系数r来表示。

相关系数r的值在-1和1之间,但可以是此范围内的任何值。

正相关时,r值在0和1之间,散点图是斜向上的,这时一个变量增加,另一个变量也增加;

负相关时,r值在-1和0之间,散点图是斜向下的,此时一个变量增加,另一个变量将减少。

r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。


1、按相关的程度分为完全相关、不完全相关和不相关

    a. 两种依存关系的标志,其中一个标志的数量变化由另一个标志的数量变化所确定,则称完全相关,也称函数关系。

    b. 两个标志彼此互不影响,其数量变化各自独立,称为不相关。

    c. 两个现象之间的关系,介乎完全相关与不相关之间称不完全相关。

2、按相关的方向分为正相关和负相关

    a. 正相关指相关关系表现为因素标志和结果标志的数量变动方向一致。

    b. 负相关指相关关系表现为因素标志和结果标志的数量变动方向是相反的。

3、按相关的形式分为线性相关和非线性相关

一种现象的一个数值和另一现象相应的数值在坐标系中确定为一个点,称为线性相关。

非线性相关是指输出和输入既不是正比例也不是反比例的情形。

“线性”与“非线性”,常用于区别函数y=f(x)对自变量x的依赖关系。

    线性函数即一次函数,其图像为一条直线;非线性函数则为非线性函数,其图像不是直线。

    线性,是指量与量之间按比例、成直线的关系,在空间和时间上代表规则和光滑的运动;

而非线性则指不按比例、不成直线的关系,代表不规则的运动和突变

4、按影响因素的多少分为单相关和复相关

    a. 如果研究的是一个结果标志同某一因素标志相关,就称单相关。

    b. 如果分析若干因素标志对结果标志的影响,称为复相关或多元相关。


未完待续 2019年7月8日20:31:54

你可能感兴趣的:(相关性分析 01)