描述性统计分析
频数分析
通过频数分析可以得到详细的频数表以及平均数、最大值、最小值、方差、标准差、极差、平均数标准误、峰度系数、偏度系数等描述统计值,还可以得到合适的统计图。
分析-描述统计-频数
描述性分析
计算并输出各种描述性指标。特色:可得到原始数据转化成的标准化取值,并且可以将标准化值以变量的形式存储。
分析-描述统计-描述
探索分析
一种对资料的性质、分布特点完全不清楚的情况下对变量进行更加深入研究的描述性统计方法。特色:除具备一般的描述性指标,数据指标与图形描述,还可以根据一定的方式分组进行统计。
分析-描述统计-探索
列联表分析
通过分析多个变量在不同取值下的数据分布情况,从而进一步分析多个变量之间相互关系的一种描述性分析方法。通过列联表分析,不仅可以得到交叉分组下的频数分布,还可以得到变量之间的相关关系
分析-描述统计-交叉表
均值过程和t检验
均值过程分析
通过均值过程分析可以得到详细的频数表以及平均数、最大值、最小值、方差、标准差、极差、平均数标准误、峰度系数、偏度系数等描述统计值。还能够对数据分组计算描述性统计量并可以输出不同组的计算结果,从而能够对不同的组进行比较分析。
分析-比较均值-均值
单一样本t检验
通过单一样本t检验可以实现样本均值和总体均值的比较。为小概率反证法,即大于5%无显著差异。
分析-比较均值-单样本t检验
独立样本t检验
两个独立样本的均值检验。为小概率反证法,即大于5%无显著差异。
分析-比较均值-独立样本t检验
配对样本t检验
成对样本的均值检验,两个样本顺序不能变。为小概率反证法,即大于5%无显著差异。
分析-比较均值-配对样本t检验
相关与回归分析
简单相关回归
研究变量之间的相关程度并用适当的统计指标表达出来
分析-相关-双变量-相关系数pearson
偏相关回归
需要进行相关分析的变量的取值会同时受到其他变量的影响,因此需要把其他变量控制住,然后输出控制其他变量之后的相关系数
分析-相关-偏相关
距离分析
对样本观测值之间的差异性或者相似程度进行度量,这种分析方法应用在分析之前对数据背后的专业知识不够充分了解,进行探索性研究的情形
分析-相关-距离
简单线性回归
用来处理一个因变量和一个自变量之间的线性关系
分析-回归-线性
多元线性回归
用来处理一个因变量和多个自变量之间的线性关系
分析-回归-线性
曲线回归分析
一种简便的处理非线性问题的分析方法,适用于模型只有一个因变量且可以化为线性形式的情形。基本过程为先将因变量或者自变量进行变量转化,然后对因变量进行直线回归分析,最后将新变量还原为原变量,得出变量之间的非线性关系
分析-回归-曲线估计
非线性回归分析
可以使用户定义各种类型的函数,从而更加准确的描述变量之间的关系
分析-回归-非线性
加权最小二乘回归
标准线性回归的假设是整个整体同方差也就是因变量的变异不随自身预测值以及其他自变量的值的变动而变动。若该假设条件不被满足,可使用加权最小二乘回归。其基本原理是为不同的数据赋予不同的权重以平衡不同的变异数据的影响。
分析-回归-权重估计
二阶最小二乘回归分析
普通最小二乘法有一个基本假设是自变量取值不受因变量的影响,然而很多研究往往存在着内生变量的问题。二阶最小二乘回归即可解决这个问题。基本思路是首先找出内生自变量,然后根据预分析结果找出可以预测该自变量取值的回归方程并得到自变量预测值进行回归,从而可以迂回解决内生自变量的问题。
分析-回归-两阶最小二乘法
二项分类logistic回归
一种简便处理二分类因变量问题的分类方法
分析-回归-二项logistic
多项分类logistic回归
因变量有多个取值且无大小顺序的情况,一种简便处理该类因变量的情况
分析-回归-多项logistic
最优尺度回归
通常我们定义收入级别,学历等等是用1、2、3等距连续整数,这种假设有点草率。最优尺度回归即是解决该问题的
分析-回归-最优尺度
一般对数线性模型分析
分析列联表资料的变量之间的相互关系
分析-对数线性模型
时间序列分析
时间预处理
子主题 1
聚类分析和判别分析
聚类分析和判别分析:相似点:都是研究事物分类的基本方法。不同点:聚类分析是采用定量数学方法,根据样品或指标的数据特征,对样品进行分类从而辨别各样品之间的亲疏关系。判别分析是在已有分类结果的基础上提取信息,构造判别函数,然后根据判别函数对为之分类样本进行分类的一种方法。
二阶段聚类分析
K中心聚类分析
层次聚类分析
判别分析
主成分分析和因子分析:
在不损失大量信息的前提下,用较少的独立变量代替原来变量进行进一步的分析。
主成分分析
将众多初始变量整合成少数几个相互无关的主成分变量,而这些新的变量尽可能包含初始变量的全部信息
分析-降维-因子分析
因子分析
将具有一定关系的多个变量综合为数量较少的几个因子,研究一组具有错综复杂关系的实测指标是如何受少数几个内在的独立因子所支配的。它属于多元分析中处理降维问题的常见方法。
分析-降维-因子分析
信度分析和效度分析
信度分析是分析问卷测量结果真是可信
效度分析是分析问卷结果是否有效