第一节、统计、统计学与医学统计学
第二节 统计工作基本步骤
一、设计
1、专业设计:
选题、建立假说、确定研究对象和技术方法等 —— 从专业的角度考虑试验的科学安排
2、统计设计:
围绕专业设计确定统计设计类型、样本大小、分组方法、统计分析指标及统计分析方法
* 数据的来源:(1)观察;(2)试验。
二、收集资料
(一)资料来源
第一手资料:
(1)经常性:统计报表、工作记录
(2)一时性:专题研究的实验数据和调查资料。
第二手资料:已公布的资料
(二)资料要求
1、完整:观察单位及观察项目完整
2、准确
3、及时:即时限性。如人口普查规定调查开始日期和截止日期。
三、整理资料
1、数据净化
2、逻辑核查
3、统计核查
四、分析资料
1. 统计描述
用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。
2. 统计推断
在一定的置信度和概率保证下,用样本信息推断总体特征。
(1)参数估计:用样本的指标去推断总体相应地指标。
(2)假设检验:由样本的差异推断总体之间是否可能存在的差异。
第三节 统计学的若干基本概念
一、同质与变异
· 同质:根据研究目的确定的研究对象相同特征的条件组合。
如:研究某个班级的同学的身高,那么这些同学来自同一个班级,这是一个相同的特征。
· 变异:同质事物个体间的差异。
变异是统计学存在的基础,从本质上来说,统计学是研究变异的科学。
二、总体和样本
· 总体:根据研究目的确定的同质研究对象的某一(组)指标值全体(集合)。
· 样本:从总体中随机抽取的、数量足够的、能够代表总体特征的部分研究对象某一指标值的集合。
· 随机抽样:为了保证样本的可靠性和代表性,需要采用随机的抽样方法。
三、参数和统计量
· 参数:描述总体的统计指标,如总体均数,记为μ。
· 统计量:描述样本的指标,如样本均数,记为x̅。统计量是参数附近波动的随机变量。
四、变量和资料
· 变量:描述研究对象某种特征的指标。
· 资料:变量全部或部分的测量值。
1、计量资料
定义:每个研究对象的变量值为一数值,表现出量的大小,由这样的一组研究对象定量测量值所构成的资料为计量资料。
特点:有度量衡单位,多为连续性资料。
举例:身高、脉搏、血压
2、计数资料
定义:每个研究对象的变量值为互补相容的属性(类别)之一,由这样一组研究对象定性变量值组成的资料即为计数资料。
特点:没有度量衡单位,多为间断性资料。
举例:肤色、血型、职业、性别
3、等级资料
定义:每个研究对象的变量值为互不相容的属性之一,且这些属性间有程度的递进或递减关系。
特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同。
举例:癌症分期(早、中、晚)、药物疗效(治愈、好转、无效、死亡)、尿蛋白
* 三类数据之间的关系:定量数据可向等级数据转换,等级数据可向定性数据转换。
五、误差
· 误差:泛指观测值与真实值之差,以及样本指标与总体指标之差。
(1)系统误差:需要绝对避免。
(2)随机测量误差:没有固定的倾向,可使观测结果有大有小。不可避免,但应尽量减少。
(3)抽样误差:由于抽样造成的样本指标与总体指标之间的差别。
六、概率和频率
· 概率:度量随机事件A发生可能性大小的一个数量。记为P(A)。
· 频率:若在n次同样的随机试验中,事件A发生了k次,则比值k/n为频率。
· 若当试验次数n充分大以后,频率k/n稳定地在某一确定值P的附近摆动,可用事件A的频率作为所求概率的近似值:
P(A)≈ f(A)= k/n
· 小概率事件:P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。
(1)必然事件 P=1
(2)不可能事件 P=0
(3)随机事件 0