一、相对危险度(RR)——队列研究中分析暴露因素与发病的关联程度
队列研究是选择暴露及未暴露于某一因素的两组人群,追踪其各自的发病结局,比较两组发病结局的差异,从而判定暴露因素与疾病有无关联及关联大小的一种观察性研究。通常,暴露可以指危险因素,比如吸烟、高血压,也可指服用某种药物。而事件可以是疾病发生,比如肺癌、心血管病,也可指服药后的治疗效果。
RR也叫危险比(risk ratio)或率比(rate ratio),是反映暴露与发病(死亡)关联强度的最有用的指标。RR适用于队列研究或随机对照试验。
RR表明暴露组发病或死亡的危险是非暴露组的多少倍。RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大。即暴露组发病率或死亡率与非暴露组发病率或死亡率之比。
例题:Doll和Hill从1970年至1974年随访观察英国医生的吸烟情况,得到如下资料:重度吸烟者为160/10万,非吸烟者为8/10万,所有英国医生为80/10万。假设肺癌死亡率可反映肺癌发病率。
RR的计算公式是:RR=暴露组的发病或死亡率/ 非暴露组的发病或死亡率
本例中,与非吸烟者相比,重度吸烟者患肺癌的相对危险度是:RR=160/8=20
相对危险度也叫危险比或率比,是暴露组发病率或死亡率与非暴露组发病率或死亡率之比,它是反映暴露与发病(死亡)关联强度的指标。
当它有统计学意义时:
RR=1,说明暴露因素与疾病之间无关联。
RR>1,说明暴露因素是疾病的危险因素(正相关)。认为暴露与疾病呈"正"关联,即暴露因素是疾病的危险因素。
RR<1,说明暴露因素是疾病的保护因素(负相关)。认为暴露与疾病呈"负"关联,即暴露因素是保护因素。
相对危险度应该是指治疗组发生不良反应(adverse outcome)的危险度除以对照组的危险度。(是对照组的多少倍)
前瞻性研究(队列研究)
暴露 非暴露 合计
病例 a b a+b
非病例 c d c+d
合计 a+c b+d N
如上表所示
暴露组的发病率为 π1=a/(a+c)
非暴露组的发病率为 π0=b/(b+d)
相对危险度 RR = π1/π0 = a/(a+c) b/(b+d)
若总体RR大于或小于1,表示暴露因素对疾病有影响。
当其大于1时,表示暴露因素是疾病有害因素,且RR越大,暴露因素对疾病的影响就越大。
当总体RR小于1时,表示暴露因素是疾病的保护性因素,且RR越小,暴露因素对疾病的保护作用就越大。
当总体RR等于1时,表示暴露因素与疾病无关。
在回顾性研究(病例对照研究)中,由于无法计算发病率、死亡率等指标,也就无法计算RR。如下表所示
回顾性研究(病例对照研究)
暴露 非暴露 合计
病例 a b a+b
对照 c d c+d
合计 a+c b+d N
从表中数据可见,在回顾性研究(病例对照研究)中,显然缺乏计算RR的需的基本数据,但是可计算病例组的暴露率和非暴露率之比,即odds1 = P1/(1-P1) = a/(a+b) b/(a+b) ;可以计算对照组的暴露率和非暴露率之比,即odds0 = P0/(1-P0) = c/(c+d) d/(c+d) 。而这两个比数之比即为比值比(Odds Ratio、机会比、优势比)。
OR = P1/(1-P1) P0/(1-P0) = a/(a+b)b/(a+b) c/(c+d)d/(c+d) = ad bc
当所研究疾病的发病率较低时OR近似于RR,故在回顾性研究中可用OR估计RR。OR值的解释与RR相同。
二、归因危险度(AR)
又叫特异危险度、率差(rate difference, RD)和超额危险度(excess risk),
是暴露组发病率与对照组发病率相差的绝对值,它表示危险特异地归因于暴露因素的程度。
相对危险度指暴露组发病率与非暴露组的发病率之比,它反映了暴露与疾病的关联强度,说明暴露使个体发病的危险比不暴露高多少倍,或者说暴露组的发病危险是非暴露组的多少倍。暴露对疾病的病因学意义较大。
归因危险度指暴露组发病率与非暴露组发病率之差,它反映发病归因于暴露因素的程度,表示暴露可使人群比未暴露时增加的超额发病的数量,如果暴露去除,则可使发病率减少多少(AR的值)。减少暴露对疾病的预防作用较大。
特异危险度(AR)的计算公式是:AR=暴露组的发病或死亡率-非暴露组的发病或死亡率
上例中,每年每十万人由于重度吸烟所至肺癌的特异危险度是:AR=160-8=152
三、比值比(OR——病例对照研究中 暴露因素与疾病的关联强度
比值比(Odds ratio, OR):也称优势比、比数比、交叉乘积比,是病例对照研究中表示暴露与疾病之间关联强度的指标,比值(odds)是指某事物发生的概率与不发生的概率之比。比值比指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。
>1 暴露与疾病的危险度增加 正相关
<1 暴露与疾病的危险度减少 负相关
=1 暴露与疾病的危险度无关 无相关
成组病例对照研究资料整理表
--------------------
暴露或特征 病例 对照 合计
---------------------
有 a b a+b=n1
无 c d c+d=n0
---------------------
合计 a+c=m1 b+d=m0 a+b+c+d=N
------------------------
病例组暴露比值为:(a/m1)/(c/m1)=a/c
对照组暴露比值为:(b/m0)/(d/m0)=b/d
比值比OR= 病例组暴露比值a/c ÷ 对照组暴露比值b/d = ad/bc
相对危险度(relative risk,RR)是暴露组与非暴露组发病率之比。但在病例对照研究中不能计算发病率,只能计算OR,OR的含义与RR相同,是两个概率的比值,指暴露组的疾病危险度为非暴露组的多少倍,取值在0 - ∞之间。当OR>1时,说明暴露使疾病的危险度增加,是疾病的危险因素,叫做“正关联”;当OR<1时,说明暴露使疾病的危险度减少,叫做“负关联”,暴露因素对疾病有保护作用;当OR=1时,表示暴露与疾病无关联。
OR(odds ratio) 比值比。OR=(A/B)÷(C/D)=AD/BC。RR和OR两个公式的区别,A/(A+B) 指暴露于某因素发生某事件的风险;A/B 指暴露人群中病例的比例,C/D指非暴露人群中病例的比例,所以OR也被称为优势比。当疾病非常罕见时,OR常可作为RR的近似值。OR通常适用于病例对照研究,也可以运用于前瞻性的研究(当观察时间相等时)。Logsitic回归模型可以得到OR值。
计算OR的可信限
由于比值比是对暴露和疾病联系强度的一个点估计值,此估计值未考虑抽样误差,有其变异性,计算出这个变异区间有助于进一步了解联系的性质和强度,即按一定 的概率(可信度)来估计本次研究总体的比值比在什么范围内,这个范围称比值比的的可信区间,其上下限的数值为可信限。一般采用95%的可信限。计算OR值 可信区间除了有助于估计变异范围的大小外,还有助于检验OR值的判断意义,如区间跨越1,则暴露与疾病无关联。
例1:Doll和Hill在1950年报告吸烟与肺癌关系的病例对照研究,结果如表
表1 吸烟与肺癌关系的病例对照研究资料
----------------- - `
吸烟史 病例 对照 合计
---------------
有 688 650 1338
无 21 59 80
---------------
合计 709 709 1418
----------------- -
① χ2检验 P<0.001,两组的暴露史比例差异显著,提示吸烟可能与肺癌有联系。
② 计算比值比OR
OR=688×59/650×21=2.97
③ 计算OR 95%可信限
故OR95%可信限为1.83-4.90。即总体的OR值有95%的把握在此范围内,分析结果说明吸烟对肺癌高度有害,说明吸烟者(暴露)患肺癌的的危险性为不吸烟者(非暴露)的1.83-4.90倍。
风险比(hazard ratio,HR)[HR=暴露组的风险函数h1(t)/非暴露组的风险函数h2(t),t指在相同的时间点上]。而风险函数指危险率函数、条件死亡率、瞬时死亡率。Cox比例风险模型可以得到HR。资料的类型通常是临床治疗性研究,也可以是流行病学的队列观察性研究。
风险比和危害比。
1、多数认为HR与RR意思一样,但HR有时间因素在内,换句话说,包含了时间效应的RR就是HR;
2、可以这样理解,生存资料中,RR考虑了终点事件的差异,而HR不仅考虑了终点事件的有无,还考虑了到达终点所用的时间及截尾数据;
3、根据Parmar的文章,HR=(Or/Oe)/(Cr/Ce),O和C分别代表对照组和试验组,r代表实际发生事件的人数,e代表按log rank test中计算得出的理论上应该发生事件的人数。其实HR的计算还有一种方法就是
*** this is assumed based on the constancy of the ratio over time, as above.
对于提供生存率的文献,可以根据公式HR=[p0/(1-p0)]/[p1/(1-p1)],其中p0为对照组的5年生存率,p1为暴露组的5年生存率。
*** Hazard is an instaneous rate of a given outcome, which indeed factors time in. Hazard ratio is a raio of two hazards (Exp/Ctl) at that given time. By using hazard ratio as a summary estimate of the treatment effects in suvival data, we assume the hazard ratio is constant over time, which is a strong assumption and a basis for cox regression. This doesn't mean hazard would not change (actually, hazard always change over time), though - we just require the ratio of the hazards is constant.
3、根据Parmar的文章,HR=(Or/Oe)/(Cr/Ce),O和C分别代表对照组和试验组,r代表实际发生事件的人数,e代表按log rank test中计算得出的理论上应该发生事件的人数。