定群研究资料分析主要是计算各组发病率、发病密度或死亡率,其次对组间率的差异进行统计学检查,差异有统计学意义则进一步确定因素与疾病联系的强度。定群研究资料归纳见表30-2。
表30-2 定群研究资料归纳表
组别 | 病例 | 非病例 | 合计 | 发病率 |
暴露组 | a | b | a+b=N1 | a/N1 |
非暴露组 | c | d | c+d=N | c/N |
a+c=m1 | b+d=m |
定群研究所比较的是发病率或死亡率即a/N1,与c/N,如a/N1>c/N,则某因素与发病有联系,甚至是因果联系。
(一)率的计算
1.累积发病率(cumulative incidence)观察期间人群比较固定,且能稳定地维持在一个较长的观察期,可用累积发病率(或死亡率)。计算公式为:
2.发病密度(ivcidence density)若暴露人口不固定,人群产生了较大的变动,例如由于工作调动、死于其他疾病、中途加入等,应将变动着的人群转变为人时数代替人数业计算,此种发病率称发病密度。人时就是将人与时间因素结合起来作为率分母的单位,常用的单位是人年,是一个观察对象被观察满一年计为一人年。分子为观察期间发病或死亡人数。
(二)暴露人年计算
定群研究观察时间较长,其间人口有动态变化,应采取一定方法计算“暴露人年数”,才能计算发病率;否则,两组成员由于进入开始观察的时间不同,或因死亡、迁出及其他原因或早或晚地退出该组,而造成观察时间的不同,即各组成员的暴露时间不同,可使发病率出现误差。
1.大样本中暴露人年的计算计算原则为:从观察对象中剔除死亡、迁移及失去联系的人数,补充新加入的人数来折算人年。
可以年末12月31日的人数为终点及起点计算。上年12月31日观察人数减去次年内所有死亡、迁移、失去联系及新加入人数的总和,得到次年末12月31日的观察人数。两个人数之和除以2,即得到该年内暴露人年数。表30-3为例说明不同年龄9年的合计暴露人年数。
表30-3 男性各年龄各年末存活人数
年龄组 | 1972. 12.31 |
1973. 12.31 |
1974. 12.31 |
1975 12.31 |
1976. 12.31 |
1977. 12.31 |
1978. 12.31 |
1979. 12.31 |
1980. 12.31 |
1981. 12.31 |
合计暴露 人年数 |
<45 | 607 | 547 | 471 | 392 | 324 | 246 | 210 | 179 | 148 | 110 | 2875.5 |
45~54 | 598 | 596 | 604 | 599 | 603 | 625 | 598 | 562 | 538 | 510 | 5279 |
55~64 | 369 | 406 | 433 | 472 | 493 | 496 | 519 | 524 | 513 | 526 | 4303.5 |
65及以上 | 62 | 75 | 95 | 111 | 132 | 158 | 180 | 210 | 251 | 286 | 1386 |
合计 | 1636 | 1624 | 1603 | 1574 | 1552 | 1525 | 1507 | 475 | 1450 | 1432 | 13844 |
(李婉先等,1984)
以小于45岁组为例计算合计暴露人年数:
(607+547)÷2+(547+471)÷2+(471+392)÷2(392+324)÷2+(324+246)÷2+(246+210)÷2+(210+179)÷2+(179+148)÷2+(148+110)÷2= 2875.5
如此9年内共有3名45岁以下男性死亡,男性45岁以下组的死亡率为:3÷2875.5×10万=104.3/10万人年。
2.小样本可以直接计算若样本不大,且各人随访年数不同,可先算出各人随访人年数,再计算总人年数;而且因为随访期内各人的年龄在增长,到一定的日期年龄超过原属年龄组上限时,会进入下一年龄组。所以还可以算出各年龄组的总人年数以及不同的年份的总人年数,结合同年龄或同年份发生的病例数,则可算出各年龄组或年份的发病率。
例有3人从开始观察日起至1981年1月1日止,逐个计算人年的方法。上例并得出不同年龄组的暴露人年,见表30-4、表30-5。
表30-4 3例出生日期与进出研究时间
对象编号 | 出生日期 | 进入研究时间 | 退出研究时间 |
1 | 1927.03.21 | 1966.07.19 | 1977.09.14(迁居外地) |
2 | 1935.04.09 | 1961.11.11 | 1973.12.01(死亡) |
3 | 1942.11.12 | 1970.02.01 | 1981.01.01(观察结束时健在) |
资料来源:钱宇平;流行病学第二版1986
表30-5 3例人年的计算
对象1 1927年3月21日出生 |
对象2 1935年4月9日出生 |
对象3 1942年11月12日出生 |
暴露 人年 |
|
25~ | 61.11.11~65.04.08 共3年4个月27天即3.41人年 |
70.02.01~72.11.11 共2年9个月10天即2.78人年 |
6.19 | |
30~ | 65.04.09~70.04.08 共5.00人年 |
72.11.12~77.11.11 共5.00人年 |
10.00 | |
35~ | 66.07.19~67.03.20 共8个月即0.67人年 |
70.04.09~73.12.01 共3年7个月22天即3.65人年 |
77.11.12~81.01.01 共3年1个月20天即3.14人年 |
7.46 |
40~ | 67.03.21~72.03.20 共5.00人年 |
5.00 | ||
45~ | 72.03.21~77.03.20 共5.00人年 |
5.00 | ||
50~54 | 77.03.21~77.09.14 共5个月24天即0.48人年 |
0.48 | ||
累计 | 66.07.19~77.09.14 共11.15人年 |
61.11.11~73.12.1 共12.06人年 |
70.0201~81.01.01 共10.92人年 |
34.13 人年 |
资料来源:钱宇平:流行病学第二版1986
(三)统计学检验
暴露组与非暴露组间率的差异要进行统计学检验。当发病率高时,可用u检验。如果发病率比较低,则改用二项分布或泊松分布检验。检验方法查阅有关统计学书籍。
(四)联系强度的测量
为了估计疾病死亡与暴露的联系强度,常用的测量指标有相对危险度、特异危险度、人群特异危险度。
1.相对危险度(relative risk)又称“危险比”(risk ratio)或“率比”(rate ratio)。是暴露组发病率(或死亡率)与非暴露组发病率(或死亡率)的比值,简称RR。
式中Ie=暴露组发病率,Iu=非暴露组发病率。
它说明暴露组发病或死亡为非暴露组的倍数。
RR>1,说明暴露因素与疾病有“正”的联系。暴露越多,发病越多,可能是致病因素。
RR=1,说明暴露因素与疾病无联系。
RR<1,说明暴露因素与疾病有“负”的联系。暴露越多,疾病越少,具有保护意义。
表30-6中提供的判断数据可供参考。
表30-6 相对危险度与联系强度
相对危险度 | 联系的强度 | |
0.9~1.0 | 1.0~1.1 | 无 |
0.7~0.8 | 1.2~1.4 | 弱 |
0.4~0.6 | 1.5~2.9 | 中等 |
0.1~0.3 | 3.0~9.0 | 强 |
<0.1 | 10~ | 很强 |
2.特异危险度(attributable risk)又称归因危险度或率差(rate difference),简称AR。特异危险度为暴露组发病(或死亡)率与非暴露组发病(或死亡)率之差。
AR=Ie-Iu=a/N1-c/N
特异危险度表示完全由暴露因素所致之危险度。
3.人群特异危险度(population attributable risk)简称PAR。
PAR=It-Iu
It=全人群某病发病率或死亡率
Iu=非暴露者某病发病率或死亡率
人群特异危险度是测量在人群中因暴露于某因素所致的发病率或死亡率。