(一)算术均数简称均数。设观察了n个变量值X1,X2,……Xa,一般可直接用式(4.6)求样本均数X。
式中∑是总和的符号,n是样本含量即例数。本书在不会引起误解的情况下简写成
X=1/n∑X (4.6)
例4.318-24岁非心脏疾患死亡的男子心脏重量(g)如下,求心重的均数。
350 | 320 | 260 | 380 | 270 | 235 | 285 | 300 | 300 | 200 |
275 | 280 | 290 | 310 | 300 | 280 | 300 | 310 | 310 | 320 |
X=1/20(350+320+…+320)=5875/20=293.75g
样本均数是总体均数的估计值,它有两个特性。(1)∑(X-X)=0,(2)∑(X-X)2为最小,前者读者
可自证,后者证明如下:
设:a≠X,则a=X±d d>0
∑(X-a)2=∑(X-X±d)2
=∑[(X-X)±d]2
=∑(X-X)2±2d∑(X-X)+Nd2
从第一个特性知∑(X-X)=0,因此2d∑(X-X)=0,
得
∑(X-a)2=∑(X-X)2+Nd2
N是例数,不可能为负,所以Nd2也不会是负数。
∑(X-a)2>∑(X-X)2,∑(X-X)2为最小。
当用电子计算机处理大量实验数据,考虑到有较大舍入误差时,则先取一较近均数的常数c ,然后用式(4.7)计算,可提高均数的精度。
X=C+1/n×(Xi-C) (4.7)
若每输入一个变量值后都希望得到均数,那么可用式(4.8)
X=Xn-1+1/n×(Xn-Xn-1(4.8)
例4.4 仍用例4.3资料,已算得前19例心重的X10=292.37,又测得X20=320,求X20。
X20=292.37+1/20×(320-292.37)=293.75g
若相同的变量值个数较多,或对频数表资料求均数时,可用式(4.9)计算X。
或简写为X=1/n∑fX (4.9)
式中K为不同变量值个数,或频数表中的组段数。Xi为第i个不同的变量值或频数表上的组中值,fi为第i个变量值的频数。
例4.5 计算表4.5菌痢治愈者的平均住院天数。
X=1/157(3×2.5+38×7.5……+1×77.5)=17.9天
式(4.9)中某变量值的频数愈大,则该变量值对X的影响亦愈大。因此,频数又称权数,这样
计算出来的均数又叫加权均数。亦有根据变量值的重要性进行加权,计算加权均数的。
(二)几何均数设n个变量值X1,X2,……,Xa呈对数正态分布,其几何均数G为
式中∏为连乘的符号。当变量值较多时,乘积很大,计算不便,常改用下式计算
(4.10)
或(4.11)
式中符号含义同式(4.6)与式(4.9)。
例4.6 求下表中麻疹病毒特异性IgG荧光抗体的平均滴度。
表4.6 52例麻疹患者恢复期血清麻疹病毒
特异性IgG荧光抗体滴度
IgG滴度倒数 | 例数 |
40 | 3 |
80 | 22 |
160 | 17 |
320 | 9 |
640 | |
1280 | 1 |
G=log-1[1/52×(3log40+22log80+…+log1280)]=129.3
麻疹患者恢复期血清麻疹病毒特异性IgG荧光抗体的平均滴度为1:129。
式(4.10)包含三个步骤,(1)令Xi=logXi,则式(4.10)可写成;(2)1/n∑Xi
即对数数值的均数X;(3)将X取反对数即得几何均数1og-1X=G。这里不难理解,若将这种资料作对数变换后,即可用式(4.6)至式(4.9)的各式计算均数,得到结果后再取反对数即得几何均数。读者可自已验证。