将表18-1的110名20岁健康男大学生身高频数分布绘成图18-1中的(1),可见高峰位于中部,左右两侧大致对称。可以设想,如果抽样观察例数逐渐增多,组段不断分细,就会逐渐形成一条高峰位于中央(均数所在处)、两侧完全对称地降低、但永远不与横轴相交的钟型曲线(图18-1中的(3)),这条曲线近似于数学上的正态分布(normal distribution)曲线。
统计学家按其变化参数,推导出正态分布密度函数f(X)
-∞<X<+∞公式(18.16)
式中μ为均数;σ为标准差;π为圆周率;е为自然对数的底,即2.71828。以上均为常数,仅X为变量。
为了应用方便,常将式(18.16)进行变量变换—u变换(即u=(X-μ)/σ),u变换后,μ=0,σ=1,使原来的正态分布变换为标准正态分布(standard normaldistribution)亦称u分布,如图18-2。
图18-1 频数分布逐渐接近正态分布示意
图18-2 正态分布与标准正态分布的面积与纵高
此时,式( 18.16)化成
- ∞<u<+∞ 公式(18.17)
式中,φ(u)为标准正态分布的密度函数,即纵轴高度。
根据X和u的不同取值,分别按式(18.16)和式(18.17)可以绘出正态分布和标准正态分布的图形(图18-2)。