图 6-2 正态分布概率密度函数的曲线
正态曲线可用方程式表示。当 n→∞时,可由二项分布概率函数方程推导出正态分布曲线的方程:
f(x)= (6.16 )
式中: x —所研究的变数; f(x) —某一定值 x 出现的函数值,一般称为概率密度函数(由于间断性分布已转变成连续性分布,因而我们只能计算变量落在某一区间的概率,不能计算变量取某一值,即某一点时的概率,所以用“概率密度”一词以与概率相区分),相当于曲线 x 值的纵轴高度; p —常数,等于 3.14159 ……; e — 常数,等于 2.71828 ……; μ为总体参数,是所研究总体的平均数,不同的正态总体具有不同的 μ ,但对某一定总体的 μ 是一个常数; δ 也为总体参数,表示所研究总体的标准差,不同的正态总体具有不同的 δ ,但对某一定总体的 δ 是一个常数。
上述公式表示随机变数 x 的分布叫作正态分布,记作 N( μ , δ2 ) ,读作“具平均
数为 μ,方差为 δ2 的正态分布”。正态分布概率密度函数的曲线叫正态曲线,形状见图 6-2 。
(二)正态分布的特性
1 、正态分布曲线是以 x= μ 为对称轴,向左右两侧作对称分布。因 的数值无
论正负,只要其绝对值相等,代入公式( 6.16 )所得的 f(x) 是相等的,即在平均数 μ 的左方或右方,只要距离相等,其 f(x) 就相等,因此其分布是对称的。在正态分布下,算术平均数、中位数、众数三者合一位于 μ点上。
2 、 正态分布曲线有一个高峰。 随机变数 x 的取值范围为( - ∞, + ∞ ),在( - ∞ , μ )正态曲线随 x 的增大而上升,;当 x= μ 时, f(x) 最大;在( μ , + ∞ )曲线随 x 的增大而下降。
3 、正态曲线在︱x-μ︱=1 δ 处有拐点。曲线向左右两侧伸展,当 x →± ∞ 时, f(x) →0 ,但 f(x) 值恒不等于零,曲线是以 x 轴为渐进线,所以曲线全距从 -∞到 + ∞。
4 、正态曲线是由 μ 和 δ 两个参数来确定的,其中 μ确定曲线在 x 轴上的位置 [ 图 6-3] , δ 确定它的变异程度 [ 图 6-4] 。 μ 和 δ 不同时,就会有不同的曲线位置和变异程度。所以,正态分布曲线不只是一条曲线,而是一系列曲线。任何一条特定的正态曲线只有在其 μ 和 δ 确定以后才能确定。
5 、正态分布曲线是二项分布的极限曲线,二项分布的总概率等于 1 ,正态分布与 x 轴之间的总概率(所研究总体的全部变量出现的概率总和)或总面积也应该是等于 1 。
而变量 x 出现在任两个定值 x1到x2(x1≠x2)之间的概率,等于这两个定值之间的面积占总面积的成数或百分比。正态曲线的任何两个定值间的概率或面积,完全由曲线的 μ 和 δ 确定。常用的理论面积或概率如下:
区间 μ ± 1 δ 面积或概率 =0.6826
μ ± 2 δ μ ± 3 δ μ ± 1.960δ μ ±2.576 δ =0.9545
=0.9973
=0.9500
=0.9900
图 6-3 标准差相同( δ=1 )而平均数
图 6-4 平均数相同( μ =0 )而标准差
不同的三条正态曲线 不同的三条正态曲线
(三)正态分布的概率计算
正态分布是连续性变数的理论分布,计算其概率的原理和方法不同于二项分布。它不能计算变量取某一定值,即某一点时的概率,而只能计算变量落在某一区间内的概率(即概率密度)。
对于任何正态分布随机变量 x 落入任意区间( a , b )的概率可以表示为: P(a - ∞ 到 x 的面积,其式如下: F ( x ) = ( 6.18 ) F(x) 称为正态分布的累积函数。现如给变数任一定值,假如 x 等于 a ,那么,随机变数 xP ( x根据以上的方法,如果 a 、 b(aP(a 曲线的方程为: Φ( u ) = ( 6.21 ) Φ( u )称为标准正态分布的概率密度函数,随机变量 u 的分布称作标准的正态分布或 u 分布,记作为 N(0 , 1) 。 同理,对于标准正态分布,其累积函数为 F ( u ) = ( 6.22 ) 其表示在标准正态曲线下从 -∞ 到 u 之间的面积或概率。对于一个 u 值,例如等于 a ,标准正态分布的随机变量 u 落入到区间( -∞ , a )的概率可以通过上式求得。为了计算的方便,统计学家已根据 a 值的大小绘制了标准正态分布的累积分布函数数值表(附表 2 ),通过查表就可以获得( -∞ , a )的概率。 例 6-9 :设 u 服从标准正态分布 N ( 0 , 1 ),试求( 1 )随机变量 u 落入( 0 , 1.21 )区间的概率;( 2 ) 随机变量 u 落入( -1.96 , 1.96 )区间的概率;( 3 )随机变量 u 落入( -2.58 , 2.58 )区间的概率。 P ( 0P(-.96P(-2.58从上述计算结果可知:从 u 分布中随机抽取一个 u 值,它落入( -1.96 , 1.96 )内的概率为 95% ,落到区间外的概率为 5% ,而落到区间( -2.58,2.58 )外的概率更小,只有 1% 。这说明从 u 分布中随机抽取一个 u 值,它落入到( -1.96 , 1.96 )之外的可能性很小,是一个小概率事件。 对于具有平均数为 μ 、标准差为 δ 的一般正态分布,只要将它们转化为标准的正态 分布(即正态分布标准化),再查表,就很容易获得随机变量 x 落入在某个区间内的概率。 转换的方法很简单,首先将随机变量 x 标准化,(或者说将随机误差 化),令: 标准 u= ( 6.23 ) 即对 x 取其离均差值,再转换成以标准差为单位的量值 u 。此 u 值叫正态标准离差或简称正态离差。经过转换后,原遵从正态分布 N ( μ , δ2 ) 的随机变量 x 落在( a , b )区间内的概率,就等于遵从标准正态分布 N ( 0 , 1 )的随机变量 u 落在 ( , ) 区间内的概率。即: P ( a 因此,在求一般正态分布的概率时,只要将区间的上下限作适当的转换,亦同样查附表 2 即可求得概率。 例 6-10 : 假定 x ——随机变数具有正态分布,平均数 μ =30 ,标准差 δ =5 ,试计算 P ( x<26 ), P(26 P(x<26)=F(26)= F ((26-30)/5)= F (-0.8)=0.2119 P(26 P(x>40)=1-F(40)=1- =1- F (2.0)=1-0.97725=0.02275 因篇幅问题不能全部显示,请点此查看更多更全内容