概率论与数理统计第7章

2022-12-15 来源：步旅网

第7章参数估计 •参数的点估计; •估计量的优良性准则 •区间估计 1 数理统计问题：如何选取样本, 如何根据样本来对总体的种种统计特征作出判断。参数估计问题：知道随机变量（总体）的分布类型，但确切的形式不知道，根据样本来估计总体的参数，这类问题称为参数估计（paramentric estimation）。参数估计的类型——点估计、区间估计 2 1

参数的估计量设总体的分布函数为F(x,)（未知），X1，X2，…，Xn 为样本，构造一个统计量 (X1,X2,,Xn)来估计参数，则称 (X1,X2,,Xn)为参数的一个估计量。将样本观测值 x1,x2,,xn代入 (X1,X2,,Xn)，得到的值 (x1,x2,,xn)称为参数的一个估计值。 3 点估计（point estimation) ：如果构造一个统计量 (X1,X2,,Xn)来作为参数的估计量，则称为参数的点估计。区间估计（interval estimation）：如果构造两个统计量 ˆ1(X1,X2,,Xn),ˆ2(X1,X2,,Xn)而用 (ˆ1,ˆ2)来作为参数可能取值范围的估计，称为参数的区间估计。 4 2

第1节参数的点估计 •数字特征法 •矩估计法 •最大似然法 5 数字特征法样本的数字特征法：以样本的数字特征作为相应总体数字特征的估计量。以样本均值 X作为总体均值 的点估计量 ˆX1nnXiˆx1nnxi点估计值 i1i1以样本方差 S2作为总体方差 2的点估计量 ˆ2S21n2n1(XiX)i1ˆ2s21n2n1(xix)点估计值 i16 3

例1 一批钢件的20个样品的屈服点（t/cm2）为 4.98 5.11 5.20 5.20 5.11 5.00 5.35 5.61 4.88 5.27 5.38 5.48 5.27 5.23 4.96 5.15 4.77 5.35 5.38 5.54 试估计该批钢件的平均屈服点及其方差。解由数字特征法，得屈服点的均值及方差的估计值为 ˆx12020xi5.21i1ˆ2s211920(xi5.21)20.049i17 矩估计法定义设 X为随机变量，若 E(Xk)存在，则称 E(Xk)为 X的 k阶原点矩，记作 akkE(Xk)；若 E(XEX)存在，则称 E(XEX)k为 X的 k阶中心矩，记作 bkE(XEX)k样本的 k阶原点矩，记作 A1nknXkii1样本的 k阶中心矩，记作 B1nk(XkniX)i18 4

参数的矩估计矩法估计：用样本的矩作为总体矩的估计量，即 kA1nXk1naki,bkBk(XiX)kni1nn1若总体X的分布函数中含有m个参数1， 2， …， m，总体的k阶矩Vk或Uk存在，k=1,2,…,m,则 ak(1nk1,2,,m)nXi(k1,2,,m)i1bk(1n1,2,,m)n(XiX)k(k1,2,,m)i19 参数的矩法估计矩估计：用样本的矩作为总体矩的估计量，即 ak(1nk1,2,,m)nXi(k1,2,,m)i1bk(1n1,2,,m)n(XiX)k(k1,2,,m)i1得m个方程构成方程组，解得的 ˆ1,ˆ2,,ˆm即为参数 1,2,,m的矩估计量，代入样本观测值，即得参数的矩估计值。 10 5

例2 设某总体X的数学期望为EX=，方差DX=2，X1， X2，…，Xn为样本，试求和2的矩估计量。解总体的一阶二阶阶原点矩为 a1a2222E(X)DXEX2样本的一阶二阶原点矩为 A1XA1n22nXii1由矩法估计，应有 X1nnX2i22i1所以 ˆXˆ2121nnnX2iX1(XiX)2ini111 结论：不管总体X服从何种分布，总体期望和方差的矩估计量分别为样本均值、样本的二阶中心矩，即 ˆX1nnXii1ˆ21n(X2niX)2Sni1估计值为 ˆx1nnxiˆ21ni1n(xix)2i112 6

例3 设X1，X2，…，Xn为总体X的样本，试求下列总体分布参数的矩估计量。 (1) X~N,2 (2)X~BN,p(N已知）(3）X~P()解（1）由于 EX DX2所以参数和2的矩估计量为 ˆXˆ21nn(XiX)2i1（2）由于 EXNp所以 NpX得参数p的矩估计量为 pˆ1NX13 例3 设X1，X2，…，Xn为总体X的样本，试求下列总体分布参数的矩估计量。 (1) X~N,2 (2)X~BN,p(N已知）(3）X~P()解（3）由于 EXDX所以参数的矩估计量为 X1nnXi或 1i1nn(XiX)2i1一阶矩二阶中心矩可见：同一个参数的矩估计量可以不同，所以估计量存在“优、劣”之分。 14 7

例4 设总体X服从[1， 2]上的均匀分布， 1<2，求 1， 2的矩估计量， X1，X2，…，Xn为X的一个样本。解由于 EX12(21)22,DX12所以由矩法估计，得 X12S2()22n2112解得 ˆ1X3Snˆ2X3Sn区间长度的矩估计量为 ˆ2ˆ123Sn15 例5 对容量为n的子样，求下列密度函数中参数 a的矩估计量。 f(x)2a2(ax), (0xa) 0, 其它解由于 EXa0x2a2(ax)dxa3所以由矩法估计，得 Xa3解得 a3X3nnXii1所以，参数 a的矩估计量为 a3nnXii116 8

最大似然法思想：设总体X的密度函数为f(x,)，为未知参数，则样本（X1,X2,…,Xn）的联合密度函数为 nf(x1,x2,,xn,)f(xi,)i1令 nL()f(x1,x2,,xn,)f(xi,)i1参数的估计量 ˆ，使得样本（X1,X2,…,Xn）落在观测值 (x1,x2,,xn)的邻域内的概率L()达到最大，即 L(x1,x2,,xn,ˆ)maxL(x1,x2,,xn,)则称 ˆ为参数的最大似然估计值。 17 参数的最大似然估计求解方法：（1）构造似然函数 L()f(x1,x2,,xn,n)f(xi,)（2）取自然对数 ni1lnL(x1,x2,,xn,)lnf(xi,)（3）令 dlnLi1d0其解 ˆ即为参数的最大似然估计。若总体的密度函数中有多个参数1，2，…，n，则将第（3）步改为lnL 0,(i1,2,,n)解方程组即可。i对于离散总体，将密度函数换成分布律即可。 18 9

例6 假设（X1，X2，…，Xn）是取自正态总体N(,2) 的样本，求和2的最大似然估计量。解构造似然函数 nL1e(xi)222i12n(x)2取对数 lnLln1ei222i1n(xi)2ln2lni12219 求偏导数，并令其为0 nlnLn2(x(xii)(1))i11220i2lnLn2(xi)21i12222120解得 1n2nxix1inn(xx)21ii1所以μ，2的最大似然估计量为 ˆ1nnXiXˆ21n与矩估计量 i1n(XiX)2i1 相同 20 10

第2节估计量的优良性准则 ——无偏性、有效性无偏估计量：设 是 的估计量，如果 E(),则称 是 的无偏估计量（unbiased estimation）无偏性的意义在于，用无偏估计去估计未知参数时，虽然存在随机性，但是其平均值等于未知参数. 21 例题设总体的数学期望EX和方差DX都存在，证明：样本均值 X、样本方差 S21n分别是EX、DX的无偏估计。 n1(XiX)2i1证明 E(S2)1n2n1E(XiX)i1n2n1E1nn(X2n1n2iX)n1EnXiXi1i1n1n2n1nE(X2i)EXi1nn[DX(EX)2]n1nDX(EX)222 11

1nE(S2)n1E(X2iX)i1nn[DX(EX)2]n1nDX(EX)2nn[DX(EX)2]DX2n1nn(EX)DXE1nnn(XX)2i11inDX23 有效性设 1和 2是 的两个无偏估计量，如果 D(ˆ)D(ˆ)则称估计量 ˆ121比 ˆ2有效. 若在 的所有无偏估计类中， 的方差达到最小，则称 是 的一致最小方差无偏估计. 24 12

nn例如 X及 aiXi（其中 i1ai1）都是EX的无偏 ni1估计，但 X比 aiXi有效。 i1因为 EXEX2EXEX2DXDXn2nnn2EaXiiEXEaiXiEi1i1aiXii1Dnan2niXii1aiD(Xi)D(X)i1a2ii11nnD(X)na21n2iD(X)i1nai1D(X)i1n25 小结参数估计的点估计方法数字特征法：以样本均值、方差作为总体期望、方差的估计量。 ˆX1nˆ2S21n2nXii1n1(XiX)i1矩估计法：以样本k阶矩作为总体k阶矩的估计量。 Vˆn(,,,)1Xkk12mni(k1,2,,m)i1Uˆk(1,2,,m)1nn(XiX)k(k1,2,,m)i1最大似然估计 26 13

课后练习习题7 1--7 作业 3, 6 27 第3节区间估计本节主要研究正态总体的均值和方差的区间估计. •方差已知,对均值的区间估计 •方差未知,对均值的区间估计 •均值已知,对方差的区间估计 •均值未知,对方差的区间估计 28 14

区间估计的思想点估计总是有误差的，但没有衡量偏差程度的量，区间估计则是按一定的可靠性程度对待估参数给出一个区间范围。引例设某厂生产的灯泡使用寿命X~N（，1002），现随机抽取5只，测量其寿命如下：1455，1502，1370， 1610，1430，则该厂灯泡的平均使用寿命的点估计值为 x15145515021370161014301473.429 可以认为该种灯泡的使用寿命在1473.4个单位时间左右，但范围有多大呢？又有多大的可能性在这“左右”呢？如果要求有95%的把握断言在1473.4左右，则由U统计量可知 UXn~N0,1由 PXn0.950.975查表得 1.96X1.96nX1.96n30 15

置信水平、置信区间设总体X的分布函数 F(x;)中含有一个未知参数， X1,X2,,Xn为来自X的样本。若能构造两个统计量 1(X1,X2,,Xn)和 2(X1,X2,,Xn)使得对给定的足够小的值（0< <1,通常取＝0.05，0.01，0.1 ），满足 P{12}1则称区间[1，2 ]为参数的置信度（或置信水平）为 1- 的置信区间，  为显著性水平。 1——置信下限 2——置信上限 31 几点说明 1、参数的置信水平为1-的置信区间（ 1， 2）表示该区间有100（1-）%的可能性包含总体参数的真值。 2、不同的置信水平，参数的置信区间不同。 3、置信区间越小，估计越精确，但置信水平会降低；相反，置信水平越大，估计越可靠，但精确度会降低，置信区间会较长。一般：对于固定的样本容量，不能同时做到精确度高（置信区间小），可靠程度也高（1- 大）。如果不降低可靠性，而要缩小估计范围，则必须增大样本容量n，增加抽样成本。 32 16

一.正态总体均值的区间估计 1.正态总体方差已知，对均值的区间估计如果总体X~N（，2），其中2已知， 未知，则构造 UX/n~N(0,1)，对做区间估计。对给定的置信水平1-，由 PUu1确定临界值（X的双侧分位数） 233 Uu X u2n 2  u Xu 2n2n  Xu Xu 2n2n得的置信区间 Xu , Xu2n2n将观测值 x1,x2,,xn代入，则可得具体的区间。 34 17

例1 某车间生产滚珠，从长期实践中知道，滚珠直径X 可以认为服从正态分布，从某天的产品中随机抽取6个，测得直径为（单位：cm） 14.6，15.1，14.9，14.8，15.2，15.1 （1）试求该天产品的平均直径EX的点估计；（2）若已知方差为0.06，试求该天平均直径EX的置信区间：=0.05；=0.01。解（1）由矩法估计得EX的点估计值为 EXx1614.615.114.914.815.215.114.9535 （2）由题设知X~N（，0.06）构造 U ，得EX的置信区间为 Xu2n,Xu2n而 x14.95,0.06n60.1当=0.05时，u 0.0251.96所以，EX的置信区间为[14.754，15.146] 当=0.01时，u 0.0052.575所以，EX的置信区间为[14.693，15.208] 置信水平提高，置信区间扩大，估计精确度降低。36 18

例2 假定某地一旅游者的消费额X服从正态分布 N（，2），且标准差=12元，今要对该地旅游者的平均消费额EX加以估计，为了能以95%的置信度相信这种估计误差小于2元，问至少要调查多少人？解由题意知：消费额X~N（，122），设要调查n人。由 10.95得 0.05查表得 u21.96即 PX1.96n0.95而 X21.962n2解得 n1.96122138.3至少要调查139人 37 2.正态总体方差未知，对均值的区间估计如果总体X~N（，2），其中，均未知由 XXSn~t(n1)构造随机变量T， TSn当置信水平为1-时，由 PTt2(n1)1查t-分布表确定 t2(n1)从而得的置信水平为1-的置信区间为 SXnt2(n1),XSnt(n1)238 19

例3 某厂生产的一种塑料口杯的重量X被认为服从正态分布，今随机抽取9个，测得其重量为（单位：克）： 21.1，21.3，21.4，21.5，21.3，21.7，21.4，21.3， 21.6。试用95%的置信度估计全部口杯的平均重量。解由题设可知：口杯的重量X~N（，2）由抽取的9个样本，可得 s0.18x21.4n9由 10.95得 0.05查表得 t0.025(8)2.306tS0.182(8)n2.30690.1384全部口杯的平均重量的置信区间为[21.26，21.54] 39 例4 旅行社随机访问了25名旅游者,得知平均消费额 x80样本标准差 s12.已知旅游者消费额服从正态分布,那么该地旅游者平均消费额 的95%置信区间是什么? 解由题设可知：平均消费额X~N（，2） S12 x80 n2540 20

由 10.95得 0.05查表得 t0.025(24)2.064t(24)Sn2.064122254.9536平均消费额的置信区间为[75.0464，84.9536] 估计误差为 24.95369.90722 2与例2结果相比精确度降低 ——原因：1.样本容量减少 ,2.用S2代替2 实际应用中，方差未知的均值的区间估计较有应用价值。41 例5 假设某片居民每月对某种商品的需求量X服从正态分布，经调查100家住户，得出每户每月平均需求量为 10公斤，方差为9，如果某商店供应10000户，试就居民对该种商品的平均需求量进行区间估计（=0.01），并依此考虑最少要准备多少这种商品才能以99%的概率满足需求？解由题设可知：平均需求量X~N（，2） S29 x10 n100由 0.01查表得 t0.005(99)u0.0052.575tS32(99)n2.5751000.773平均需求量的99%的置信区间为[9.227，10.773] 42 21

要以99%的概率满足10000户居民对该种商品的需求，则最少要准备的量为 10.77310000107730（公斤） 43 二.正态总体方差的区间估计 1.正态总体均值已知，对方差的区间估计如果总体X~N（，2），其中已知，2未知由 Xi~N(0,1)构造随机变量 2 nX2ni2i1Xi2i122~(n)对给定的置信水平1-，由 44 22

nPX2i1221(n)i2(n)122查2- 分布表，确定双侧分位数 212(n),22(n)从而得2的置信水平为1-的置信区间为 nXnX2i2ii1i12,2(n)212(n)45 例6 已知某种果树产量服从Ｎ（218，2），随机抽取6棵计算其产量为（单位：公斤） 221，191，202，205，256，236 试以95%的置信水平估计产量的方差。 6解计算 x2i2931i1查表 2210.052(6)1.237,0.052(6)14.449果树方差的置信区间为 293114.449,29311.237202.851,2369.44246 23

2.正态总体均值未知，对方差的区间估计如果总体X~N（，2），其中2未知由 (n1)S222~(n1)构造随机变量 2 2(n1)S22当置信水平为1-时， 2P2(n1)S212(n1)22(n1)147 P2(n1)S22212(n1)2(n1)1查2- 分布表，确定双侧分位数 22(n1) , 212(n1)从而得2的置信水平为1-的置信区间为 (n1)S2(n1)S222(n1) ,2(n1)1248 24

例7 设某灯泡的寿命X~N（，2）， ，2未知，现从中任取5个灯泡进行寿命试验，得数据10.5，11.0， 11.2，12.5，12.8（单位：千小时），求置信水平为 90%的2的区间估计。解样本方差及均值分别为 S20.995x11.6由 10.9得 0.1查表得 2210.05(4)0.7110.05(4)9.488(n1)S240.995(n1)S220.7115.5980.41910.0520.052的置信区间为[0.419，5.598] 49 小结总体服从正态分布的均值或方差的区间估计假设置信水平为1- （1）方差已知，对均值的区间估计构造随机变量U，反查标准正态分布表，确定U的双侧分位数 u2得EX的区间估计为 Xu2n,Xu2n50 25

总体服从正态分布的均值或方差的区间估计假设置信水平为1- （2）方差未知，对均值的区间估计构造随机变量T，查t-分布临界值表，确定T的双侧分位数 t2(n1)得EX的区间估计为 XSnt2(n1),XSnt2(n1)51 总体服从正态分布的均值或方差的区间估计假设置信水平为1- （3）均值已知，对方差的区间估计构造随机变量2，查2-分布临界值表，确定2的双侧分位数 212(n),22(n)得2的区间估计为 nX2iinX2i1i12),22(n12(n)52 26

总体服从正态分布的均值或方差的区间估计假设置信水平为1- （4）均值未知，对方差的区间估计构造随机变量 2，查2-分布临界值表，确定2的双侧分位数 212(n1),22(n1)得2的区间估计为 2(n1)S2(n1)S2,2(n1)21)12(n53 课后练习习题7 8--13 作业 9, 11 54 27

本章作业 3, 6, 9, 11 下节课交作业，请同学们做好作业，下次课不要忘了带过来 55 28

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

概率论与数理统计第7章