您的当前位置:首页正文

概率论与数理统计第7章

2022-12-15 来源:步旅网
第7章 参数估计 •参数的点估计; •估计量的优良性准则 •区间估计 1 数理统计问题:如何选取样本, 如何根据样本来对总体的种种统计特征作出判断。 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计(paramentric estimation)。 参数估计的类型——点估计、区间估计 2 1

参数的估计量 设总体的分布函数为F(x,)(未知),X1,X2,…,Xn 为样本,构造一个统计量 (X1,X2,,Xn)来估计 参数,则称 (X1,X2,,Xn)为参数的一个估计量。 将样本观测值 x1,x2,,xn代入 (X1,X2,,Xn), 得到的值 (x1,x2,,xn)称为参数的一个估计值。 3 点估计(point estimation) :如果构造一个统计量 (X1,X2,,Xn)来作为参数的估计量,则称为 参数的点估计。 区间估计(interval estimation) :如果构造两个 统计量 ˆ1(X1,X2,,Xn),ˆ2(X1,X2,,Xn)而用 (ˆ1,ˆ2)来作为参数可能取值范围的估计,称为 参数的区间估计。 4 2

第1节 参数的点估计 •数字特征法 •矩估计法 •最大似然法 5 数字特征法 样本的数字特征法:以样本的数字特征作为相应总体 数字特征的估计量。 以样本均值 X作为总体均值 的点估计量 ˆX1nnXiˆx1nnxi点估计值 i1i1以样本方差 S2作为总体方差 2的点估计量 ˆ2S21n2n1(XiX)i1ˆ2s21n2n1(xix)点估计值 i16 3

例1 一批钢件的20个样品的屈服点(t/cm2)为 4.98 5.11 5.20 5.20 5.11 5.00 5.35 5.61 4.88 5.27 5.38 5.48 5.27 5.23 4.96 5.15 4.77 5.35 5.38 5.54 试估计该批钢件的平均屈服点及其方差。 解 由数字特征法,得屈服点的均值及方差的估计值为 ˆx12020xi5.21i1ˆ2s211920(xi5.21)20.049i17 矩估计法 定义 设 X为随机变量,若 E(Xk)存在,则称 E(Xk)为 X的 k阶原点矩,记作 akkE(Xk);若 E(XEX)存在,则称 E(XEX)k为 X的 k阶 中心矩,记作 bkE(XEX)k样本的 k阶原点矩,记作 A1nknXkii1样本的 k阶中心矩,记作 B1nk(XkniX)i18 4

参数的矩估计 矩法估计:用样本的矩作为总体矩的估计量,即 kA1nXk1naki,bkBk(XiX)kni1nn1若总体X的分布函数中含有m个参数1, 2, …, m, 总体的k阶矩Vk或Uk存在,k=1,2,…,m,则 ak(1nk1,2,,m)nXi(k1,2,,m)i1bk(1n1,2,,m)n(XiX)k(k1,2,,m)i19 参数的矩法估计 矩估计:用样本的矩作为总体矩的估计量,即 ak(1nk1,2,,m)nXi(k1,2,,m)i1bk(1n1,2,,m)n(XiX)k(k1,2,,m)i1得m个方程构成方程组,解得的 ˆ1,ˆ2,,ˆm即为参数 1,2,,m的矩估计量,代入样本观测值,即得参数 的矩估计值。 10 5

例2 设某总体X的数学期望为EX=,方差DX=2,X1, X2,…,Xn为样本,试求和2的矩估计量。 解 总体的一阶二阶阶原点矩为 a1a2222E(X)DXEX2样本的一阶二阶原点矩为 A1XA1n22nXii1由矩法估计,应有 X1nnX2i22i1所以 ˆXˆ2121nnnX2iX1(XiX)2ini111 结论:不管总体X服从何种分布,总体期望和方差 的矩估计量分别为样本均值、样本的二阶中心矩,即 ˆX1nnXii1ˆ21n(X2niX)2Sni1估计值为 ˆx1nnxiˆ21ni1n(xix)2i112 6

例3 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。 (1) X~N,2 (2)X~BN,p(N已知)(3)X~P()解 (1)由于 EX DX2所以参数和2的矩估计量为 ˆXˆ21nn(XiX)2i1(2)由于 EXNp所以 NpX得参数p的矩估计量为 pˆ1NX13 例3 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。 (1) X~N,2 (2)X~BN,p(N已知)(3)X~P()解 (3)由于 EXDX所以参数的矩估计量为 X1nnXi或 1i1nn(XiX)2i1一阶矩 二阶中心矩 可见:同一个参数的矩估计量可以不同,所以估计量 存在“优、劣”之分。 14 7

例4 设总体X服从[1, 2]上的均匀分布, 1<2,求 1, 2的矩估计量, X1,X2,…,Xn为X的一个样本。 解 由于 EX12(21)22,DX12所以由矩法估计,得 X12S2()22n2112解得 ˆ1X3Snˆ2X3Sn区间长度的矩估计量为 ˆ2ˆ123Sn15 例5 对容量为n的子样,求下列密度函数中参数 a的 矩估计量。 f(x)2a2(ax), (0xa) 0, 其它解 由于 EXa0x2a2(ax)dxa3所以由矩法估计,得 Xa3解得 a3X3nnXii1所以,参数 a的矩估计量为 a3nnXii116 8

最大似然法 思想:设总体X的密度函数为f(x,),为未知参数,则 样本(X1,X2,…,Xn)的联合密度函数为 nf(x1,x2,,xn,)f(xi,)i1令 nL()f(x1,x2,,xn,)f(xi,)i1参数的估计量 ˆ,使得样本(X1,X2,…,Xn)落在观测 值 (x1,x2,,xn)的邻域内的概率L()达到最大,即 L(x1,x2,,xn,ˆ)maxL(x1,x2,,xn,)则称 ˆ为参数的最大似然估计值。 17 参数的最大似然估计 求解方法: (1)构造似然函数 L()f(x1,x2,,xn,n)f(xi,)(2)取自然对数 ni1lnL(x1,x2,,xn,)lnf(xi,)(3)令 dlnLi1d0其解 ˆ即为参数的最大似然估计。 若总体的密度函数中有多个参数1,2,…,n,则将 第(3)步改为lnL 0,(i1,2,,n)解方程组即可。i对于离散总体,将密度函数换成分布律即可。 18 9

例6 假设(X1,X2,…,Xn)是取自正态总体N(,2) 的样本,求和2的最大似然估计量。 解 构造似然函数 nL1e(xi)222i12n(x)2取对数 lnLln1ei222i1n(xi)2ln2lni12219 求偏导数,并令其为0 nlnLn2(x(xii)(1))i11220i2lnLn2(xi)21i12222120解得 1n2nxix1inn(xx)21ii1所以μ,2的最大似然估计量为 ˆ1nnXiXˆ21n与矩估计量 i1n(XiX)2i1 相同 20 10

第2节 估计量的优良性准则 ——无偏性、有效性 无偏估计量:设 是 的估计量,如果 E(),则称 是 的无偏估计量(unbiased estimation) 无偏性的意义在于,用无偏估计去估计未知参数时,虽然存在随机性,但是其平均值等于未知参数. 21 例题 设总体的数学期望EX和方差DX都存在, 证明:样本均值 X、样本方差 S21n分别是EX、DX的无偏估计。 n1(XiX)2i1证明 E(S2)1n2n1E(XiX)i1n2n1E1nn(X2n1n2iX)n1EnXiXi1i1n1n2n1nE(X2i)EXi1nn[DX(EX)2]n1nDX(EX)222 11

1nE(S2)n1E(X2iX)i1nn[DX(EX)2]n1nDX(EX)2nn[DX(EX)2]DX2n1nn(EX)DXE1nnn(XX)2i11inDX23 有 效 性 设 1和 2是 的两个无偏估计量,如果 D(ˆ)D(ˆ)则称估计量 ˆ121比 ˆ2有效. 若在 的所有无偏估计类中, 的方差达到最小,则称 是 的一致最小方差无偏估计. 24 12

nn例如 X及 aiXi(其中 i1ai1)都是EX的无偏 ni1估计,但 X比 aiXi有效。 i1因为 EXEX2EXEX2DXDXn2nnn2EaXiiEXEaiXiEi1i1aiXii1Dnan2niXii1aiD(Xi)D(X)i1a2ii11nnD(X)na21n2iD(X)i1nai1D(X)i1n25 小结 参数估计的点估计方法 数字特征法:以样本均值、方差作为总体期望、方差 的估计量。 ˆX1nˆ2S21n2nXii1n1(XiX)i1矩估计法:以样本k阶矩作为总体k阶矩的估计量。 Vˆn(,,,)1Xkk12mni(k1,2,,m)i1Uˆk(1,2,,m)1nn(XiX)k(k1,2,,m)i1最大似然估计 26 13

课后练习 习题7 1--7 作业 3, 6 27 第3节 区间估计 本节主要研究正态总体的均值和方差的区间估计. •方差已知,对均值的区间估计 •方差未知,对均值的区间估计 •均值已知,对方差的区间估计 •均值未知,对方差的区间估计 28 14

区间估计的思想 点估计总是有误差的,但没有衡量偏差程度的量, 区间估计则是按一定的可靠性程度对待估参数给出一个 区间范围。 引例 设某厂生产的灯泡使用寿命X~N(,1002),现 随机抽取5只,测量其寿命如下:1455,1502,1370, 1610,1430,则该厂灯泡的平均使用寿命的点估计值为 x15145515021370161014301473.429 可以认为该种灯泡的使用寿命在1473.4个单位时间左右,但范围有多大呢?又有多大的可能性在这“左右”呢? 如果要求有95%的把握断言在1473.4左右,则由U统计 量可知 UXn~N0,1由 PXn0.950.975查表得 1.96X1.96nX1.96n30 15

置信水平、置信区间 设总体X的分布函数 F(x;)中含有一个未知参数, X1,X2,,Xn为来自X的样本。若能构造两个统计量 1(X1,X2,,Xn)和 2(X1,X2,,Xn)使得对给定的 足够小的值(0< <1,通常取=0.05,0.01,0.1 ), 满足 P{12}1则称区间[1,2 ]为参数的置信度(或置信水平)为 1- 的置信区间,  为显著性水平。 1——置信下限 2——置信上限 31 几点说明 1、参数的置信水平为1-的置信区间( 1, 2) 表示该区间有100(1-)%的可能性包含总体参 数的真值。 2、不同的置信水平,参数的置信区间不同。 3、置信区间越小,估计越精确,但置信水平会降低; 相反,置信水平越大,估计越可靠,但精确度会降 低,置信区间会较长。一般:对于固定的样本容量, 不能同时做到精确度高(置信区间小),可靠程度也 高(1- 大)。如果不降低可靠性,而要缩小估计范 围,则必须增大样本容量n,增加抽样成本。 32 16

一.正态总体均值的区间估计 1.正态总体方差已知,对均值的区间估计 如果总体X~N(,2),其中2已知, 未知, 则构造 UX/n~N(0,1),对做区间估计。 对给定的置信水平1-,由 PUu1确定临界值(X的双侧分位数) 233 Uu X u2n 2  u Xu 2n2n  Xu Xu 2n2n得的置信区间 Xu , Xu2n2n将观测值 x1,x2,,xn代入,则可得具体的区间。 34 17

例1 某车间生产滚珠,从长期实践中知道,滚珠直径X 可以认为服从正态分布,从某天的产品中随机抽取6个, 测得直径为(单位:cm) 14.6,15.1,14.9,14.8,15.2,15.1 (1)试求该天产品的平均直径EX的点估计; (2)若已知方差为0.06,试求该天平均直径EX的置信 区间:=0.05;=0.01。 解 (1)由矩法估计得EX的点估计值为 EXx1614.615.114.914.815.215.114.9535 (2)由题设知X~N(,0.06) 构造 U ,得EX的置信区间为 Xu2n,Xu2n而 x14.95,0.06n60.1当=0.05时,u 0.0251.96所以,EX的置信区间为[14.754,15.146] 当=0.01时,u 0.0052.575所以,EX的置信区间为[14.693,15.208] 置信水平提高,置信区间扩大,估计精确度降低。36 18

例2 假定某地一旅游者的消费额X服从正态分布 N(,2),且标准差=12元,今要对该地旅游者的平 均消费额EX加以估计,为了能以95%的置信度相信这种 估计误差小于2元,问至少要调查多少人? 解 由题意知:消费额X~N(,122),设要调查n人。 由 10.95得 0.05查表得 u21.96即 PX1.96n0.95而 X21.962n2解得 n1.96122138.3至少要调查139人 37 2.正态总体方差未知,对均值的区间估计 如果总体X~N(,2),其中,均未知 由 XXSn~t(n1)构造随机变量T, TSn当置信水平为1-时,由 PTt2(n1)1查t-分布表确定 t2(n1)从而得的置信水平为1-的置信区间为 SXnt2(n1),XSnt(n1)238 19

例3 某厂生产的一种塑料口杯的重量X被认为服从正态 分布,今随机抽取9个,测得其重量为(单位:克): 21.1,21.3,21.4,21.5,21.3,21.7,21.4,21.3, 21.6。试用95%的置信度估计全部口杯的平均重量。 解 由题设可知:口杯的重量X~N(,2) 由抽取的9个样本,可得 s0.18x21.4n9由 10.95得 0.05查表得 t0.025(8)2.306tS0.182(8)n2.30690.1384全部口杯的平均重量的置信区间为[21.26,21.54] 39 例4 旅行社随机访问了25名旅游者,得知平均消费额 x80样本标准差 s12.已知旅游者消费额 服从正态分布,那么该地旅游者平均消费额 的95%置信区间是什么? 解 由题设可知:平均消费额X~N(,2) S12 x80 n2540 20

由 10.95得 0.05查表得 t0.025(24)2.064t(24)Sn2.064122254.9536平均消费额的置信区间为[75.0464,84.9536] 估计误差为 24.95369.90722 2与例2结果相比 精确度降低 ——原因:1.样本容量减少 ,2.用S2代替2 实际应用中,方差未知的均值的区间估计较有应用价值。41 例5 假设某片居民每月对某种商品的需求量X服从正态 分布,经调查100家住户,得出每户每月平均需求量为 10公斤,方差为9,如果某商店供应10000户,试就居民 对该种商品的平均需求量进行区间估计(=0.01),并 依此考虑最少要准备多少这种商品才能以99%的概率满 足需求? 解 由题设可知:平均需求量X~N(,2) S29 x10 n100由 0.01查表得 t0.005(99)u0.0052.575tS32(99)n2.5751000.773平均需求量的99%的置信区间为[9.227,10.773] 42 21

要以99%的概率满足10000户居民对该种商品的需求,则最少要准备的量为 10.77310000107730(公斤) 43 二.正态总体方差的区间估计 1.正态总体均值已知,对方差的区间估计 如果总体X~N(,2),其中已知,2未知 由 Xi~N(0,1)构造随机变量 2 nX2ni2i1Xi2i122~(n)对给定的置信水平1-,由 44 22

nPX2i1221(n)i2(n)122查2- 分布表,确定双侧分位数 212(n),22(n)从而得2的置信水平为1-的置信区间为 nXnX2i2ii1i12,2(n)212(n)45 例6 已知某种果树产量服从N(218,2),随机 抽取6棵计算其产量为(单位:公斤) 221,191,202,205,256,236 试以95%的置信水平估计产量的方差。 6解 计算 x2i2931i1查表 2210.052(6)1.237,0.052(6)14.449果树方差的置信区间为 293114.449,29311.237202.851,2369.44246 23

2.正态总体均值未知,对方差的区间估计 如果总体X~N(,2),其中2未知 由 (n1)S222~(n1)构造随机变量 2 2(n1)S22当置信水平为1-时, 2P2(n1)S212(n1)22(n1)147 P2(n1)S22212(n1)2(n1)1查2- 分布表,确定双侧分位数 22(n1) , 212(n1)从而得2的置信水平为1-的置信区间为 (n1)S2(n1)S222(n1) ,2(n1)1248 24

例7 设某灯泡的寿命X~N(,2), ,2未知,现 从中任取5个灯泡进行寿命试验,得数据10.5,11.0, 11.2,12.5,12.8(单位:千小时),求置信水平为 90%的2的区间估计。 解 样本方差及均值分别为 S20.995x11.6由 10.9得 0.1查表得 2210.05(4)0.7110.05(4)9.488(n1)S240.995(n1)S220.7115.5980.41910.0520.052的置信区间为[0.419,5.598] 49 小 结 总体服从正态分布的均值或方差的区间估计 假设置信水平为1- (1)方差已知,对均值的区间估计 构造随机变量U,反查标准正态分布表, 确定U的双侧分位数 u2得EX的区间估计为 Xu2n,Xu2n50 25

总体服从正态分布的均值或方差的区间估计 假设置信水平为1- (2)方差未知,对均值的区间估计 构造随机变量T,查t-分布临界值表, 确定T的双侧分位数 t2(n1)得EX的区间估计为 XSnt2(n1),XSnt2(n1)51 总体服从正态分布的均值或方差的区间估计 假设置信水平为1- (3)均值已知,对方差的区间估计 构造随机变量2,查2-分布临界值表, 确定2的双侧分位数 212(n),22(n)得2的区间估计为 nX2iinX2i1i12),22(n12(n)52 26

总体服从正态分布的均值或方差的区间估计 假设置信水平为1- (4)均值未知,对方差的区间估计 构造随机变量 2,查2-分布临界值表, 确定2的双侧分位数 212(n1),22(n1)得2的区间估计为 2(n1)S2(n1)S2,2(n1)21)12(n53 课后练习 习题7 8--13 作业 9, 11 54 27

本章作业 3, 6, 9, 11 下节课交作业,请同学们做好作业,下次课不要忘了带过来 55 28

因篇幅问题不能全部显示,请点此查看更多更全内容