您的当前位置:首页正文

医药数理统计习题答案

2022-04-10 来源:步旅网
第一章 数据的描述和整理

一、学习目的和要求

1. 掌握数据的类型及特性;

2. 掌握定性和定量数据的整理步骤、显示方法;

3. 掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量; 4. 能理解并熟练掌握样本均值、样本方差的计算; 5. 了解统计图形和统计表的表示及意义;

6. 了解用软件进行统计作图、频数分布表及直方图生成、统计量的计算。

二、 内容提要

(一) 数据的分类

定性数据(品质数据) 数据类型 定类数据 (计数数据) 表现形式 类别 (无序) 定类变量 定序数据 (等级数据) 类别 (有序) 定序变量 定量数据 数值数据 (计量数据) 数值 (+-×÷) 数值变量 (离散变量、连续变量) 对应变量 主要统计方法 计算各组频数,进行列计算各种统计量,进行参联表分析、参数方法 2检验等非数估计和检验、回归分析、方差分析等参数方法 常用统计图条形图,圆形图(饼图) 直方图,折线图,散点图, 1 / 137

茎叶图,箱形图 (二) 常用统计量

1、描述集中趋势的统计量 名 称 公 式(原始数据) 公 式(分组数据) 意 义 反映数据取值的平均值 x 均水平,是描述数据分布集中趋势的最主要测度值, 中位数 当n为奇数xn1,()2 Me1(xnxn),当n为偶数(1)22(2)中位数所在是典型的位置平均组: 数,不受极端值的影 累积频数超过响 2的那个最低 组 众数 数据中出现次数最多的观众数所在组: 察值 测度定性数据集中 频数最大的组 趋势,对于定量数据意义不大 2、描述离散程度的统计量 名 称 极差 公 式(原始数据) 公 式(分组数据) 意 义 R = 最大值-最小值 R≈最高组上限反映离散程度的最简单测值-最低组下限度值,不能反映中间数据R 2 / 137

值 总体方差 2的离散性 反映每个总体数据偏离其总体均值的平均程度,是 离散程度的最重要测度值, 其中标准差具有及观察值数据相同的量纲 总体标准差 样本方差 1kS(mix)2fin1i12反映每个样本数据偏离其样本均值的平均程度,是离散程度的最重要测度S2 SS21k(mix)2fin1i1 样本标准差S 值, 其中标准差具有及观察值数据相同的量纲 变异系数 反映数据偏离其均值的相对偏差,是无量纲的相对变异性测度 反映样本均值偏离总体均 样本标准误Sx 值的平均程度,在用样本均值估计总体均值时测度偏差 3、描述分布形状的统计量

名 称 公 式(原始数据) 公 式(分组数据) 偏度 意 义 反映数据分布的非对 3 / 137

称性 0时为对称; >0时为正偏或右偏; <0时为负偏或左偏 Kun(n1)(xix)43[(xix)2]2(n1)(n1)(n2)(n3)S4 反映数据分布的平峰或尖峰程度 0时为标准正态; >0时为尖峰分布; <0时为扁平分布 峰度 (原始数据) Ku (mi1kix)4finS43(分组数据) * 在分组数据公式中,, 分别为各组的组中值和观察值出现的频数。

三、综合例题解析

例1.证明:各数据观察值及其均值之差的平方和(称为离差平方和)最小,即对任意常数C,有

(xi1nix)(xiC)2

2i1n证一:设 由函数极值的求法,对上式求导数,得

f(C)2(xiC)2xi2nC, f(C)2n

i1i1nn令 f (C)=0,得唯一驻点

由于f(x)2n0,故当Cx时f (C)y有最小值,其最小值为

4 / 137

证二:因为对任意常数C有

(xi1nix)(xiC)xnx(x2CxinC2)222i22ii1i1i1i12nnnnnnx2CxinC2n(x22CxC2)i1

n(xC)202故有 (xix)(xiC)。

2i1i1nn

四、习题一解答

1.在某药合成过程中,测得的转化率(%)如下:

94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;

(3)根据频数分布表的分组数据,计算样本均值和样本标准差。 解:(1)所求频数分布表:

转化率的频数分布表

转化率分

组 90.5~ 91.0~ 91.5~ 92.0~

1 0 3 11

0.025 0.00 0.075 0.275

0.025 0.025 0.10 0.375

频数

频率 累积频率

5 / 137

92.5~ 93.0~ 93.5~ 94.0~94.5

9 7 7 2

0.225 0.175 0.175 0.05

0.60 0.775 0.95 1.00

(2)频数直方图:

直方图12108642010转化率32频数1197790.5-91.0-91.5-92.0-92.5-93.0-93.5-94.0-94.5-

频率折线图:

频率0.30.250.20.150.10.0509090.59191.59292.59393.59494.595转化率频率折线图转化率

(3)由频数分布表可得

转化率分组中值 频数 6 / 137

组 90.5~ 91.0~ 91.5~ 92.0~ 92.5~ 93.0~ 93.5~ 94.0~94.5

1890.75191.25094.252371392.825 则 xmifini1404018S(mix)2fi n1i1290.75 91.25 91.75 92.25 92.75 93.25 93.75 94.25

1 0 3 11 9 7 7 2

=

1[(90.75-92.825)2×1+(91.25-92.825)2×0+…+(94.25-3992.825)2×2]

=0.584

812(mifinx2) 或者 Sn1i121(90.752191.252094.25224092.762)0.584 39SS2=0.584≈0.7642

2.测得10名接触某种病毒的工人的白细胞(109)如下:

7.1,6.5,7.4,6.35,6.8,7.25,6.6,7.8,6.0,5.95

7 / 137

(1)计算其样本均值、方差、标准差、标准误和变异系数。 (2)求出该组数据对应的标准化值; (3)计算其偏度。

解:(1)xi7.16.55.9567.75,10

i110xi1102i7.126.525.952462.35

1n67.756.775 样本均值xxini110n112(xinx2)(462.35106.7752)0.371 方差Sn1i192标准差SS2=0.371≈0.609

标准误SxSn0.609400.193

变异系数8.99%;

(2)对应的标准化值公式为

uixixxi6.775 S0.609对应的标准化值为

0.5340.452,1.0260.698,0.041,0.780.287,1.6831.2731.355; (3)=0.204。

3. 已知某年某城市居民家庭月人均支出分组数据如下表所示

按月人均支出分组(元) 家庭户数占总户数的比例(%)

200以下 200~

1.5 18.2

8 / 137

500~ 800~ 1000以上 合计

46.8 25.3 8.2 100

试计算(1)该市平均每户月人均支出的均值和标准差; (2)并指出其月人均支出的中位数及众数所在组。 解:(1)由原分组数据表可得

支出分组(元) 200以下 200~ 500~ 800~ 1000以上

1511001.535018.211008.2)687.3 则 xmifi(ni1100512(mifinx2) Sn1i12组中值 100 350 650 900 1100

比例(%) 1.5 18.2 46.8 25.3 8.2

1(10021.5350218.2110028.25687.32) 9952468.39SS252468.39229.06;

(2)由原分组数据表可得

支出分组(元)

比例(%)

累积比例(%)

9 / 137

200以下 200~ 500~ 800~ 1000以上

1.5 18.2 46.8 25.3 8.2

1.5 19.7 66.5 91.8 100

中位数所在组,即累积比例超过50的那个最低组,即为500~组。 众数所在组是频数即比例最大的组,也是500~组。

4.设x1, x2, …,和y1, y2, …,为两组样本观察值,它们有下列关系:

1,2,…

2其中a、b为常数且b≠0,求样本均值x及y及样本方差Sx2和Sy之间的关系。

1n1nxia11nnaxayy()(x)解: inini1bbnnbi1i11n1nxaxa21nxx22S(yiy)()() n1i1n1i1bbn1i1b2y11n122(xix)22Sx。 bn1i1b

五、思考及练习

(一)填充题

1. 统计数据可以分为 数据、 数据、 数据、

据等三类,其中 数据、 数据属于定性数据。

2. 常用于表示定性数据整理结果的统计图有 、 ;

而 、 、 、 等是专用于表示定量数据的特征和规律的统计图。

10 / 137

3. 用于数据整理和统计分析的常用统计软件有

等。

4. 描述数据集中趋势的常用测度值主要有 、 、

等,其中最重要的是 ;描述数据离散程度的常用测度值主要有 、 、 、 等,其中最重要的是 、 。

(二)选择题

1. 各样本观察值均加同一常数c后( )

A.样本均值不变,样本标准差改变 B.样本均值改变,样本标准差

不变

C.两者均不变 D. 两者均改变 2.关于样本标准差,以下哪项是错误的( )。

A.反映样本观察值的离散程度 B.度量了数据偏离样本均值的大小 C.反映了均值代表性的好坏 D.不会小于样本均值 3.比较腰围和体重两组数据变异度大小宜采用( ) A.变异系数() B.方差(S) C.极差(R) D.标准差(S)

2

(三)计算题

1. 在某次实验中,用洋地黄溶液分别注入10只家鸽内,直至动物死亡。将致死量折算至原来洋地黄叶粉的重量。其数据记录为(单位:)

97.3,91.3,102,129,92.8,98.4,96.3,99.0,89.2,90.1

试计算该组数据的样本均值、方差、标准差、标准误和变异系数。

11 / 137

六、思考及练习参考答案

(一)填充题

1. 定类,定序,数值,定类,定序

2. 条形图、圆形图;直方图、频数折线图、茎叶图、箱形图

3. 、、

4. 均值、众数、中位数,均值,极差、方差、标准差、变异系数,方差、标准差

(二)选择题 1. B; 2;3

(三)计算题

1.均值98.54、方差132.27、标准差11.501、标准误3.637、变异系数11.67%。

第二章 随机事件及概率一、学习目的和要求

1. 掌握事件等的基本概念及运算关系; 2. 熟练掌握古典概率及计算;

3. 理解统计概率、主观概率和概率的公理化定义; 4. 熟练掌握概率的加法公式、乘法公式及计算;

12 / 137

5. 理解并掌握条件概率及事件独立性的概念并进行计算; 6. 掌握并应用全概率公式和贝叶斯公式进行计算。

二、内容提要

(一)基本概念 概 念 符 号 概率论的定义 集合论的含义 具有以下特征的观测或试验: 1.试验在相同的条件下可重复地进行 随机试验 (试验) E 2.试验的所有结果事先已知,且不止一个 3.每次试验恰好出现其中之一,但试验前无法预知到底出现哪一个结果。 样本空间 基本事件 (样本点) 随机事件 (事件) 必然事件 不可能事 试验所有可能结果组成的集合,即所有基本事件的全体 试验的每个不可再分的可能结果,即样本空间的元素 试验中可能发生也可能不发生的全集 元素 A 结果,是由基本事件组成的样本空间的子集 子集 在试验中一定发生的事件 在试验中一定不发生的事件,不含全集 空集 13 / 137

件 任何基本事件 (二)事件间的关系 关 系 符 号 概率论的定义 集合论的含义 事件A的发生必然导致事件B的A是B的子集  包含 相等 和(并) 积(交) 差 互不相容 对立 发生 而且 (A∪B) A及B相等 事件A及B中至少有一个事件发A及B的并 生 (A∩B) 事件A及B同时发生 A及B的交 A及B的差 A及B不相交 A的补集(余集) A-B 事件A发生同时B不发生 事件A及B不可能同时发生 事件A不发生 A

(三)事件的运算规律

运算律 交换律 结合律 分配律 差积转换律 对立律 公 式 , ()(),()() (),()=()() ABABAAB A,AΩ 14 / 137

德·摩根对偶律

ABAB,ABAB (四)概率的定义

类 型 mP(A)=古典概率 n定 义 公 式 A所含的基本事件数基本事件总数 n统计概率 P(A) = p (≈fnAnA) 对样本空间中任意事件A对应的一个实数P(A),满足 公理化定义 (基本性质) 公理1(非负性):0≤P(A)≤1 公理2(规范性):P()=1, P()=0 公理3(可加性):若A12, …,…, 两两互不相容, P(A12+……)= P(A1)+ P(A2)+ … + P()+ … 则称P(A)为随机事件A的概率。

(五)概率的计算公式

名 称 加法公式 对立事件公式 事件之差公式 计算公式 P()(A)(B)-P() 若A、B互不相容():P()(A)(B) P(A)=1-P(A);P(A) =1-P(A) P(A-B)= P(A)-P() 若BA, P(A-B)= P(A)-P(B) 15 / 137

条件概率公式 , (P(A)>0) 若P(A)>0, P()(A)P() 乘法公式 若P(B)>0, P()(B)P() 当P(A1A2…1)>0时,有 P(A1A2…)(A1)P(A21)P(A31A2) …P(1A2…1) 独立事件公式 A、B相互独立:P()(A)P(B) A1, A2, …, 相互独立:P(A1A2…)= P(A1)P(A2)…P() 若A1, A2, …, 为完备事件组*,对事件B 全概率公式 PBP(Ai)P(B|Ai) i1n逆概率公式 若A1, A2, …, 为完备事件组*,P(B)>0 (贝叶斯公式) P(Aj|B)P(Aj)P(B|Aj) P(A)P(B|A)iii1n*完备事件组 1. A1, A2, …, 互不相容且P()>0(1, 2, …, {A1, n); 2. A12+… A2, …, }

三、综合例题解析

例1 从某鱼池中取100条鱼,做上记号后再放入该鱼池中。现从该池中任意捉来50条鱼,发现其中有两条有记号,问池内大约有多少条鱼?

16 / 137

解:设池内大约有n条鱼,令

{从池中捉到有记号鱼}

则从池中捉到有记号鱼的概率

P(A)=

100 n50由统计概率的定义知,它近似于捉到有记号鱼的频率 (A) =2,即

解之得2500,故池内大约有2500条鱼。

例2 口袋里有两个伍分、三个贰分和五个壹分的硬币,从中任取五个,求总值超过一角的概率。

解一:令{总值超过一角},现将从10个硬币中任取5个的每种取法作为每个基本事件,显然本例属于古典概型问题,可利用组合数来解决。所取5个硬币总值超过一角的情形,其币值由大到小可根据其中有2个伍分、有1个伍分和没有伍分来考虑。则

23122132C2C8C2C3C5C2C3C5126=0.5。 P(A)5252C10解二:本例也可以先计算其对立事件

A={总值不超过一角}

考察5个硬币总值不超过一角的情形,其币值由小到大先根据壹分硬币、贰分硬币的不同个数来计算其有利情形的组合数。则

513113C5C54C5C5(C32C3C2)C52C3126=0.5 P(A)1P(A)115252C1051413C8C(1262C5C3C5)或 P(A)1P(A)1=0.5 15252C10例3 将n个人等可能地分配到N(n≤N)间房中去,试求下列事件的概率:

17 / 137

(1){某指定的n间房中各有一人}; (2){恰有n间房,其中各有一人}; (3){某指定的房中恰有m(m≤n)个人}。

解:把n个人等可能地分配到N间房中去,由于并没有限定每一间房中的人数,故是一可重复的排列问题,这样的分法共有种。

(1)对事件A,对指定的n间房,第一个人可分配到该n间房的任一间,有n种分法;第二个人可分配到余下的n-1间房中的任一间,有n-1种分法,以此类推,得到A共含有n!个基本事件,故

(2)对事件B,因为n间房没有指定,所以可先在N间房中任意选出n间

n房(共有CN种选法),然后对于选出的某n间房,按照上面的分析,可知B共n含有CN·n!个基本事件,从而

m(3)对于事件C,由于m个人可从n个人中任意选出,故有Cn种选法,而

其余n-m个人可任意地分配到其余的N-1间房中,共有(N-1)种分配法,故

mC中共含有Cn·(N-1)个基本事件,因此

mCn(N1)nmmCn(P(C)Nn1m1)(1)nm NN注意:可归入上述“分房问题”来处理的古典概型的实际问题非常多,例如: (1)生日问题:n个人的生日的可能情形,这时365天(n≤365); (2)乘客下车问题:一客车上有n名乘客,它在N个站上都停,乘客下车的各种可能情形;

(3)印刷错误问题:n个印刷错误在一本有N页的书中的一切可能的分布(n不超过每一页的字符数);

(4)放球问题:将n个球放入N个盒子的可能情形。

18 / 137

值得注意的是,在处理这类问题时,要分清什么是“人”,什么是“房”,一般不能颠倒。

例4(1994年考研题)设A,B为两事件,且P(A),P()=P(AB),求P(B)。 解:由于

P(AB)P(AB)1P(AB)1[P(A)P(B)P(AB)],

现因为P()=P(AB),则

P(AB)1P(A)P(B)P(AB)

又P(A),故

P(B)1P(A)1p。

注意:事件运算的德·摩根律及对立事件公式的恰当应用。

例5 设某地区位于河流甲、乙的交汇处,而任一何流泛滥时,该地区即被淹没。已知某时期河流甲、乙泛滥的概率分别为0.2和0.3,又当河流甲泛滥时,“引起”河流乙泛滥的概率为0.4,求

(1)当河流乙泛滥时,“引起”河流甲泛滥的概率; (2)该时期内该地区被淹没的概率。 解:令{河流甲泛滥},{河流乙泛滥} 由题意知

P(A)=0.2,P(B)=0.3,P()=0.4

再由乘法公式

P()(A)P()=0.2×0.4=0.08,

则(1)所求概率为

P(A|B)P(AB)0.080.267 P(B)0.3 (2)所求概率为

P()(A)(B)-P() =0.2+0.3-0.08=0.42。

19 / 137

例6 设两个相互独立的事件A和B都不发生的概率为1/9,A发生B不发生的概率及B发生A不发生的概率相等,求P(A)。

解:由题设可知因为A和B相互独立,则

P() = P(A)P(B),

再由题设可知

P(AB)P(A)P(B)1, 9P(AB)P(AB)

又因为

P(AB)P(AB),

即 P(A-B) = P(B-A), 由事件之差公式得

P(A)P(AB)P(B)P(AB)

则有P(A) = P(B),从而有

P(A)P(B)

故有

11(P(A))2, P(A)

93即 P(A)1P(A)2。 3例7(1988年考研题) 玻璃杯成箱出售,每箱20只,假设各箱含0,1,2只残次品的概率相应为0,0.8,0.1和0.1,一顾客欲购一箱玻璃杯,在购买时,售货员随意取一箱,而顾客开箱随机地查看4只,若无残次品,则买下该箱玻璃杯,否则退回。试求

(1)顾客买下该箱的概率α;

(2)在顾客买下的一箱中,确实没有残次品的概率β。

20 / 137

解:由于玻璃杯箱总共有三类,分别含0,1,2只残次品。而售货员取的那一箱可以是这三类中的任一箱,顾客是在售货员取的一箱中检查的,顾客是否买下这一箱是及售货员取的是哪一类的箱子有关系的,这类问题的概率计算一般可用全概率公式解决,第二问是贝叶斯公式也即条件概率问题。

首先令 {顾客买下所查看一箱};

{售货员取的箱中恰好有i件残次品},0,1,2。

显然,B0,B1,B2构成一组完备事件组。且

P(B0)0.8,P(B1)0.1,P(B2)0.1,P(AB0)1,P(AB1)4C194C204C18412

,P(AB2)4.5C2019(1)由全概率公式,有

P(A)P(Bi)P(ABi)0.810.10.1i0245120.94 19(2)由逆概率公式,得

P(B0A)P(B0)P(AB0)P(A)0.810.85 0.94注意:本题是典型的全概率公式及贝叶斯公式的应用。

例8.(小概率事件原理)设随机试验中某事件A发生的概率为ε,试证明,不论ε>0如何小,只要不断独立重复地做此试验,事件A迟早会发生的概率为1。

证:令 {第i次试验中事件A发生}, 1,2,3,… 由题意知,事件A1, A2, …, , …相互独立且

P()=,1,2,3,…,

则在n次试验中事件A发生的概率

P(A1A2An)=1-P(A1A2An)

=1-P(A1)P(A2)P(An)1(1)n

21 / 137

当n→+∞, 即为事件A迟早会发生的概率

P(A1A2An)lim1(1)n1。

n

四、习题二解答

1.考察随机试验:“掷一枚骰子,观察其出现的点数”。如果设

{掷一枚骰子所出现的点数为i }, 1,2,…,6

试用i来表示该试验的基本事件、样本空间Ω和事件A ={出现奇数点}和事件{点数至少是4}。

解:基本事件:{0},{1},{2},{3},{4},{5},{6}。 样本空间Ω={ 0,1,2,3,4,5,6}。 事件{1,3,5};{4,5,6}。 2.用事件A、B、C表示下列各事件: (1)A出现,但B、C不出现; (2)A、B出现,但C不出现; (3)三个都出现;

(4)三个中至少有一个出现; (5)三个中至少有两个出现; (6)三个都不出现; (7)只有一个出现; (8)不多于一个出现; (9)不多于两个出现。

解:(1)ABC (2)ABC (3)ABC

(4)ABCABCABCABCABCABCABC

或或ABC

(5)ABCABCABCABC

22 / 137

(6)ABC或(7)ABC(8)ABC-()或ABC

ABC ABCABC

ABCABC(9)ABCABCABCABCABCABCABC

-或ABC

3.从52张扑克牌中,任取4张,求这四张花色不同的概率。

解:现将从52张扑克牌中任取4张的每种取法作为每个基本事件,其结果及顺序无关,故可用组合数来解决该古典概型问题。

1111C13C13C13mC13134P0.1055。 4n52515049/4!C524.在一本标准英语词典中共有55个由两个不同字母组成的单词,现从26个英文字母中任取两个字母排成一个字母对,求它恰是上述字典中单词的概率。

解:现将从26个英文字母中任取两个字母件的每种取法作为每个基本事件,其结果及顺序有关,故可用排列数来解决该古典概型问题。

Pm555520.0846。 nA2626255.某产品共20件,其中有4件次品。从中任取3件,求下列事件的概率。(1)3件中恰有2件次品;(2)3件中至少有1件次品;(3)3件全是次品;(4)3件全是正品。

解:现将从20件产品中任取3件的每种取法作为每个基本事件,其结果及顺序无关,故可用组合数来解决该古典概型问题。

21C16mC4(1)P(A)0.0842; 3nC203C16m(2)P(B)1P(B)11310.49120.5088

nC2023 / 137

122130C16C4C16C4C16mC4或P(B)0.5088; 3nC203mC4(3)P(C)30.0035;

nC203mC16(4)P(D)30.4912。

nC206.房间里有10个人,分别佩戴着1~10号的纪念章,现等可能地任选三人,记录其纪念章号码,试求:(1)最小号码为5的概率;(2)最大号码为5的概率。

解:设{任选三人中最小号码为5},{任选三人中最大号码为5}

(1)对事件A,所选的三人只能从5~10中选取,而且5号必定被选中。

12C5mC11P(A)0.0833; 3n12C10 (2)对事件B,所选的三人只能从1~5中选取,而且5号必定被选中。

12C4mC11P(B)0.05。 3n20C107.某大学学生中近视眼学生占22%,色盲学生占2%,其中既是近视眼又是色盲的学生占1%。现从该校学生中随机抽查一人,试求:(1)被抽查的学生是近视眼或色盲的概率;(2)被抽查的学生既非近视眼又非色盲的概率。

解:设 {被抽查者是近视眼},{被抽查者是色盲}; 由题意知,P(A)=0.22,P(B)= 0.02,P()= 0.01,则 (1)利用加法公式,所求概率为

P()(A)(B)-P()=0.22+0.02-0.01=0.23;

(2)所求概率为

P(AB)(AB)=1-P()=1-0.23 =0.77。

注意:上述计算利用了德·摩根对偶律、对立事件公式和(1)的结果。

24 / 137

8.设P(A)=0.5,P(B)=0.3且P()=0。求:(1)P();(2)P(A)。 解:(1)P()(A)(B)-P()=0.5+0.3-0.1=0.7;

(2)P(A)= P(A)(B)-P(AB)=[1-P(A)](B)-P(B-A)

=1-P(A) (B)-[P(B) -P()]= 1-P(A) + P() =1-0.5+0.1=0.6。

注意:上述计算利用了加法公式、差积转换律、对立事件公式和事件之差公式。

9.假设接受一批药品时,检验其中一半,若不合格品不超过2%,则接收,否则拒收。假设该批药品共100件,其中有5件不合格,试求该批药品被接收的概率。

解:设 {50件抽检药品中不合格品不超过1件}, 据题意,仅当事件A发生时,该批药品才被接收,故所求概率为

50149C5C95mC95P(A)0.1811。 50nC10010.设为任意两个事件,且P(A)>0,P(B)>0。证明: (1)若A及B互不相容,则A和B不独立; (2)若 P()(A),则A和B相互独立。

证明:(1)用反证法。假定A和B独立,因为已知A及B互不相容,则

,P()= P()=0

故 P(A) P(B)= P()=0

但由已知条件P(A)>0,P(B)>0得P(A) P(B)>0,由此导出矛盾,所以若A及

B互不相容,则A和B不独立。

(2)由已知P()(A),又

25 / 137

P(AB)P(AB)P(BA)P(B)P(AB) P(A)P(A)1P(A)1P(A)即 P()[1-P(A) ]= P(A)[P(B)-P()]

P()-P()P(A) = P(A)P(B)-P(A)P()

故 P() = P(A)P(B) 这即A和B相互独立。

(2)又证:由已知

P()(A)P(AB)P(BA)P(B)P(AB) P(A)1P(A)1P(A)即 P()[1-P(A) ]= P(B)-P()

P()-P()P(A) = P(B)-P() P()-P() = P(B)-P()

P() = P(B)

这即A和B相互独立。

11.已知P(A)=0.1,P(B)=0.3,P(A | B)=0.2,求:(1)P();(2)P(A+

B);(3)P();(4)P(AB);(5)P(A|B)。

解:(1)P()= P(B) P(A | B)=0.3×0.2=0.06; (2)P()(A)(B)-P()=0.1+0.3-0.06=0.34; (3)P(B|A)P(AB)0.060.6; P(A)0.1(4)P(AB)(A-B)(A)-P()=0.1-0.06=0.04; (5)P(A|B)P(AB)P(AB)1P(AB)10.340.9429。 P(B)1P(B)1P(B)10.312.某种动物活到12岁的概率为0.8,活到20岁的概率为0.4,问现年12岁的这种动物活到20岁的概率为多少?

解:设{该动物活到12岁},{该动物活到20岁};由题意知

26 / 137

P(A)=0.8,P(B)=0.4

显然该动物“活到20岁”一定要先“活到12岁”,即有

BA,且,

则所求概率是条件概率

P(B|A)P(AB)P(B)0.40.5。 P(A)P(A)0.813.甲、乙、丙三人各自独立地去破译一密码,他们能译出该密码的概率分别是1/5,2/3,1/4,求该密码被破译的概率。

解:设 {甲译出该密码},{乙译出该密码},{丙译出该密码}. 由题意知,A,B,C相互独立,而且

P(A)=1/5,P(B)=2/3,P(C)=1/4

则密码被破译的概率为

P()=1-P(ABC)=1-P(A)P(B)P(C)0.8

或 P()(A)(B)+ P(C)-P()-P()-P()()

(A)(B)+ P(C)-P(A) P(B)-P(A) P(C)-P(B) P(C) + P(A) P(B) P(C) =15231412531154213412153440.8。 514.有甲乙两批种籽,发芽率分别为0.8和0.7,在两批种籽中各任意抽取一粒,求下列事件的概率:(1)两粒种籽都能发芽;(2)至少有一粒种籽能发芽;(3)恰好有一粒种籽能发芽。

解:设 {甲种籽能发芽}, {乙种籽能发芽} 则由题意知,A及B相互独立,且有

P(A)=0.8,P(B)=0.7,

则所求概率为

(1)P()(A)P(B)=0.8×0.7=0.56;

27 / 137

(2)P() =1-P(AB)=1-P(AB)=1-P(A)P(B)=1-0.2×0.3=0.96; (3)P(ABAB)P(A)P(B)P(A)P(B)0.8×0.3+0.2×0.7=0.38。

15.设甲、乙两城的通讯线路间有n个相互独立的中继站,每个中继站中断的概率均为p,试求:(1)甲、乙两城间通讯中断的概率;(2)若已知0.005,问在甲、乙两城间至多只能设多少个中继站,才能保证两地间通讯不中断的概率不小于 0.95?

解:设{第k个中继站通讯中断}, 1,2,…,则A1, A2, …, 相互独立,而且有P(), 1,2,…。

(1)所求概率为

P(A1+ A2+…+ )=1-P(A1A2An)=1-P(A1A2An)

=1-P(A1)P(A2)P(An)=1-(P(A1))n1-(1-p)n;

(2)设甲、乙两城间至多只能设n个中继站,由题意,应满足

P(A1A2An)=(1-p)n≥0.95,

即 (1-0.005)n≥0.95

0.995n≥0.95

n≤0.9950.950.950.995=10.233

故10,即甲、乙两城间至多只能设10个中继站。

16.在一定条件下,每发射一发炮弹击中飞机的概率是0.6,现有若干门这样的炮独立地同时发射一发炮弹,问欲以99%的把握击中飞机,至少需要配置多少门这样的炮?

解:设至少需要配置n门炮。再设

{第k门炮击中飞机}, 1,2,…,

则A1, A2, …, 相互独立,而且有

P()=0.6, 1,2,…。

28 / 137

由题意,应有

P(A1+ A2+…+ )= 1-P(A1A2An)=1-P(A1)P(A2)P(An)

n=1-(P(A1))n1-0.4≥0.99

即 0.4≤0.01, 则有

nn≥0.40.010.010.4=5.026

故6,因此至少需要配置6门炮。

17.甲袋中有3只白球,7只红球,15只黑球;乙袋中10只白球,6只红球,9只黑球。现从两袋中各取一球,求两球颜色相同的概率。

解:设以A1、A2、A3分别表示从甲袋中任取一球为白球、红球、黑球; 以B1、B2、B3分别表示从乙袋中任取一球为白球、红球、黑球。 则所求两球颜色相同的概率为

P(A1B1+ A2B2+ A3 B3)= P(A1)P(B1)+ P( A2)P(B2)+ P(A3)P( B3)

310761592070.3312。 25252525252562518.在某地供应的某药品中,甲、乙两厂的药品各占65%、35%,且甲、乙两厂的该药品合格率分别为90%、80%,现用A1、A2分别表示甲、乙两厂的药品,

B表示合格品,试求:P(A1)、P(A2)、P(1)、P(2)、P(A1B)和P(B)。

解:由题中已知条件可得

P(A1)=0.65,P(A2)=0.35,P(1)=0.9,P(2)=0.8,

P(A1B)= P(A1)P(1)= 0.65×0.9=0.585,

P(B)= P(A1)P(1)+ P(A2)P(2) =0.65×0.9+0.35×0.8=0.865。

19.某地为甲种疾病多发区,其所辖的三个小区A1,A2,A3的人口比例为9∶7∶4,据统计资料,甲种疾病在这三个小区的发病率依次为4‰,2‰,5‰,求该地甲种疾病的发病率。

29 / 137

解:设以A1、A2、A3表示病人分别来自小区A1、A2、A3,以B表示患甲种疾病。则由题意知

P(A1)=

974,P(A2)=,P(A3)=,

202020P(1)=0.004,P(2)=0.002,P(3)=0.005,

则该地甲种疾病的发病概率为

P(B)= P(A1)P(1)+ P(A2)P(2)+ P(A3)P(3)

9740.0040.0020.0050.00353.5‰。 20202020.若某地成年人中肥胖者(A1)占有10%,中等者(A2)占82%,瘦小者(A3)占8%,又肥胖者、中等者、瘦小者患高血压病的概率分别为20%,10%,5%。(1)求该地成年人患高血压的概率;(2)若知某人患高血压病,他最可能属于哪种体型?

解:设{该地成年人患高血压},则由题意知

P(A1)=0.10,P(A2)=0.82,P(A3)=0.08, P(1)=0.20,P(2)=0.10,P(3)=0.05,

(1)该地成年人患高血压的概率为

P(B)= P(A1)P(1)+ P(A2)P(2)+ P(A3)P(3)

0.10.20.820.10.080.050.106;

(2)若已知某人患高血压病,他属于肥胖者(A1)、中等者(A2)、瘦小者(A3)体型的概率分别为

P(A1)=P(A2)=P(A3)=

P(A1)P(B|A1)0.10.20.1887

P(B)0.106P(A2)P(B|A2)0.820.10.7736

P(B)0.106P(A3)P(B|A3)0.080.050.0377

P(B)0.10630 / 137

因为 P(A2)> P(A1) >P(A3)

故若知某人患高血压病,他最可能属于中等体型。

21.三个射手向一敌机射击,射中概率分别为0.4,0.6和0.7。若一人射中,敌机被击落的概率为0.2;若两人射中,敌机被击落的概率为0.6;若三人射中,则敌机必被击落。(1)求敌机被击落的概率;(2)已知敌机被击落,求该机是三人击中的概率。

解:设A1、A2、A3分别表示第一个射手、第二个射手、第三个射手射中敌机;

B0、B1、B2、B3分别表示无人射中、一人射中、两人射中、三人射中敌机;C表

示敌机被击落。则A1、A2、A3相互独立,且由题意可得

P(A1)=0.4,P(A2)=0.6,P(A3)=0.7

P(B0)= P(A1A2A3)(A1) P(A2) P(A3)= 0.6×0.4×0.3=0.072 P(B1)= P(A1A2A3A1A2A3A1A2A3)=P(A1A2A3)P(A1A2A3)P(A1A2A3) =P(A1)P(A2)P(A3)P(A1)P(A2)P(A3)P(A1)P(A2)P(A3) =0.4×0.4×0.3+0.6×0.6×0.3+0.6×0.4×0.7=0.324

P(B2)= P(A1A2A3A1A2A3A1A2A3)=P(A1A2A3)P(A1A2A3)P(A1A2A3) =P(A1)P(A2)P(A3)P(A1)P(A2)P(A3)P(A1)P(A2)P(A3) =0.4×0.6×0.3+0.6×0.6×0.7+0.4×0.4×0.7=0.436 P(B3)= P(A1A2A3)(A1) P(A2) P(A3)= 0.4×0.6×0.7=0.168

P(0)=0,P(1)=0.2,P(2)=0.6,P(3)=1

(1)敌机被击落的概率为

P(C)(0)P(B0)(1)P(B1)(2)P(B2)(3)P(B3)

=0×0.072+0.2×0.324+0.6×0.436+1×0.168=0.4944;

(2)所求概率为

P(B3)=

P(B3)P(C|B3)0.16810.3398。

P(C)0.494431 / 137

五、思考及练习

(一)填充题

1.若P(A)=0.3,P(B)=0.6,则

(1)若A和B独立,则P()= , P(B-A)= ; (2)若A和B互不相容,则P()= ,P(B-A) = ;

(3)若A B,则 P()= ,P(B-A)= 。

2. 如果A及B相互独立,且P(A)= P(B)= 0.7,则P(AB)= 。 3.在4次独立重复试验中,事件A至少出现1次的概率为试验中事件A出现的概率是 。

(二)选择题

1. 下列说法正确的是( )

A. 任一事件的概率总在(0,1)之内 B. 不可能事件的概率不一定为

0

C. 必然事件的概率一定为1 D. 以上均不对。

2.以A表示事件“甲种药品畅销,乙种药品滞销”,则其A的对立事件为( )

A. 甲,乙两种药品均畅销 B. 甲种药品滞销,乙种药品畅销

C. 甲种药品滞销” D. 甲种药品滞销或乙种药品畅销

3. 有100张从1到100号的卡片,从中任取一张,取到卡号是7的倍数的

65,则在每次8132 / 137

概率为( )

77A. B.

50100715C. D.

481004. 设A和B互不相容,且P(A)>0,P(B)>0,则下列结论正确的是( ) A. P()>0 B. P(A)()

C. P()=0 D. P()(A)P(B)

(三)计算题

1.设Ω={1,2,3,4,5,6,7},{2,3,4},{3,4,5}。试求下列事件:(1)AB;(2)A。

2.某城市的电话号话由0,1,2,…,9这10个数字中任意8个数字组成,试求下列电话号码出现的概率:

(1)数字各不相同的电话号码(事件A); (2)不含2和7的电话号码(事件B); (3)5恰好出现两次的电话号码(事件C)。

3.一部五卷的文集,按任意次序放到书架上去,试求下列事件的概率: (1)第一卷出现在两边;

(2)第一卷及第五卷出现在两边; (3)第一卷或第五卷出现在两边; (4)第三卷正好在正中。

4.电路由电池A及两个并联的电池B、C串联而成,设电池A、B、C是否损坏相互独立,且它们损坏的概率依次为0.3,0.2,0.2,求电路发生间断的概率。

33 / 137

5. 设一医院药房中的某种药品是由三个不同的药厂生产的,其中一厂、二厂、三厂生产的药品分别占1/4、1/4、1/2。已知一厂、二厂、三厂生产药品的次品率分别是7%,5%,4%。现从中任取一药品,试求

(1)该药品是次品的概率;

(2)若已知任取的药品是次品,求该次品是由三厂生产的概率。 6.盒中放有12个乒乓球,其中有9个球是新球。第一次比赛从盘中任取3个来用,比赛后仍放回盒中;第二次比赛时又从盒中任取3个。(1)求第二次取出的球都是新球的概率;(2)若已知第二次取出的球都是新球,求第一次取到的都是新球的概率。

六、思考及练习参考答案

(一)填充题

1. (1)0.72,0.42;(2)0.9,0.6;(3)0.6,0.3 2. 0.09 3. (二)选择题

1. C; 2. D; 3. A; 4 (三)计算题

1. A={1, 5,6, 7},B={1, 2,6, 7},则 (1)AB={1, 6, 7};(2)A{1,3,4,5,6,7}

8109876543A102.(1)PA80.01814

1081013(2) (3)PCC82961080.1488

34 / 137

3. (1)=0.4;(2)=0.1;

14232C2A4A2A37(3)P=0.7;或=0.7; 510A5113232C2C3A3A2A37或P=0.7 510A5(4)=0.2

4.已知 P(A)=0.3,P(B)=0.2,P(C)=0.2 且A、B、C相互独立 则所求概率

P(ABC)(A)(BC)-P(ABC)

= P(A)(B)P(C)-P(A)P(B)P(C) =0.3+0.2×0.2-0.3×0.2×0.2=0.328

5. 令{该药品是次品};{药品是由k厂生产的},1,2,3。 由题意知 P(B1)=0.25, P(B2)=0.25,P(B3)=0.5,

P(1)=0.07,P(2)=0.05,P(3)=0.04,

(1)P(A)(1)P(B1)(2)P(B2)(3)P(B3)

=0.07×0.25+0.05×0.25+0.04×0.50=0.05

(2)

P(B3|A) PA|B3P(B3)P(A|B1)P(B1)P(A|B2)P(B2)P(A|B3)P(B3)0.040.50.02 0.400.070.250.050.250.040.50.05

6.令{第一次比赛任取3球中有k个新球},0,1,2,3;

{第二次取出的球都是新球}。

3C9k由题意得 P()=, P()=3,0,1,2,3。

C123k3C3CkC99k(1)PBP(Ak)P(B|Ak)0.146 33C12C12k0k03335 / 137

33(2)P(A|B)P(A3)P(B|A3)P(A3)P(B|A3)C9C60.146=0.238

3333P(Ai)P(B|Ai)i0P(B)C12C12

第三章 随机变量及其分布

一、 学习目的和要求

1. 理解随机变量及其分布函数的概念;

2. 熟练掌握离散型、连续型随机变量的分布及性质;

3. 熟练掌握常用数字特征:数学期望E(X)和方差D(X)及其性质; 4. 熟练掌握二项分布、泊松分布、正态分布等的性质及概率计算;

5. 了解随机变量函数的分布;

6. 了解随机向量及分布函数的概念、性质;

7. 掌握离散型随机向量和连续型随机向量及其分布; 8. 掌握二维随机向量的数字特征;

9. 了解契比晓雪夫不等式和大数定律及其意义; 10. 掌握中心极限定理及其应用;

11. 了解用计算二项分布、泊松分布、正态分布等常用分布的概率。

二、内容提要

(一)随机变量及常用分布 1. 离散型随机变量及常用分布 名 称 分布律 定 义 性质或背景 1. ≥0,1,2,… 2. 备 注 P{},1,2,… 或 X x1 x2 … … P p1 p2 … … 36 / 137

0-1分布 P{1}, P{0},或 X P 0 1 二项分布1的特例: B(1)( 一重贝努里D(X) 试验) q p 二项分P{ k}= Cknpkqnk, X为n重贝努里试验 中A事件发生的次数 D(X) 二项分布泊松近似布B() 0,1,… 泊松分布P{}=, k=0,1,2,… , D(X)= >0公式 (≈) (n很大,pP() 是常数 较小) 超几何 P{}= 分布 1,2,…() 无放回产品抽样试验 当N→+∞时,时, knkCNCNMlimCnkpkqnk nNCNnMN nM(Nn)(NM)N2(N1)D(X) 2. 连续型随机变量及常用分布 名 称 定 义 对任意a(x) = 标准正态分布 ﹣∞0为常数 2 E() 均匀分布 1, axb f(x)ba 其它,0, D(X)=1/ 直线上几何概率E(X)= ()/2 模型的分布描述 D(X)=()2/12 若X服从对数正E(X)e2U[a,b] 对数正态分f(x) = 布 (,2) 韦布尔分布 (lnx)12e2,x02x0 , x0 2222 态分布(,2), D(X)(e1)e2 则~N(,2) f(x)= W(m, , ) (x)mm-1(x-)e, x x 0 ,mm =1且=0时为分布函数为 m =3.5 指数分布;时近似于正态分布 F(x)=1e, (x)m(x>) 3. 随机变量的分布函数 类 型 通用定义 定 义 性 质 备 注 F(x)=P{X≤x}, 1. 0≤F(x)≤1; ﹣∞<x<+∞ P{a离散型 F(x)=, 2. F(﹣∞)=0 , F(+ ∞)=1 3. F(x)对x单调不f(x)(x) 减 4. F(x)为右连续 X ﹣∞<x<+∞ 连续型 F(x)=xf(t)dt, X ﹣∞<x<+∞ P{a类 型 定 义 离散型 E(X)= 性 质 1. E(C)=C(C为常数) 2. E()=C·E(X) 3. E(X±Y)=E(X)±描述随机变数学期望E(X) 连备 注 续型 E(Y) 量所有可能E(X)=xfxdx 4. 若X、Y相互独立,取值的平均则 水平 E(X·Y)E(X)·E(Y) 方差 =D(X) D(X) [(X-E(X))] 21. D(C)=0(C为常数) 2. D()=C2·D(X) 描述随机变3. 若X、Y相互独立,量取值相对标准差(X) 则 于均值的平D(X±Y)=D(X)(Y) 均离散程度 4. D(X) = E(X2)-()2 协方差(X, Y) () [(X-E(X))(Y-1. ()= (X, Y) 2. (X12) 描述X及Y的偏差的关39 / 137

E(Y))] (X1) (X2) (X, 联程度 ()-E(X)·E(Y) 3. X及Y独立Y)=0 4. D(X±Y) =D(X)(Y)±2(X, Y) 1. |2. |相关系数 ≤1; 1存在常数a、描述X及Y间线性相关程度; =0,称Xb 使得P{}=1; 3. X及Y独立 X及Y不相关, 反之不一定及Y不相关; 成立。

(三)随机变量函数的分布 类 型 X的分布 函数(X)的分布 数学期望公式 40 / 137

离散型 X的分布律 P{}, 1,2,… Y的分布律为 P{()} ,1,2,…。 若有某些g()相等,则对其作适当的并项,即对应概率相加 分布函数法: (y){Y≤y}{g(X)≤y}{x:g(x)y} X fX(x)dx 连续型 (X)的密度:(y)′Y(y) X的密度为 (x) 定理公式法: 若(x)在 (x)非零区间上严格单调, X h(y)是(x)的反函数 fX[h(y)]|h'(y)|, y fY(y) 其它,0,

(四)二维随机向量及分布 1. 二维离散型随机向量 名 称 联合 分布律 定 义 PXxi,Yyjpij,i,j1,2,性质或试验背景 备 注 联合分布律的列表结构 (概率分布表) 1. ≥0,1,2,…, 2. X的 边缘分布 PXxipijpi., j1随机变量X的分布由联合分布律“行值律 相加” i1,2,41 / 137

Y的 边缘分布 PYyjpijp.j, i1随机变量Y的分布由联合分布律“列值律 相加” j1,2,.独立性 X及Y相互独立 X、Y的边缘分布完按定义验证独立性, 全确定其联合分实用中由试验独立布律 性得 pijpipj,i,j1,2,.

2. 二维连续型随机向量 名称 定 义 性质或试验背景 备 注 Px1Xx2,y1Yy2y22xx1y1f(x,y)dxdy联合密度 对平面上的区域1. f()≥0 f(x, y) D 2.f(x,y)dxdy1 X的边缘密度 fX(x)f(x,y)dy随机变量X的密度 (x)(x) fY(x)f(x,y)dx随机变量Y的密度 (y)= (y) Y的边缘密度 独立性 X及Y相互独立 X、Y的边缘分布完按定义验证独立性; f(x,y)fX(x)fY(y) 全确定其联合分布实用中由试验独立律 性得 二维 正态分布 (X, Y)~ X及Y相互独立 X~N(1,12) Y~N(2,22) =0; 是X及Y的相关系数 N(μ1,μ2,212,2,)

42 / 137

3. 二维随机向量的分布函数 名 称 联合分布函数定义 离散型 () ﹣∞<x, y<+∞ 定 义 性质或试验背景 备 注 F(x, y)=P{X≤≤y} 1. 0≤F(x, y)≤1; ﹣∞<x, y<+∞ F()可以描述任2. F(-∞, y)= 0, F(∞)=0, 意类型()的分布 F(-∞∞)=0, F(+∞, + ∞)=1; 3. F(x, y)对x, y均为右连续; 4. F(x, y)对x和y单调不减; xy连续型 F(x,y)f(u,v)dudv﹣∞<x, y<+∞ () X的边缘 分布函数 (x)为X的分布函数 由F()可确定(x)及(y),反之未必 Y的边缘 分布函数 (y)为Y的分布函数 (五)大数定律和中心极限定理 名 称 条 件 结 论 备 注 在已知X的均值和方差时,估计X及其均值E(X)的偏差大(小)于的概率 X的E(X)、对任意>0,有 契贝晓夫 不等式 D(X)均存在有限 PXE(X)D(X)或 2PXE(X)1DX 243 / 137

设{}为相互独对任意立且服从同一分布的随机变切比雪夫 大数定律 量序列,又>0,有 当n足够大时, 将依概率收敛于其均值μ 1nlimPXk0 nnk1即PE()=, D()=2 (1,2,…)均存在有限 设(或贝努里 大数定律 n~B(); n对任意ε>0,有 。 以严格数学形式描述“频率的稳定性”。 在试验次数很大时,用事件A的频率作为其概率的近似值 为n重贝努里试验中即A发生的频率 事件A发生的次数,P(A)) 勒维-林德贝格中心极限定理 (独立同分布中心极限定理) 设{}为相互独令,则 立且服从同一nn足够大时,近似服从N(n, n 2limPYnx(x) ) 分布的随机变即n很大时,~N(0, 量序列,又1)(近似) E()=, D()=2(1,2, 德莫佛-拉普…)均存在有限 设n~B(); 令,则 当n很大(n>30)44 / 137

拉斯中心极限定理 (贝努里情形中心极限定理) (或n为n重nlimPYnx(x) 时,有贝努里试验中即n很大时,~Panbbnpanp()().事件A发生的N(0,1)(近似), 或npqnpq 次数,P(A)) ~N( , ) (近似) n

三、综合例题解析

例1(1991年考研题) 一汽车沿一街道行驶,需要通过三个均设有红绿灯的路口。每个信号灯为红或绿及其他信号灯为红或绿相互独立,且红绿两种信号显示的时间相等。以X表示该汽车首次遇到红灯前已通过的路口个数,求X的概率分布。

解:首先,由题设可知,X的可能值为0,1,2,3。现设

= {汽车在第i个路口首次遇到红灯},1,2,3,

则事件A1,A2,A3相互独立,且

(i = 1,2,3),

故有 P{X = 0} = P(A1) = 1,

2P{X1}P(A1)P(A2)122

1 32P{X2}P(A1A2A3)P(A1)P(A2)P(A3)P{X3}P(A1A2A3)P(A1)P(A2)P(A3)1 32所以,X的分布律为

45 / 137

X P

0 1 2 3 12122123123 注意:利用性质:pi1,可检查离散型概率分布律的正确及否。同时,

i若X的某个取值x0的概率较难计算,而其他所有取值的概率已算出时,则也可以利用上述性质得到:

P{Xx0}1i:xix0pi。

1。 32比如本例中:

P{X3}1P{X0}P{X1}P{X2}例2 设连续型随机变量X的分布函数为

x2F(x)ABe, x0

 x00, 求:(1)常数A、B;(2)概率密度函数f(x)。 解:(1)由分布函数的性质F(+∞)=1得

(ABe)A1, F(+∞)= xlimx2再由分布函数的连续性知其右极限F(0+0)= F(0),即

F(0+0)= lim(ABe)AB0

x00x2联立上述两式,解之得:A =1, B =﹣1。

则分布函数为

x2F(x)1e, x0

 x00, 46 / 137

(2)所求密度函数为

x12e, x0。 f(x)F(x)20, x0

例3(1989年考研题)设随机变量在区间[1,6]上服从均匀分布,求方程

x2 + x + 1 = 0有实根的概率。

解:易知方程x2 +

x + 1 = 0有实根当且仅当Δ=

~U[1,6],求P{|

2

-4≥0,即||≥2。

故所求问题转化为:已知|≥2}。

现因在[1,6]上服从均匀分布,则

的概率密度为

方程x2 +ξx + 1 = 0有实根的充要条件是Δ=

2

-4≥0,即||≥2,故

P{2}1P{2}1P{22}

1f(x)dx1(0dx222121114dx)1。 555例4 已知X~N(2, 解:由于X~N(2,

2

2

),P{2<X<4}=0.3,求P{X<0}。

),故

42222)()()(0)0.3 σσσP{2X4}(由于,可知

2()(0)0.30.8,

故 P{X0}(0222)()1()10.80.2。

注意:在正态分布的概率计算中,首先要将它标准化,转化为利用标准正态分布的公式求解即可。

例5(1989年考研题)设随机变量X和Y独立,且X服从均值为1,标准差

47 / 137

为2的正态分布,而Y服从标准正态分布,试求随机变量Z = 2X-Y + 3的概率密度函数。

解:由于X和Y相互独立且都服从正态分布,所以Z作为X,Y的线性组合也服从正态分布,故只需求E(Z)和D(Z)就可确定Z的概率密度函数了。

由题设知,X~N(1,2),Y~N(0,1)。则由期望和方差的性质得

E(Z) = E(2X-Y + 3)=2E(X)-E(Y) +3 = 5, D(Z) = D(2X-Y + 3) = 22D(X) (Y) = 9.

又因X,Y是相互独立的正态随机变量,Z是X,Y的线性函数,故Z也为正态随机变量,即Z~N (

,

2

),且

2

= E(Z)=5,

则Z的概率密度为

fZ(z)132e= D(Z)=9。

(z5)229, z。

注意:本题主要考察的性质是:一是独立正态分布的线性组合仍为正态分布;二是正态分布N (

,

2

)完全由其期望和方差

2

决定。

例6 已知随机变量X的概率分布律为

P{}=1/2k,1,2,…,

试求Ysin(X)的概率分布律。

2解:对随机变量Ysin(0,﹣1, 0, …, 即

2X),当X 取1, 2, …, n, …时,Y的取值为1,

X

1 2 3 4 5 6

7 …

Ysin(2X)

1 0 -1 0 1 0

48 / 137

-1 …

P

112221231241251261 72则Ysin(X)只以﹣1,0,1为其取值,其取值概率为

2故Y的分布律为

例7 设(X,P{﹣1}{3}{7}{11}+…

12312712111128; 111516P{0}= P{2}{4}{6}+…

1221111124264; 1134P{1}{1}{5}{9}+…

121111825292 111516(或P{1}=1-P{﹣1}-P{0}=)

Y -1 0 1

P

)的联合分布律为

Y

X

-1 0 1

1/4

1/4

49 / 137

Y2

1/6 a 3131求:(1)常数a;(2)联合分布函数在点(,)处的值F(,)。

2222解:(1)由联合分布律的性质

知 1求得。

ijpij111a, 44631(2)(X,Y)的联合分布函数F(x, y)在点(,)处的值应为

223131111F(,)P{X,Y}P{X1,Y1}P{X1,Y0}。 2222442注:求联合分布函数F(x,y)的值时,只需把取值满足≤x,≤y的点(,)的概率找出来,然后求和就可以了。

2,),则X及Y相互独立的充分必要条件是例8 设(X,Y)~N(1,2,12,2=0。

证:(充分性)由于(X,Y)~N(1,2,1,2,),则其X及Y的边缘密度分别为

fX(x)1e21(x1)222122, x

fY(y)当=0时,有

122e(x2)2222, y,

50 / 137

1x12y22f(x,y)exp()()21222111e21(x1)2221122e(y2)2222

fX(x)fY(y),故X及Y相互独立。

(必要性)若已知X及Y相互独立,则对任意x,y,有

f(x,y)fX(x)fY(y),

特别地,取x1,y2,上式变为

1212121212,

从而有 =0。

例9(2001年考研题) 一生产线生产的产品成箱包装,每箱的重量是随机的。假设每箱平均重50千克,标准差为5千克。若用最大载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保障不超载的概率大于0.977。(

(2)=0.977,其中

(x)是标准正态分布函数)。

解:设是汽车装运的第i箱的重量(千克),n为最多可以装的箱数,则X1,

X2,…, 可视为n个相互独立而且服从同分布的随机变量,再设X为n箱的总重

量,则有 ,且

E(Xi)50, =D(Xi)5,而由列维-林德贝格中心极限定理,X近似服从正态分布N(n则所求箱数n决定于条件

, n2

)。

500050nXn5000nPX5000P()0.977 n5nn因(2)=0.977,则有

51 / 137

解之得n<98.02 , 即最多可以装98箱。

例10 设在n重伯努利试验中,每次试验事件A发生的概率都是0.7。 (1)设X表示1000次独立试验中事件A发生的次数,用中心极限定理计算

P{650<X≤750};

(2)要使在n次试验中,A发生的频率在0.68及0.72之间的概率至少为0.9,问至少要做的试验次数n为多少?

解(1)因X~B(1000,0.7),由德莫佛-拉普拉斯中心极限定理得

650npXnp750npP{650X750}Pnpqnpqnpq75070065070050()()2()12(3.5)1

21021021020.9997710.99954.(2)X为n次独立试验中事件A发生的次数,因此,n次试验中,A发生的频率为X,其中X~B(n,0.7),E(X) = 0.7n,D(X) = 0.21n,依题意,n应使

n0.72n0.7n0.68n0.7nXP0.680.72P{0.68nX0.72n}n0.21n0.21n0.02n 210.9,0.21n

由于(1.65) = 0.95,所以,n应使

即 n因此,至少要做1430次试验。

注意:运用德莫弗-拉普拉斯定理计算概率近似值时,其关键是:“标准化”和“正态近似”,n越大所得的近似值越精确。

注:(1)若X~B(n, p),则,其中相互独立且都服从参数为p的0-1分布;

5717.251429.31. 452 / 137

(2)二项分布概率的计算,可总结为下述三种方法; 方法一:X~B(n, p),且不太大(n≤20)时,直接计算。

kknkP{Xk}Cnpq,k0,1,,n。 (q1p).

方法二:当n较大,且p较小(n≥20,p<0.1)时,由泊松定理,可近似计算:

P{Xk}kk!e,np.

方法三:当n较大,而p不太小时,用中心极限定理作正态近似计算 例11 一复杂系统由n个相互独立起作用的部件所组面,每个部件的可靠性(即部件正常工作的概率)为0.9,且必须至少有80%的部件工作才能使整个系统工作。问:(1)n至少为多大时,才能使系统的可靠性不低于0.95?(2)若该系统由85个部件组成,则该系统的可靠性是多少?

解:令{ n个部件中正常工作的部件数},则X~B(n,0.9)。

(1) 由题意应求出n,使得

0.8n0.9nXnp0.8nnpPX0.8n1P1()npq0.90.1nnpq 1(0.1n0.09n)(n)0.953则,n≥24.206。故n至少为25时,才能使系统的可靠性不低于0.95。 (2)所求可靠性为

85Xnp0.885npPX0.8851P)(3.073)0.9989。 (3npqnpq

四、习题三解答

1. 下面两表是否可作为离散型随机变量的分布列?为什么?

53 / 137

0 1

X ﹣1 0 2 ﹣0.5 0.9

X 2 0.6 0.1

P 0.6

解:对表1,因为

P 0.15

P{﹣1}=﹣0.5 <0,

所以不可作为离散型随机变量的分布列。 对表2,因为

pk13k0.60.10.150.851,

所以不可作为离散型随机变量的分布列。

2.一盒中有五枚纪念章,编号为1,2,3,4,5,从中任取3枚,用X表示取出的纪念章的最大号码,求X的分布律。

解:由题意知:X的取值为3,4,5,

P{3}=, P{4}=, P{5}=

故X的分布律为

X P

0 1 2 0.1 0.3 0.6

或 X的分布律为

P{}=, 3,4,5。

3.进行某种试验,成功的概率为3/4,失败的概率为1/4,以X表示直到试验成功所需试验的次数,(1)试写出X的概率分布;(2)求X取偶数的概率。

54 / 137

解:(1)X的概率分布律为

133P{Xk}()k1k,1,2,…

444(2)X取偶数的概率

P{偶数}= P{ 2}+ P{ 4}+…+ P{ 2k}+…

3233333420.2 242k144441151244.设随机变量X的分布列为:

X P

0 1 2 3 0.1

0.4 0.2

p3

求:(l)p3;(2)P{0pk14k0.40.2p30.11,

故 p3=1-0.7=0.3。 (2)P{0(3)则当x<0时,F(x) = P{X≤x} = 0; 当0≤x<1时,F(x){X≤x}= P{0}=0.4;

当1≤x<2时,F(x)= P{X≤x}= P{0} + P{1}=0.4+0.2=0.6;

当2≤x<3时,F(x)= P{X≤x}= P{0} + P{1}+ P{2}=0.4+0.2+0.3=0.9; 当x≥3时,F(x)= P{X≤x}= P{0} + P{1} + P{2}+ P{3} =1。 故X的分布函数为

55 / 137

x00, 0.4, 0 x1F(x)0.6, 1 x2

0.9, 2 x3 x31, 5.设随机变量X的分布列为

X P

-2 0 2

0.4 0.3 0.3

试求:E(X),E(X2),E(35),D(X),D(35)。

解:E(X)=xkpk20.400.320.30.2;

k12(2)0.4020.3220.32.8; E(X)= xk2pk2

33k1E(35)= 3 E(X)+5=3×(﹣0.2)+5=4.4;

D(X)(X2)-[E(X)]2=2.8-(﹣0.2)2=2.8-0.04=2.76; D(35)=9 D(X)=9×2.76=24.84。

6.甲、乙两批原料,过筛后得知颗粒分布如下:

粒 度 180 200 220 240 260

百分比(%) 甲 5 15 60 15 5

乙 20 20 20 20 20

56 / 137

平均说来,哪一批颗粒较粗?哪一批颗粒均匀性较差? 解:令X、Y分别为甲、乙两批原料的颗粒粒度,则

E(X)=xkpk1800.052000.152200.62400.152600.05220

k155E(Y)=ykpk1800.22000.22200.22400.22600.2220

k1 因为E(X)= E(Y),故甲、乙两批原料的颗粒一样粗。

DXxkE(X)pk

2k15222(180220)0.05(200220)0.15(220220)0.6 =

22(240220)0.15(260220)0.05=280

DYykE(Y)pk

2k15222(180220)0.2(200220)0.2(220220)0.2 =

22(240220)0.2(260220)0.2=800

因为D(X)< D(Y),故乙批原料的颗粒均匀性较差。

7.设随机变量X的概率分布

P() =a, 1, 2,…

N试确定常数a,共计算E(X)及D(X)。

解:因 pkk1NaaaaNa1, NNNN故1。

11E(X)=xkpkkNNk1k111E(X)=xpkkNNk1k12

NNkk1N1N(N1)N1;

N22N2kN2k2k1N1N(N1)(2N1)(N1)(2N1)

N6657 / 137

(N1)(2N1)N12N21()D(X)(X)-[E(X)]=

62122

2

8.设X服从的概率分布为:

P{}1,(1,2,…),

其中0p是常数,则称X服从参数为p的几何分布g(p)。试求E(X)。

解一: E(X)=(0xk1kpkkpqk1k1pkqk1p(12q3q2),

k1又 q E(X)=p(q2q23q3) 则 E(X)-q E(X)(12+…)

故 E(X)= 11; 1q11=。 1qpk1解二: E(X)kpqk1pkqk1

k1现求级数的和。由于

(0对此级数逐项求导,得

dkdk(q)(q)kqk1, dqk0k0dqk1因此 kqk1k1d11(), 2dq1q(1q)从而 E(X)p111p。 22(1q)pp 9. 设随机变量X的概率密度为

Cx, 0x1 f(x) 其他0, 试求:(1)常数C;(2)X落在(0.3,0.7)内的概率;(3)分布函数F(x);

58 / 137

(4)E(X)。

解:(1)x21Cf(x)dxCxdxC[]01, 故2。

0221 0.70.7.722(2)P{0.3X0.7} 0.3f(x)dx 0.32xdx[x2]00.30.70.30.4

(3)当x<0时,F(x) f(x)dx 0dx0;

xx2; 当0≤x<1时,F(x) f(x)dx 0dx 02xdx[x2]0 x 0x x x当x≥1时,F(x) f(x)dx 0dx 02xdx 10dx[x2]101。 即 X的分布函数为

0, x0F(x)x2, 0 x1

1, x1 x 01 xx312(4)E(X)xf(x)dx0x2xdx[2]0。

331 10.设随机变量X的分布函数为

1ex, x0F(x)

0, x0试求:(1)P{X<4},P{X>1};(2)概率密度函数f(x)。

解:(1)P{X<4}(4)=1-4,

P{X>1}=1-P{X≤1}=1-F(1)= 1-(1-e -1)= 1

ex, x0 (2)f(x)F(x)

x00, 11.设随机变量X的概率密度为

0x1x, f(x)2x,1x2

0, 其他59 / 137

试求(1)分布函数F(x);(2)数学期望E(X)。

解:(1)当x<0时,F(x) f(x)dx 0dx0; 当0≤x<1时,F(x)  x x x xx2; f(x)dx0dxxdx  02 0x当1≤x<2时,F(x) f(x)dx 0dx 0xdx 1(2x)dx

1x21x2(2x)(2)2x1 2222 01 x当x≥2时,F(x) x f(x)dx0dxxdx(2x)dx0dx

 0 1 2 01 2 xx21x22[]0[2x]11。 22即X的分布函数为

x00, 2x, 0 x12F(x)2

x2x1, 1 x22 x21, (2)E(X)xf(x)dx 0xdx 112 2x31x322x(2x)dx[]0[x]11。

3312.设随机变量X在(0,5)上服从均匀分布,求方程4t2 + 4 + (2)=0中,

t有实根的概率。

解:随机变量X服从的均匀分布为

10x5, f(x)5 其它,0, 为使方程4t2 + 4 + (2)=0中的t有实根的充要条件是

Δ= (4X)2-4×4(2)=16X2-16X-32≥0,

60 / 137

即 X2-X-2≥0 则所求概率为

P{ X2-X-2≥0}= P{ (X-2)(1)≥0}= P{X≥2且X≥﹣1} { X≤2且X≤﹣1}

{X≥2} { X≤﹣1}0=。

13.某车间有20台车床独立工作,每台车床开车时间占总工作时间的0.3,又开车时每台车床需用电力是1单位,问:(1)车间需要电力的最可能值是多少单位?(2)若供给车间9单位电力,则因电力不足而耽误生产的概率等于多少?(3)供给车间至少多少单位电力,才能使因电力不足而耽误生产概率小于1%?

解:设X为20台车床中开车的车床数,则X服从二项分布B(20, 0.3)。 (1)因为

(1)21×0.3=6.3

非整数,故对6.3取整得[6.3]=6,即车间需要电力的最可能值是6单位电力。

(2)所求概率为(查附表2)

k(0.3)k(0.7)20k0.04796 P{X>9}= P{X≥10}=P{Xk}C20k10k102020(3)设供给车间m单位电力, 则电力不足的概率为

P{X>m}= P{X≥1}=

km1P{Xk}Ckm12020k20(0.3)k(0.7)20k0.01

对20, 0.3, 查附表2得 1=12, 故11,即至少供给车间11单位电力。 14.设X服从二项分布B(2,p),Y服从二项分布B(3,p), 若已知P{X≥1}=5/9, 试求P{Y≥1}的值。

解:因X服从二项分布B(2,p),又

P{X≥1}=1-P{0}=1-(1-p)2=

则 (1-p)2=1-=,1-p =,

5499235961 / 137

故p =。

又因为Y服从二项分布B(3,p), 即B(3,),故

3P{Y≥1}= 1-P{0}=1-(1-p)3 =1-=()13132319。 2715.某地胃癌的发病率为0.01%,现普查5万人,试求(1)没有胃癌患者的概率;(2)胃癌患者少于5人的概率。

解:设X为胃癌患者人数,则X服从二项分布B(50000,0.0001)。因为50000很大,而0.0001非常小,算。

(1) 所求概率为

50000×0.0001=5,故可利用泊松近似公式进行计

P{0}=0.999950000≈5=0.00674

(1) 所求概率为

P{X<5}=1-P{X≥5}=1-

5000050000k5Ck50000(0.0001)k(0.9999)50000k

1k55k5e10.55950.4405。 k!16.一电话交换台每分钟接到的呼唤次数服从参数为4的泊松分布,试求:(1)一分钟内有8次呼唤的概率;(2)一分钟内呼唤次数大于10的概率。

解:设X表示电话交换台每分钟接到的呼唤次数,则X服从的分布为

P{}=,1,2,…;

(1)P{8}0.02977; (2)P{X>10}= P{X≥11}=。

17. 设X~N(5, 22),查表计算概率:(1)P{4≤X<7};(2)P{>1}。 解:(1)P{4≤X<7} = (1)-(1-

(1)-

(﹣0.5)

(0.5)=0.8413-1+0.6915=0.5328

(0.5))= (1)-1+

62 / 137

(2)P{>1}= 1-P{≤1} =1-P{﹣1≤X≤1}=1-[]

=1-[

(﹣2)-

(﹣3)]= 1-[1-

(2)-1+(3)]=1+

(2)-(3)

=1+0.9773-0.9987=0.9786

18.将一温度调节器放置在贮存某种液体的容器内,调节器调整在d℃,则液体温度X是一个随机变量,且X~N(d,0.52)。(1)若90,求X<89的概率;(2)若要保持液体温度至少为80℃的概率不小于0.99,问d至少为多少?

解:(1)因X~N(90, 0.52), 则 P{X<89}

(﹣2)= 1-

(2) =1-0.9773=0.0227

(2)依题意应有

P{X≥80}≥0.99,

即 P{X≥80}=1-P{X≤80} =1-≥0.99,

则 ≥0.99, 查表得 ,

故 d ≥ 80+0.5×2.33=81.165。

19.某工厂生产的螺栓长度()服从参数

=10.05, =0.06的正态分布,

如果规定长度在10.05±0.12内为合格品,求任取一螺栓为不合格品的概率。

解:螺栓为合格品的概率

P{10.05-0.1210.050.1210.0510.050.1210.05)()

0.060.06(2)-1=2×0.9773-1=0.9546

则螺栓为不合格品的概率

1-0.9546=0.0454。

20.设X~N(等于多少?

解:因X~N(

,

2

,

2

),若P{-|),则

63 / 137

P{-|则 , 故。

CCCCC)() 21.设随机变量X~N(60,3),求分位数x1,x2,使X分别落在区间(﹣∞,

2

x1),(x1,x2),(x2,+∞)内的概率之比为3∶4∶5。

解:设X落在(﹣∞,x1),(x1,x2),(x2,+∞)内的概率分别是p1、p2和p3,由题意p123=1,且

p123=3:4:5

由此计算得

p1=,p2,p3=

则 P{X故 x1=60-3×0.68=57.96

又 P{X>x2}=1-P{X≤x2}=1-,

(x26057)10.5833 31212则 ,

故 x2=60+3×0.21=60.63。 因此所求分位数是x1=57.96,x2=60.63。

22.设随机变量X的密度函数为

64 / 137

试求:(1)Y1=2X;(2)Y2的数学期望。

2。 解:(1)E(Y)E(2X) 2xfxdx 02xexdx[2xe-x2e-x]0  2X(2)E(Y2)E(e2X)e  2xfxdx  0e2xxedx  011e3xdx[e-3x]0。

3323.已知随机变量X的概率分布为

X P

-2 1/8

-0.5 1/4

0 1/8

0.5 1/6

4 1/3

试求下列随机变量的分布律:(1)21;(2)X2;(3)sin(X)。

2 解:

X 21

﹣2 ﹣3 4 0 1/8

﹣0.5 0 0.25

0 1 0 0 1/8

0.5 2 0.25

24 9 16 0 1/3

X2

sin(2X)

1/4

P

1/6

(1)则21的分布律为

21

﹣3 1/8

0 1/4

1 1/8

2 1/6

9 1/3

P

(2)则X2的分布律为

65 / 137

X2 P (3)则sin(X)的分布律为

2sin(0 1/8

0.25 5/12

4 1/8

16 1/3

2X) 1/4

0 7/12

22 P

1/6

24.设随机变量X的概率密度为

试求2X的密度。

解一:当X的取值为(0, 1)时,函数2x在(0, 1)内严格单调,其取值为(0, 2)。

当y≤0时,(y){Y≤y}=0,

则 fY(y)F(y)0;

当0y20y}= 21y1fX()y; 222则 fY(y)F(y)(fX(x)dx)fX()()当y≥2时,(y){Y≤y}=1,

yy22 则 fY(y)F(y)0。

故Y的密度为

10y2  y, fY(y)2其它0 解二:考察2X的对应函数y =2x,在(x)的非零区间(0,1)上,

y '=2>0,

66 / 137

则y =2x为严格单调增加函数,其取值范围是(0,2),故可利用定理公式法。

由y =2x得其反函数为

y1xh(y) , h'(y),

22故Y的密度为

y11)|h'(y)|0y2)||f(f(y, Xh(y) fY(y)X222 0,  其它 0, 0, 25.已知球体直径X在(a,b)内服从均匀分布,其中0解:球体直径X服从的均匀分布为

1,axbfxba

其它,0, 6b3)。

(1)球体积为

Y =,

显然对应函数y =x3在(a,b)上为严格单调增加函数,其对应取值范围是

1613(,b),

6故可利用定理公式法。

由y =x3得其反函数为

1633xh(y)() , h'(y)()y,

36y131216故Y的密度为

67 / 137

1126y16)|h'(y)|f(f()3)|()3y3|Xh(y)X(fY(y)30, 0, 1611()y, a3yb33(ba)660, 其它 1323

(2) P{013= 0116Cdx[()3a] baba126.从一只装有3支兰笔、2支红笔、3支绿笔的盒子中,随机抽取2支,若X、Y分别表示抽出的兰笔数和红笔数,试求(X,Y)的联合分布律。

解:(X,Y)的联合分布律为

iC3C2jC32ijP{Xi,Yj}pij,C82i,j0,1,2;0ij2

或者

Y

X 2 0

0 1

1

2

27.已知(X,Y)的联合概率分布为

68 / 137

X 1

Y

1 2 3

116 9113a

2

1 18

1b试问:为何值时相互独立? 解:由性质得

t1j1pij231111111; 69183ab又若X, Y相互独立,应有

p12p1p2,

11111即 1()()

969189a联立上列两式,解之得:

28. 设(X, Y)的联合密度为:

Axy, 0x1, 0y1 f(x,y)0, 其它,试求:(1)常数A;(2)边缘密度fX(x),fY(y);(3)X及Y是否相互独立?

11解:(1)因 f(x,y)dxdy00Axydxdy

1A(1xdx)(00ydy)

故A = 4。

(2)X的边缘密度为

69 / 137

fX(x)y214xydy4x[]02x, 0x1f(x,y)dy 2其它 0, 0 0 10Y的边缘密度为

fY(y)x214xydx4y[]02y, 0y1f(x,y)dx 20, 其它 0 0 10 (3)由(2)解得的边缘密度可得

2x2y,0x1,0y14xy,0x1,0y1f(x,y) fX(x)fY(y)其它其它0,0,故X及Y相互独立。

29.设随机向量(X,Y)服从正态分布,并且已知

E(X) = 0,E(Y) = 0,D(X) = 16,D(Y)=25,(X, Y) = 16,

求(X, Y)的概率密度f(x, y)。

解:因随机向量(X,Y)服从正态分布,则其联合分布密度为

f(x,y)1212x121x1y2y22exp()2()()() 2212212(1)1又已知

E(X) = 0,E(Y) = 0,D(X) = 16,D(Y)=25,(X, Y) = 16,

1

=0,

2

=0,1216, 2225,

160.8

1625=CovX,YDXDY故所求密度为

70 / 137

f(x,y)1xyy2x2exp()20.8()()()2244552(10.8)24510.8125x12yexp()2xy()224255184

30.已知D(X)=25,D(Y)=36,解:因为

0.4,试求D()和D(X-Y)。

又已知D(X)=25,D(Y)=36,0.4。

则 CovX,YXYDXDY0.4253612 故 DXYDXDY2CovX,Y253621285

DXYDXDY2CovX,Y253621237

31.设随机变量X的E(X)=12,D(X)=9,用切比雪夫不等式估计P{6解:由切比雪夫不等式得

P{629= P{-E(X)|<6}1210.75

636故P{632.某炮群对空中目标进行80次射击中,每次炮弹命中颗数的目标期望值为2,标准差为1.2。求当射击80次时,命中目标的炮弹总颗数在130颗到190颗范围内的概率近似值。

解:设第i次射击炮弹命中颗数为, 则由题意,

()=2,

=

()=1.2,1,2,…,80。

因80为大样本问题,则由勒维-林德贝格中心极限定理,80次射击中命中目标的炮弹总颗数

~N(n, n2

) (近似)

71 / 137

故所求概率近似值为

P{130≤≤190}(190n)(130n)(nn190160130160)() 115.2115.2(2.795)(2.795)2(2.795)1=2×0.9974-1=0.9948。

33.根据孟德尔遗传理论,红、黄两种番茄杂交第二代红果植株和黄果植株的比例为3:1。现在种植杂交种400株,试求黄果植株在83和117之间的概率。

解:设X为黄果植株数,则X服从4001的二项分布B(400, 1)。又

44E(X)100,D(X)75

因400很大,则由中心极限定理,所求概率为

117np83np11710083100P83X117()()()()npqnpq75752(1775)12(1.96)120.97510.95

34.某计算机网络有120个终端,每个终端有5%的时间在工作。假设各终端工作及否相互独立,求终端工作的个数X在10~20个之间的概率。

解:由题意,终端工作的个数X服从1200.05的二项分布B(120, 0.05)。又

E(X)6,D(X)5.7

因120很大,则由中心极限定理,所求概率为

P10X20(20np10np206106)()()() npqnpq5.75.7(5.86)(1.675)10.95350.0465。

五、 思考及练习

(一)填充题

72 / 137

1.设随机变量X的分布函数为

若x-10 若-1x10.3 F(x)P(Xx)若1x30.8 1 若x3则X的分布律为

X P

-1

1

3

2.已知X服从二项分布B(n,p),且6,D(X)=4.2, 则 , 。 3.设随机变量X1, X2相互独立,且X1服从二项分布B(20, 0.7);X2服从=3 的泊松分布P(3)。记

1

-2X2+2,则E(Y )= ;

D(Y )= 。

4.已知E(2X) = 4,D(3X) = 18,则E(X2) = 。

5.设随机变量(X,Y)取下列数组(0,0),(-1,1),(-1,2),(1,0)的概率依次为1,1,1,5,其余数组处概率为0,则 。

2cc4c4c6.(2001年考研题)设随机变量X的方差为2,则根据切比雪夫不等式有估计PXE(X)2 。

7.(2003年考研题)设总体X服从参数为2的指数分布,X1, X2,…, 为来自总体的简单随机样本,则当n

时,依概率收敛于 。

(二)选择题

1.设离散型随机变量X的概率分布为

PXkabk (k1,2,;),

其中a0,b0为常数,则下列结论正确的是( ).

73 / 137

A. b是大于零的任意实数 B. b = a + 1 C. b1. D. b1.

1aa1 2. 设有一群人中受某病感染患病的占20%.现随机地从此群人中抽出50 人, 则患病人数的数学期望和方差分别为( )

A. 25和8 B. 10和2.8 C. 25和64 D. 10和8

3. 设X1、X2是随机变量,其数学期望、方差都存在,C是常数,下列命题中

(1)E(1)(X1); (2)E(X12)(X1)(X2) (3)D(C X1)2D(X1) (4)D(X12)(X1)(X2)

正确的有( )

A. 4个 B. 3个 C. 2个 D. 1个 4.正态分布有两个参数μ及

,( )相应的正态曲线的形状越扁平。

越大 越小

A. μ越大 B. C. μ越小 D.

5.随机变量X,Y的相关系数ρ = 0,则下列错误的是 ( )

A. X,Y必相互独立 B. X,Y必不相关

C. 必有E() = E(X)E(Y) D. 必有D(X + Y) = D(X) + D(Y) 6.(2002年考研题)设随机变量X1, X2,…, 相互独立, X1 + X2 + … + ,则根据列维-林德伯格中心极限定理,当n充分大时, 近似服从正态分布,只要X1, X2,…, ( )

A. 有相同的数学期望 B. 有相同的方差

C. 服从同一指数分布 D. 服从同一离散型分布

74 / 137

(三)计算题

1.C取何值时,下列数列成为概率分布律:

k2k(1)(),1,2,3;(2)

k!3,1,2,…。

2.设随机变量X服从泊松分布P(λ),且已知P{1}{2},求P{4}。 3.设离散型随机变量X的可能取值为x1,x2(x1<x2),且已知

3276 P{Xx1}, P{Xx2}, E(X), D(X)55525求X的概率分布。

4.一电子仪器由200个元件构成,每一元件在一年的工作期内发生故障的概率为0.001。设各元件是否发生故障是相互独立的,且只要有一元件发生故障,仪器就不能正常工作。求:(1)仪器正常工作一年以上的概率;(2)一年内有2个以上元件发生故障的概率。

5.大炮射击某目标的横向偏差X~N(0,102)(单位:m),试求: (1)在一次射击中X绝对值不超过15m的概率;

(2)在两次射击中至少有一次X绝对值不超过15m的概率。 6.某厂生产的电子管寿命X(小时)服从参数试问

0

=160, =

0

的正态分布,

为何值时能使P{120<X<200}=0.8。

7.设某公共汽车站每隔10分钟有辆车,则在任一时刻乘客到达该站后的候车时间X(单位:分钟)将服从均匀分布U[0, 10),试求P(X≤1),P(18.设随机变量X服从几何分布g(p):

P{}-1,1,2,…,q =1-p,

1, x为偶数时,f(x)

1, x为奇数时,试求 (X)的分布律。

75 / 137

9. 设随机变量X及Y相互独立,下表列出了二维随机变量(X,Y)的联合分布律及关于X和关于Y的边缘分布律中的部分数值,试将其余数值填入表中的空位处:

Y X P{X = } = · y1 y2 y3 x1 1 8 x2 P{Y = } = p·j

1 816 1 10.设随机变量X及Y相互独立,且

EXEY0,D(X)D(Y)1,

试求E[()2]、D(352)。

11.(1988年考研题)某保险公司经多年的资料统计表明,在索赔户中被盗户占20%,在随意抽查的100家索赔户中被盗的索赔户数为随机变量X。

(1)写出X的概率分布;

(2)利用德莫佛-拉普拉斯定理,求被盗的索赔户数不少于14户且不多于30户的概率的近似值。

12.某病的患病率为0.005,现对10000人进行检查,试求查出患病的人数在[45,55]内的概率。

六、 思考及练习参考答案

(一)填充题

76 / 137

1. P{﹣1}= F(﹣1)-F(﹣1-0)=0.3-0=0.3

P{1}= F(1)-F(1-0)=0.8-0.3=0.5 P{3}= F(3)-F(3-0)=1-0.8=0.2

X P

﹣1 0.3

1 0.5

3 0.2

2. 20 ,0.3 3. ﹣2.6,16.2。

E(X1) = 1.4,D(X1)= 4.2;E(X2) ==3,D(X2)= =3;故 E(Y )= E(X1-2X2+2 )= E(X1)-2 E(X2)+2=﹣2.6; D(Y )= D(X1-2X2+2 )= D(X1)+4 D(X2)=16.2。

4. 6 5. 3

6. 。PXE(X)27.1/2

12DX21 2422(二)选择题

1. C。因pkababka(kk1k1k1b)1, 故 1b2. D

3. C。正确的是(1)E(1)(X1);和(2)E(X12)(X1)(X2)。 4. B 5. A

77 / 137

6. C。注意:离散型分布的方差不一定存在有限。

(三)计算题

1.(1)27/38。注意,k仅取1,2,3。 (2)1/(e―1)。由Ck1kC()C(e1)1得。

k!k1k!k2.。

提示:先由P{1}{2},即解得λ=2。 3. E(X2)D(X)E(X)264911,由题中条件得方程组 25255E(X)x1E(X2)x12327x2 55531122x2 555解之得x1=1,x2=2。故所求概率分布为

X P

1 0.6

2 0.4

4.设{一年内200个元件中发生故障元件的个数},则

kP{Xk}C200(0.001)k(0.999)200k≈,1,2,…,200

(1)P{0}=0.999200≈0.2= 0.8187;

(2)P{X≥2}≈。(查表得) 5.(1)P1= P{≤15} {﹣15≤X≤15}=

=2

(1.5)-1= =2×0.9332-1=0.8664;

(2)P2=1-(1-P1)2=0.9822 6.应求出

0

,使得

78 / 137

P{1200)(0)2(400)10.8

即 , 查表得,故

0

=31.25。

7. X服从的密度为

10x10, f(x)100, 其它,则 P{X1}f(x)dx  0P{1X3}f(x)dx13 3 1 111dx=0.1 101011dx=0.2 11058. P{﹣1}= P{X为偶数}= P{2}+ P{4}+ P{6}+…

= 3+ 5+…= p( q35+…)=

q 1qP{1}= 1-P{﹣1}=1-

故 (X)的分布律为

q1= 1q1qX P

-1

q 1q1

1 1q9.利用

pipij,p.jpij,

ji及独立性

79 / 137

pijpip.j

依次可求解得。

如: ,则 而 ,则;

,p13最终可得

1111(),…, 424812Y X y3 x1 111 24812131 8841434P{X = } = · y1 y2 x2 P{Y = } = p·j 111 6231 10.E[()2]= D()+ [E()] 2=2;D(352)= 9D(X)+25D(Y)=34。

11.(1)100家索赔户中被盗的索赔户数X~B(100, 0.2),即X分布律为

kP{Xk}C100(0.2)k(0.8)100k,k0,1,2,,100.

(2)由 = 100×0.2 = 20,npq1000.20.84, 利用德莫佛-拉普拉斯定理知

14npXnp30npP{14X30}Pnpqnpqnpq30np14np()()(2.5)(1.5)(2.5)(1.5)1

npqnpq0.9940.93310.927.80 / 137

12.检查10000人中患病人数X~B(10000,0.005) ,则

= 10000×0.005 = 50,npq100000.0050.9957.053

利用德莫佛-拉普拉斯定理知所求概率为

P45X55(55np45np55)()()()7.0537.053 npqnpq2(0.709)120.761110.5222

第四章 抽样分布

一、学习目的和要求

1. 正确理解总体、样本、统计量等数理统计的基本概念; 2. 了解

2

分布、t分布、F分布定义及其性质和应用;

81 / 137

3. 熟练掌握查表求4.了解用计算

2

2

分布、t分布、F分布的临界值;

分布、t分布、F分布的概率和临界值。

二、内容提要

(一)数理统计的基本概念 名 称 定 义 特 性 意 义 将总体理解为服从利用随机变量X总体X 研究对象的全体X 某一分布的随机变的性质来研究量X 总体 X1,X2,…,满足: 样本具有二重性: 样本是从总体样本 X1,X2,,Xn1.(独立性)相互(1) 随机变量 中随机抽取部 独立; X12,…(理论分析) 分个体组成,用于推断总体有2.(代表性)及总(2) 观察值 体X同分布。 x12,…(数值计算) 关统计特征 泛指时为随机变对样本所含信量,特指时为相应息进行加工提数值 炼,用于估计推断总体参数 统计量 (X1, 样本X1, X2,…, 的不含任何未知参数的函数 X2,…, ) (二)常用统计量 名 称 样本均值 X定 义 应 用 意 义 用于分析总体刻画了样本的位置(集 均值E(X),且中)特征,反映样本观有 察值的平均水平。 82 / 137

用于分析总体刻画了样本的离散特样本方差 1nS(XiX)2n1i12n12(Xin(X)2n1i1S 2 方差D(X),且征,反映样本观察值偏)有 离样本均值的分散程E(S2) = D(X) 度。 S及的度量单位刻画样本观察值偏离样样本标准差 SS2 一致 本均值的绝对偏差,且及取值数据的量纲一致。 S 反映样本的相刻画样本观察值偏离样变异系数 对离散程度的本均值的相对偏差,可无量纲统计量 用于比较不同均值样本相对变异程度 标准误 Sx 反映样本均值用来衡量以样本均值来 的变异程度 推断估计总体均值时的平均误差 (三)统计三大常用分布 名 称 定 义 1. X~22性 质 (n),则E(X) = n,D(X) 分设X1, X2,…, 相互独立,均= 2n 服从N(0,1),则~22布2 (n) 2. X~2(n1),Y~2 (n2)且X2(n) 其中n为分布的自由度 及Y独立, 则 X + Y~+ n2) (n1 83 / 137

t分布t(n) 设X~N(0,1),Y~2 (n),1. t1-(n) =﹣t (n) 且X及Y相互独立,则~t(n) 2. 当n→∞时,t(n)的极限分布其中n为设X1~22分布的自由度 2就是N(0, 1) 1. 设T~t(n),则T~F(1,n) 2F分布F(n12) (n1),X2~ (n2),2. 设F~F(n1, n2),则1~F(n2, 且X1及X2独立,则~F(n12) 其中n12为2n1) 3. F1(n1,n2)1 F(n2,n1)分布的自由度 (四)正态总体的抽样分布 总体 类 型 抽样分布 说明 X作为正态变量的线性 样本均值X 单个 正态总体 样本方差S2相关抽样分布 两个 正态总体 样本方差之比 的抽样分布 2Sx/12~F(n11,n21) 22Sy/2组合仍服从正态分布 X的标准化变量服从标 的抽样分布 准正态分布 将中的换成S,相应分 布由N(0, 1)修正为t(n-1) S2及X还是相互独立的 用于两个总体方差的统计推断 84 / 137

用于两个总体均值的统样本均值之差 的抽样分布 2当122时 计推断 ~t(n1n22)(XY)(12)11Sn1n2 其中 S222(n1)Sx(m1)Syn1n22

三、综合例题解析

例1 (1999年考研题)在天平上重复称一重为a的物品,假设各次称量结果相互独立且同服从正态分布N(a, 0.22),若以Xn表示n次称量结果的算术平均值,则为使

PXna0.10.95

n的最小值应不小于自然数 。

解:设应抽取的样本容量为n,因为代表称量结果的总体X~N(a, 0.22),则

0.22XnaXn~N(a,), 且 ~N(0,1),

n0.2/n由临界值意义和正态分布表(附表3)可知

PUu/210.95

则=0.05,而u/2

0.025 = 1.96,因此

XnaPu0.0250.95, 0.2/n即 PXna0.21.960.95 n由题意可知,n应满足

85 / 137

0.21.96即 n15.37,

0.12因此可取n =16,此时必有

PXna0.10.95,

2故n的最小值应不小于自然数16。

例2 现有两个来自正态总体N(20,3)的样本容量分别为10,15的独立样本,试求其均值差的绝对值大于0.3的概率。

解:分别用X,Y表示样本容量为10,15的两个独立样本的均值,则

3X~N(20,),1023Y~N(20,).

152由于两个样本相互独立,故X及Y相互独立,由正态分布的性质,易知

33XY~N(2020, ),

101522即 XY~N(0,(因此

12)2), XY1/2~N(0, 1)

0.3XYP{XY0.3}P2[1(0.32)] 1/21/22[1(0.42)]2[10.6628]0.6744.注意:正态分布的可加性的正确使用和应用附表计算正态概率时要注意随机变量的标准化。

例3 设从正态总体N(

S2求概率P{2>1.666}。

S2解:虽然2服从的分布未知,但由定理知

,

2

)中随机抽取一个样本容量为16的样本,试

86 / 137

其中自由度n-1=15, 故有

2

(n-1)

P{

现应求

S22>1.666}= P{>(n-1)×1.666}= P{>24.99}=

的值。因

2

=~

2

(15),

由上侧临界值意义知,有

现对15,查

2

2

(15)=24.99。

(15)分布表(附表5)得

= P{>24.99}=0.05,

所以 P{

S22>1.666}= =0.05。

例4(1998年考研题)设X1,X2,X3,X4是来自正态总体N(0, 22)的简单随机样本,Ya(X12X2)2统计量Y服从

2

b(3X34X4)2,则当 a = ,b = 时,

分布,其自由度为 。

解:由已知~N(0, 22)(i = 1, 2, 3, 4)且X1,X2,X3,X4相互独立,则对

X1-2X2,有

E(X1-2X2)=0,D(X1-2X2)= D(X1)+4D(X2)=20

从而

X12X2~N(0, 20), X12X225~N(0,1)

同理可得

3X4X43X34X4~N(0, 100), 3~N(0,1).

10由

2

2

变量的构成知,两个服从N(0, 1)的独立的随机变量的平方和应服从

(2)分布。因此

87 / 137

X12X23X34X4Y1025 11(X12X2)2(3X34X4)2~2(2)2010022对照题目条件,应得

a11,b, 20100其自由度为2。

四、习题四解答

1.总体X~N(

,

2),其中

未知,

2为已知参数,X1,X2,…,是

从总体抽取的一组样本,则下列各式中哪些属于统计量?

1Xii1n2; 22X ; 3XX;iii1i1nn41222521X1X2X3; 612X1X2Xn; n3Xi1n

2i.解:因为是未知参数, 2为已知参数,故 (1)、(3)、(4)、(6)是统

,不属于统计量。

计量,而(2)和(5)均含有未知参数

2.设对总体X得到一个容量为10的样本值:

4.5, 2.0, 1.0, 1.5, 3.5, 4.5, 6.5, 5.0. 3.5, 4.0

试求样本均值x、样本方差S2和样本标准差S。

解:解:(1)xi4.52.04.036,10

i110xi1102i4.522242155.5

样本均值

88 / 137

n112(xinx2)(155.5103.62)2.878 样本方差 Sn1i192样本标准差 SS2=2.88≈1.697。

3.在总体N(52, 6.3)中随机地抽取一个容量为36的样本,求样本平均2

值X落在50.8到53.8之间的概率。

解:因为总体X~N(52, 6.32

),则

X~N(52, 6.3236) 故所求概率为

P{50.8≤X≤53.8}=(53.8521.05)(50.8521.05)

= (1.714)-

(-1.143)= (1.714)-1+(1.143)

=0.9564-1+0.8729=0.8293。 4.查表求下列各临界值 (1)

20.01

(10),2

0.10(12),20.99(60),

20.95(16);

(2)t0.10(4),t0.99(10),t0.05(12),t0.975(60);

(3)F0.99(10, 9),F0.95(10, 9),F0.10(28, 2),F0.05(10, 8)。 解:(1)查

2

分布表(附表5)及制表公式P{

2

>

2

(n)} =20.01

(10)=23.209,2

0.10

(12)=18.549,

2

(60) ≈10.99

2(u1)210.992602(u0.012601)2

12(2.332601)236.797, 2

0.95

(16)=7.962;

(2)查t分布表(附表6)及制表公式P{t >t(n)}=

可得

t0.10(4)=1.5332,t0.99(10)=﹣t0.01(10)=﹣2.7638,

89 / 137

可得

t0.05(12)=1.7829,t0.975(60)≈ u0.975=﹣u0.025=﹣1.96;

(3)查F分布表(附表7)及制表公式P{F >F(n)}=

可得

F0.99(10, 9)=

110.202,

F0.01(9,10)4.94F0.95(10, 9) 110.331,

F0.05(9,10)3.02F0.10(28, 2)≈9.46,F0.05(10, 8)=3.35。

5. 已知随机变量T~t(n),求证:T2~F(1, n)。 证:因为随机变量T~t(n),则有X~N(0,1), Y~独立,使得

2

(n), 且X及Y相互

T =

X2则 T =

Y/n2

易知X2~

2

(1), Y~

2

2

(n), 且X2及Y相互独立,由此得

X2T =~F(1, n)。

Y/n6. 已知随机变量F~F(n12),试证随机变量 证明:因为随机变量F~F(n12),则有X1~相互独立,使得

1~F(n21)。 F2

(n1), X2~

2

(n2),且X1及X2

F~F(n12)

则有 由F分布的定义知有

1~F(n21)。 F

五、思考及练习

90 / 137

(一)填充题

1.设总体X~N(μ, ),其中μ,

2

2

为已知数,X1,X2,…,来自X2

的一个样本,X,S分别是样本均值和方差,且相互独立,则样本均值X~

分布,而统计量~ 分布,统计量~ 分布,统计量~ 分布。

2.设x1,x2,…,x20是来自N(10, 1)的一个简单样本, x是其样本均值,则x服从 分布,E(x)= ,D(x)= ;P{x>10}= 。

3. (1997年考研题)设随机变量X和Y相互独立而且都服从正态分布N(0, 32),而X1,X2,…,X9和Y1,Y2,…,Y9分别是来自总体X和Y的简单随机样本,则统计量

服从 分布,参数为 。

4.设Q,U是两个相互独立的随机变量,并且已知

Q2~2(np1), U2~2(p),

其中2为常数,则服从 分布;服从 分布。

(二)选择题

1.关于随机抽样,下列哪一项说法是正确的( )。

A.抽样时应使得总体的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体

D.为确保样本具有更好的代表性,样本量应比较大 2. (2003年考研题)设随机变量X~t(n)(n>1),,则

91 / 137

A. Y~2(n) B. Y~2(n1) C. Y~F(n,1) D. Y~F(1,n)

(三)计算题

1. 设X1,X2,…,X10是来自总体X~N(μ, 42)的简单随机样本,已知

P{S2a}0.1,试求a的值。

2.求以下各分布的临界值 (1)P{

2

(21)>λ} =0.025; (2)P{

2

(21)<λ}=0.025;

(3)P{t(4)>λ}=0.99; (4)P{(4)|<λ}=0.99; (5)P{t(4)<λ}=0.1; (6)P{

2

(15)<λ}=0.95。

五、思考及练习参考答案

(一)填充题 1. , N(0,1),t(1),

2. , 10, 1/20;0.5 3. t , 9 4. F(1) ,

2

2

(1)

(1)

(二)选择题

1. A 2. C

(三)计算题

(n1)S2(n1)a9S29a1.P{Sa}PP20.1 22164292 / 137

9S2因2~42

(9),则=14.684,解之得26.1。

2.注意各分布临界值表的制表公式。 (1)

20.025

(21)=35.479; (2)2

0.975(21)=10.283;

(3)t0.99(4)=﹣t0.01(4)=﹣3.7469; (4)t0.01/2(4)0.005(4)=4.6041; (5)t0.9 (4)=﹣t0.1(4)=﹣1.5332; (6)

20.05

(21)=24.996。

第五章 参数估计

一、学习目的和要求

1.理解点估计及区间估计的概念和基本思想; 2.掌握点估计的矩估计法;

93 / 137

3.了解最大似然估计法; 4.了解估计的优良性;

5.熟练掌握正态总体参数(均值和方差)的区间估计; 6.掌握二项分布总体率的区间估计; 7.了解泊松分布的区间估计;

8. 了解用进行正态总体参数的点估计及区间估计的运算。

二、内容提要

(一)总体参数的点估计法 点估计法 设未知参数为θ1,θ2 用样本矩估计相矩估计法 应的总体矩,从而得到总体未知参数的估计值 1. 由总体X的分布计算E(X),E(X2) 2. 解方程组 基本思想 计算步骤 得θ1,θ2的矩估计ˆ1,ˆ2 设未知参数为θ 1. 写出似然函数 最大似然 估计法 根据样本来选择参数,使得该样本出现的可能性最大 2. 选择方程 nP(xi,),离散型 i1L()nf(xi,),连续型i1,使L()最大。即解似然dL()0或 d94 / 137

3. 解之得ˆ即为θ的最大似然估计

(二)估计量的判别标准

判别标准 无偏性 定 义 ˆ)E(备 注 样本均值X是总体 设ˆ1,ˆ2均为的无偏估计均值的无偏一致有效性 量,若D(ˆ1)D(ˆ2),则称ˆ1比估计量; 2样本方差是总体Sˆ2有效 方差2的无偏一致对任意给定的0,有 估计量; ˆlimP1, n样本率p是总体率P即ˆ依概率收敛于 的无偏一致估计量。 一致性 

(三)总体参数的区间估计 总体分布 参 数 条 件 已知 21001%置信区间 xu ,xunn22均值 正态分布  未知 2SSxtn1 ,xtn1nn222未知 大样本(n30) 方差  2xu ,xunn22未知 95 / 137

大样本二项分布 总体率P (n30) 小样本(n <30) 大样本pu2p(1p),pun2p(1p) n查附表8 XXXX nun,nun22泊松分布 参数  (n30) 小样本(n <30) 查附表9

三、综合例题解析

例1 设是总体分布中的未知参数,X1,X2n(X1,,Xn)的均值及方差都存在且满足条件

,Xn是其一个样本,若

E(n),limDn0

n证明n是的一致估计量。

证:我们可应用切比雪夫不等式并结合定义加以证明。由题设已知

E(n)

由切比雪夫不等式,知对于任意的>0,有

PnPnEnnDn20n

由一致性的定义,可知n是参数的一致估计量。

注意:若n是的无偏估计量,且limDn0,则n必是的一致估计量,这一点可以直接作为结论使用。

例2 设X1,X2,Xn是在区间0,上服从均匀分布的总体X的样本,试求

96 / 137

未知参数的最大似然估计量。

解:总体X的分布密度

设x1,x2,,xn为样本观测值,于是似然函数为

1,0x,x,x,n12,xn; 其他 0,nLx,x12,为使L达到最大,要求尽可能小;同时,为保证L不为0,应使

x1,x2,这等价于

,xn

xnmaxx1,x2,故只有取xnmaxx1,x2值

,xn,

即的最大似然估计,xn才能使L达到最大值,

maxx1,x2其最大似然估计量为

,xn

maxX1,X2,Xn。

例3 (2002年考研题) 设总体X的概率密度为

e(x), xf(x,)

0, x而X1,X2,…,是来自总体X的简单随机样本,则未知参数θ的矩估计量为 。

解:因为只有一个未知参数,所以只要求总体一阶矩即可:

97 / 137

EXxexdxexex|exdx1,1nEX1XiX。ni1

所以 故应填。

例4 设某车间生产一批产品,其次品率为p,今从中抽取n件,发现其中有m件次品。试用最大似然估计法估计其次品率p。

解:用表示第i 次抽取到的次品数,1,2,…。显然有

1, 第i次抽到次品 Xi0, 第i次抽到正品则服从0-1分布,且概率分布

P(xi,p)pxi(1p)1xi, xi0, 1 (i1,2,,n)

于是似然函数

L(p)pxi(1p)1xipi1(1p)i1nxinnxii1n

由题意,n次抽取中有m件次品,故m = xi,于是

i1nL(p) = (1-p)

两边取对数,得

lnL(p)mlnp(nm)ln(1p)

上式两边对p求导,并令其导数为零,得似然方程

dlnL(p)mnm0 dpp1p解之,即可得到参数p的最大似然估计值为

98 / 137

为参数p的最大似然估计量。

例5 某厂6名女工血红蛋白的均值为114.33 g,标准差为10.61g,问该厂女工血红蛋白的总体均值是多少?其95%和99%置信区间为多少?

解:已知6名女工血红蛋白的均值x114.33 ,故该厂女工血红蛋白的总

ˆx114.33 。 体均值的矩估计值是已知x114.33,S10.61,n6,dfn1615,对10.95和0.99,即0.05和0.01,查t分布表得

t0.0552.571,t0.0154.032,

22于是

xt0.0552S10.61114.332.571114.3311.13 n6S10.61114.334.032114.3317.46 n6xt0.0152所以该厂女工血红蛋白的总体均值的95%置信区间为(103.20,125.46);99%置信区间为(96.87,131.79)。

例6 设大学生男生身高的总体X~N(

, 16) (单位:),若要使其平均

身高置信度为0.95的置信区间长度小于1.2,问应抽查多少名学生的身高?

解:已知方差216,且为正态总体N(,16),则

对10.95,即0.05,查表得uu0.051.96,则置信区间为

22(xu0.052n,xu0.052n),

置信区间长度。问题要求L1.2,即

99 / 137

2221.9621.9616所以 n170.74 21.21.22 故至少应抽查171名男生的身高。

四、习题五解答

1.设X1,X2,Xn是在区间0,上服从均匀分布的总体X的样本,试求未知参数的矩估计量。

解:对区间0,上的均匀分布

10x, f(x) 其它,0, 其总体数学期望

E(X)=

ˆ2X 则 E(X)=,ˆ2X。 所以未知参数的矩估计量为3.设X1,X2是来自正态总体N(,1)的一个样本,试证明以下三个估计量

,,

都是的无偏估计量,并确定哪一个最有效。

解:(1)因总体X~ N(

, 1),则

~ N(, 1),1, 2。

121212ˆ1)E(X1X2)E(X1)E(X2) E(333333131313ˆ2)E(X1X2)E(X1)E(X2) E(444444111111ˆ3)E(X1X2)E(X1)E(X2) E(222222ˆ1,ˆ2,ˆ3都是的无偏估计量。 因此,100 / 137

ˆ1)D(X1X2)D(X1)D(X2)11 (2)D(1319195ˆ2)D(X1X2)D(X1)D(X2)11 D(441616161681111111ˆ3)D(X1X2)D(X1)D(X2)11 D(224444213231949194959由于D(ˆ3)D(ˆ1)D(ˆ2),所以ˆ3最有效。

3.设总体X的概率密度为

f(x)(1)x,0x1

0,其他其中1是未知参数,X1,X2,Xn是来自该总体X的一个样本,试分别用矩估计法和最大似然估计法求的估计量。

解:(1)求的矩估计量。 先求X的总体均值

E(X)xf(x)dx10(1)xdx2 由矩估计法,令

解之得

的矩估计量:

(2)求的最大似然估计量。其似然函数

(0xi1,i1,2,,n)

取对数得

nlnL()nln(1)lnxi

i1对求导并令其为0,得似然方程

101 / 137

ndnlnL()lnxi0 d1i1解得的最大似然估计值

最大似然估计量为

4.试对下列样本数据求总体均值和方差的无偏估计。

(1)5,-3,2,0,8,6; (2)10,15,14,15,16。 解:总体均值

的无偏估计为数据的样本均值x,总体方差

2

的无偏估计

别为数据的样本方差S2。则

1nˆS(xix)2=16.8; (1)=3;n1i1221nˆS(xix)2=5.5。 (2)=14;n1i1225.某合成车间的产品在正常情况下,含水量服从N (

2

,

2

),其中

)为

=0.25,现连续测试9批,得样本均值为2,试计算置信水平(1-

的置信区间。

20.99时总体均值解:已知则总体均值

2

=0.25,9,x=2。又10.99,0.01,故u0.01=2.58。 的置信水平(1-

xu2)为0.99的置信区间

0.5920.43

n22.58即总体均值的99%置信区间为(1.57,2.43)。

6.已知n9,x2,,且总体服从正态分布,试计算总体均值的95%置信区间。

解:已知n9,x2,,则

102 / 137

n9116322S(xinx)(xi29x2)=31.5,

n1i191i122SS231.55.61

又对1 0.95,= 0.05,查t(n-1)分布表得

t(n1)t0.05(8)2.3060

22则 xtn12Sn22.3065.61924.31

所求的95%置信区间为(-2.31,6.31)。

7.设正态总体的方差2已知,问抽取的样本容量n应多大,才能使总体均值的置信度为0.95的置信区间长不大于L。

解:方差2已知时总体均值的置信度为1-

xu , xunn22的置信区间为

则置信区间长度为,由题意知需求n满足

22u/221.96故 n15.3662。

LLL228.对某地区随机调查180名20岁男青年的身高,得均值167.10(),标准差4.90 (),求该地区20岁男青年平均身高的95%置信区间。 解:已知180,为大样本情形,又x=167.10,S=4.90。 对1-

=0.95,

=0.05,查表得u0.05=1.96,则

2的95%置信区间为

=167.101.964.90180167.100.72

故平均身高的95%置信区间为(166.38,167.82)。

9.采用尾容积测压法测得大白鼠的血压()如下:

103 / 137

15.6、16.9、18.8、14.3、14.7、15.2、15.3、17.1、16.9、16.3 试求大白鼠血压总体均值的95%置信区间。

解:由样本数据计算得

x=16.11,S2=1.834,S=1.354

又已知n=10,且对1-=0.95,=0.05,查t(n-1)分布表得临界值

t(n1)t0.05(9)t0.025(9)2.262

22则大白鼠血压总体均值的95%置信区间为

xtn12Sn16.112.2621.3541016.110.97

即(15.14,17.08)。

10.试比较下列各情况下总体率的95%置信区间的宽窄及样本容量n的大小关系,并说明n较小时,若n次试验中某事件发生m次,将似值是否妥当?

(1)n10,m5;(2)n60,m30;(3)n200,m100;(4)

n1000,m500。

m作为概率p的近n解:(1)n10,m5为小样本情形。用查表法得其总体率P的95%置信区间为(0.187,0.813),其置信区间宽度

0.813-0.187=0.626。

(2)n60,m30为大样本情形。样本率,其总体率P的95%置信区间为

=0.51.960.5(10.5)=0.50.1265 60即(0.3735,0.6265),其置信区间宽度

L2u2p(1p)20.12650.253。 n104 / 137

(3)n200,m100为大样本情形。样本率,其总体率P的95%置信区间为

=0.51.960.5(10.5)=0.5±0.098

100即(0.402,0.598),其置信区间宽度

L2u2p(1p)20.0980.196。 n(4)n1000,m500为大样本情形。样本率,其总体率P的95%置信区间为

=0.51.960.5(10.5)=0.5±0.031

1000即(0.469,0.531),其置信区间宽度

L2u2p(1p)20.0310.062 nm作为概率pn显然样本容量n越小,其置信区间越宽。因此当n较小时,将的近似值是不妥当的。

实际上,上述各情形的样本率均为0.5,对大样本情形,其95%置信区间宽度

L2u2p(1p)0.5(10.5)1.9621.96 nnn及n成反比,对小样本情形(1),其置信区间更宽。

11.为测定某药物的成分含量,任取16个样品测得x3,S23.26。假设被测总体服从正态分布,试求

(1)总体均值的95%置信区间; (2)总体方差2的90%置信区间。

105 / 137

解:(1)已知x3,S23.26,16,则S3.261.806。 又对1-

=0.95,0.05,查t分布表得tn1t0.025(15)2.132。于是

2xtn12Sn32.1321.8061630.963

故总体均值的95%置信区间为(2.037,3.963)。

(2)对1-

2=0.9,=0.1,df=n-1=15,查2(15)临界值表,得

122222(15)0.05(15)24.996,(15)0.95(15)7.261

于是

(n1)S222153.26(n1)S2153.261.956 ,6.735 224.9967.26112故总体方差的90%置信区间为(1.956,6.735)。

12.某医院用复方当归注射液静脉滴注治疗脑动脉硬化症22例,其中显效者10例。问该药显效的95%及99%置信区间分别为多少?

解:本题为二项分布总体率P的区间估计问题。

已知n=22,m=10为小样本情形,对1-=0.95和0.99,查附表8得该药显效率的95%置信区间为(0.224,0.678),99%置信区间为(0.195,0.734)。

13.用计数器测定某放射性标本,10分钟的脉冲数为16784,试求10分钟总脉冲数及平均每分钟的脉冲数的95%置信区间。

解:因脉冲数服从泊松分布,由题意知

,n=10,0.05,u=1.96,

2于是

Xu2X167841.961678416784254

所以10分钟内总脉冲数的95%置信区间为(16530,17038),而每分钟平均脉

106 / 137

冲数的95%置信区间为(1653.0,1703.8)。

五、思考及练习

(一)填充题

1. 用样本X1,…,估计总体参数,总体均值的一个无偏估计量是 _ ,总体方差的无偏估计量是。

^^2. 设1和2分别是θ的两个无偏估计量,则k1 = ,k2 = 时,k11 + k22是θ的无偏估计量,且k2 = 2 k1。

3.(2003年考研题) 已知一批零件的长度X(单位:)服从正态分布N(μ, 1),从中随机抽取16个零件,得到长度的平均值为40,则μ的置信度为0.95的置信区间是 。(标准正态分布函数值=0.975,

(1.645)=0.95)

(1.96)

^^

(二)选择题 1. 设总体X ~ N (

,

2

),X1,X2,…,(n≥3)是来自总体X的简单

的无偏估计的是( )

样本,则下列估计量中,不是总体参数

A. X B. X1 + X2 + … + C. 0.1(6X1 + 4) D. X1 + X2 -X3

2. 设总体X ~ N (

,

2

),X1,X2,…,为来自总体X的一个样本,则2

的最大似然估计为( )

A. B.

C. D. X2

3. 2已知时,区间的含义是( )

A. 95%的总体均值在此范围内

107 / 137

B. 样本均值的95%置信区间

C. 95%

的样本均值在此范围内 D. 总体均值的95%置信区间

2), 且均未知。若样本容量和样本值不

4. 设总体X ~ N(变,则总体均值的置信区间长度L及置信度1-(

A. 当1-C. 当1-

的关系是

缩小时,L增大 B. 当1-

缩小时,L缩短

缩小时,L不变 D. 以上三个都不对

(三)计算题

1. 已知来自正态总体的样本值为

7.0,8.0,7.8,9.2,6.4

求2未知时总体均值的90%及95%置信区间。

2. 某医院用中药青木香治疗高血压,记录了70例高血压患者治疗前后舒张压的差数,算得样本均值-16.28,样本标准差10.58,试求舒张压差数的总体均值的99%置信区间。

3. 在一批产品中随机抽取30个,得一级品8个,求这批产品一级品率的

99%置信区间。

4. 在一指定地区的选民中,随机挑选300名选民进行民意测验,结果有182人对某个指定的候选人是满意的,求在所有选民中,对该候选人满意率的95%置信区间。

六、思考及练习参考答案

(一)填充题

1. X,S2;

2. k1=1/3; k2=2/3;

108 / 137

3. (39.51,40.49)

(二)选择题

1. B; 2. A; 3. D; 4. B

(三)计算题

1. (6.67,8.69)和(6.37,8.99)。用置信区间公式 2. (-19.54,-13.02)。用置信区间公式 3. (9.3%,51.6%)。用总体率p的小样本查表法 4. (0.555,0.665)。用置信区间公式

109 / 137

第六章 假设检验

一、 学习目的和要求

1.理解假设检验的概念及基本原理; 2.熟练掌握假设检验的基本步骤; 3.理解并正确应用单、双侧检验;

4.熟练掌握单个正态总体均值的u检验及t检验; 5.熟练掌握单个正态总体方差的

2

检验;

6.掌握两个总体方差比较的F检验; 7.熟练掌握配对总体均值的t检验; 8.熟练掌握两正态总体均值的t检验; 9.掌握非正态总体均值(大样本)的u检验; 10. 掌握总体率(大样本)的u检验;

11.了解用进行正态总体参数假设检验的运算。

二、内容提要

(一)假设检验的基本思想及步骤 名 目 基本思想 概率性质的反证法 推断依据 小概率原理:小概率事件在一次试验中几乎不可能发生 两类错误 第一类错误(弃真);第二类错误(取伪) 1. 建立检验假设:原假设H0和备择假设H1; 基本步骤 2. 确定检验统计量及其分布,并根据样本值计算检验统计量的值; 3. 根据显著性水平,确定检验临界值,即得拒绝域; 内 容 110 / 137

4. 统计判断:若统计量的值落在拒绝域内,则拒绝原假设H0;否则,就接受原假设H0。 分 类 参数假设检验;非参数假设检验 (二)正态总体的参数假设检验 1.单个正态总体均值的假设检验 条件 检验假设 统计量 0临界值 拒绝域 ≥u/2H1:≠2 u/2 已知 H0:=0 H1: >(或0 u 0u≥u (或u≤) ≥t/2H1:(或0 知 t t≥t (或t≤) ≥uH1:<20) 0未H1:≠H0:=0 u/2 /2 知 大样本 (n>30) H1: >(或0 u 0u≥u (或u≤) H1:<) 2.配对比较总体均值的假设检验 条件 检验假设 统计量 临界值 拒绝域 111 / 137

配对总体 (d为差值) H1:d≠0 H0d0 H1:d>0 (或H1:d<0) t/2 ≥t/2 t t≥t (或t≤) 3.正态总体方差的假设检验 条件 检验假设 统计量 临界值 2拒绝域 22H1:单个 总体 2 ≠>2 20 2 12,2 212或22 2H0:2=20 H1:2 20 = 2 (或H1:20<2 2(或12) ) 2222(或212) FF/2 两个 总体 H1:H0:2121≠> =22 (S12S22) F/2 H1:2 1 F FF

4.两个正态总体的均值比较检验 条件 检验假设 统计量 2临界值 拒绝域 H1:211≠1 u/2 ≥u/2 、22H0:21=H1:>2 u≥u u (或已知 H1:(或1<≠2 )2u≤) 21、22H0:1=H1:1 u/2 ≥u/2 112 / 137

未知 大样本 (n1、2 H1:1>2 u≥u u (或(或n2>30) 21H1:H1:H0:21=1<≠12 )u≤) t/2 ≥t、2212 (S2(n11)S12(n21)S2n1n22/2 未知且相等 21H1:>2 t≥t ) H1:H1:(或1t (或=22 <≠12) 2t≤) t/2 * 21、221 ’|≥t/2 t'≥t 未知且不等 21H0:1=H1:>2 2 22(或H1: 1t (或≠ <2) t’≤) 21S12S2(n1n22)(4) 42S1S2* t’检验临界值的自由度及t检验的自由度不同:df

(三)非正态总体的参数假设检验

1. 非正态总体均值的假设检验(大样本) 条件 单个总检验假设 统计量 0临界值 拒绝域 ≥u/2H0:=0 H1:≠ u/2 113 / 137

体 大样本 (n>30) 两个总体 大样本 H0:(n1、1H1:>(或0 u 0u≥u (或u≤) ≥u/2H1:2 (或u u≥u (或u≤) n2>30) H1:1<2)

2. 单个总体率的假设检验 条件 检验假设 统计量 临界值 拒绝域 ≥ u/2H1≠P0 大样本 (n>30) u/2 H00 H1>P0 (或H1P0 (或H13. 两个总体率的比较检验 条件 检验假设 统计量 临界值 拒绝域 114 / 137

大样本 (n1、H11≠P2 up1p2p(1p)(11)n1n2 u/2 u ≥ u/2 H012 H11>P2 (或H1130) (或﹣u) (或 u≤﹣() u) ≥ u/2小样本 (n1、H11≠P2 H012 H11>P2 (或H11三、综合例题解析

例1 (1995年考研题) 设X1, X2, …,是来自正态总体N(μ,σ2)的样本,其中参数μ,σ2

1未知,记XnXi,Q(XiX)2,则假设H:μ= 0的t20

nni1i1检验使用统计量 。

1n122(XX)Q解: S, in1i1n12则检验统计量

tX0SnXn(n1)X

Qn(n1)Q故应填。

例2 用两种工艺生产的某电子元件抗击穿强度X和Y为随机变量,其分布

2)(单位:V)分别为N(1,12)和N(2,2。某日分别抽取9只和6只样品,测得

抗击穿强度数据分别为x1,x2,…,x9和y1,y2,…,y6,并算得

115 / 137

2y204.60,yx370.80,x15280.17,jj6978.93 i2ii1i19966j1j1(1)检验X和Y的方差有无显著差异(取α=0.05)。

(2)利用(1)的结果,求12的置信度为0.95的置信区间。 解:已知n1=9,n2=6,由数据计算得

161191xxi370.8041.2,yyj204.6034.1

6j16ni19n2n1112222(yjny2)0.4140 S(xinx)0.4013,S2n21j1n11i121(1)应检验 H0:1222, H1:1222. 则 F2S大2S小2S20.414021.0316 S10.4013对= 0.05,查F(n2-1, n1-1)分布表,得临界值

F0.025(5, 8) = 4.82

因为

1.0316<F0.025(5, 8) =4.82,

故接受H0,认为X和Y的方差无显著差异。

22但未知,则 (2)利用(1)的结果,因为122 ~ t(n12-2)

记t/2/2(n12-2),则有

xy(12)Ptt/2Pt/21

S11n1n2即 P{xyt/2S111112xyt/2S}1 n1n2n1n2116 / 137

故12的置信度为1-

的置信区间为

1111,xyt/2S) n1n2n1n2(xyt/2S或记为 。

由观测值计算

2(n11)S12(n21)S2(91)0.4013(61)0.4140S0.4062n1n22962 2S0.40620.6373对α=0.05,查t分布表,得临界值t0.025(13) = 2.1604。 则μ1-μ2的95%置信区间为

xyt/2S111141.234.12.16040.63737.100.73 n1n296即(6.37,7.83)。

例3.设x1, x2, …,x25为来自正态总体N(m,32)的样本,未知,设对检验H0: 0,其拒绝域为{|X-m0|≥K},试决定常数K,使检验的显著性水平为α=0.05。

解:因为正态总体XN(m,32),则

在H0 0成立时,将X标准化得

X05PX0KPK

353即 P而 PX05K1 335X05555KKK2K11, 333335117 / 137

5K10.975

23故 K1.96,K1.176

例4. 为考察甲、乙两批药品中某种成分的含量(%),现分别从这两批药品中各抽取9个样品进行测定,测得其样本均值和样本方差分别为x1=76.23,

53S12=3.29和x2=74.43, S22=2.25。假设它们都服从正态分布,试检验甲、乙两批

药品中该种成分的含量是否有显著性差异?(α=0.05)

解:根据题意,应首先检验方差齐性

H0:

21=

22; H1:

21≠22。

已知 n12=9, x1=76.23, S12=3.29, x2=74.43, S22=2.25 则F检验统计量的值:

>1

对显著性水平α=0.05,查F分布表(附表7)得

F/2 (n1-1, n2-1)0.025(8, 8)= 4.43

因1.46< F0.025(8,8)=4.43,P>0.05,故接受H0: 再检验H0: m12;H11≠m2。

因为这两个总体的方差未知但相等,故可用t检验法进行检验。 则 S2=(S1222)/2=(3.29+2.25)/2=2.77, 2.771.664 又检验统计量t的值

txy76.2374.432.295 1111S1.664n1n29921

=

22。

对给定的α=0.05,查t分布表(附表6),得临界值

2

(n12-2)= t0.025 (16)=2.12

因 2.295> t0.025 (16)=2.12,P<0.05,则拒绝H0,接受H1,即认为甲、乙两

118 / 137

批药品中该种成分的含量有显著性差异。

四、 习题六解答

1.已知正态分布N(μ,

2

)的标准差σ= 0.8,由9个个体构成的样本

均值x2,试检验假设H0:μ= 3,H1:μ≠3。(α= 0.01)

解:此题应为验

2已知时单个正态总体均值u检验,采用双侧检验。应检

H0:μ= 3,H1:μ≠3。

由题中条件得:

=0.8,9,

则检验统计量u的值为

ux00

=3, x=2,

/n230.8/93.75

对于给定的显著性水平到临界值u/2

=0.01,查正态分布双侧临界值表(附表4),得

= 2.58。

因为 3.75> 2.58,P<0.01,拒绝H0,接受H1,即在0.01的显著水平下,认为μ≠3。

2.某药厂用一台自动包装机包装葡萄糖,规定标准为每袋0.5 。设包装机实际生产的每袋重量服从正态分布,且由以往经验知σ= 0.015(),某天从生产线上随机抽取8袋,称得净重为(单位:)

0.497,0.506,0.524,0.488,0.511,0.510,0.515,0.512

如标准差σ不变,问包装机包装的平均重量是否仍为0.5 ?(α= 0.05)

解:此题应为

2已知单个正态总体均值u检验,采用双侧检验。应检验

H0:μ=由题中条件和计算得:

0

= 0.5,H1:μ≠0.5

119 / 137

2=0.0152,8,

0=3, x=0.508,

则检验统计量u的值为

ux0/n0.5080.500.015/81.51

对于给定的显著性水平=0.05,查正态分布双侧临界值表(附表4),得

/20.025

到临界值:u=1.96。

因为 1.51< 1.96,P>0.05,所以接受H0,即在0.05的显著水平下,可认为包装机包装的平均重量仍为0.5 。

3.正常人的脉搏平均72次,现医生测得10例慢性四乙基铅中毒患者的脉搏(次)如下:

54 67 68 78 70 66 67 70 65 69

试问四乙基铅中毒者和正常人的脉搏有无显著性差异?(α= 0.05) 解:根据题意,此题应为应检验假设H0: 2未知单个正态总体均值t检验,采用双侧检验。

=0

=72;H1: ≠0

由题中条件和计算得:

10,

则检验统计量t的值为

tx0S/n67.40722.453

5.93/100=72, x=67.40, 5.93

对于给定=0.05和自由度n-1=9,查t 分布表(附表6),得到临界值:

t/2(n-1)0.025(9)=2.2622,

因为 2.453>2.2622,P<0.05,所以拒绝H0,接受H1,即在0.05的显著水平下,可认为四乙基铅中毒者和正常人的脉搏有显著性差异。

4.一公司声称某种类型的电池平均寿命是21.5小时,有个实验室检测了该公司所制造的6套电池,得如下的寿命小时数:

120 / 137

19,18,22,20,16,25

这些结果是否表明这种类型的电池低于该公司宣称的寿命?(α= 0.05)

解:此题为

2

未知时单个正态总体均值t检验,采用单侧检验,应检验

H0:=由题中条件和计算得:

6,

则 t对于给定的值:

00

=21.5; H1:<21.5

=21.5, x=20, 3.16

2021.53.16/6﹣1.163

x0S/n=0.05和自由度n-1=5,查t 分布表(附表6),得到临界

t( n-1)0.05(5)=2.015,

因为 t =﹣1.163>﹣t0.05(5)=﹣2.015,P>0.05,所以接受H0,即在0.05的显著水平下,尚不能认为这种类型的电池低于该公司宣称的寿命

5.测定某种溶液中的水分(%),由它的10个测定值算出x0.452,S = 0.037,设测定总体服从正态分布,试分别检验假设:(α= 0.10)

(1)H0:μ= 0.5;(2)H0:σ2=0.042。 解:(1)此题应为

2未知单个正态总体均值t检验,采用双侧检验,应检

0验 H0: =由题中条件得:

10,

则 t对于给定的

0

=0.5; H1:≠0.5

=0.5, x=0.452, 0.037

0.4520.504.102

0.037/10x0S/n=0.10和自由度n-1=9,查t 分布表(附表6),得到临界值:

t/2(n-1)0.05(9)=1.833

因为 4.102> 1.833,P<0.05,所以拒绝H0,接受H1,即在0.05的显著水

121 / 137

平下,可认为≠0.5。

(2)根据题意,应检验

H0:

已知 则

22

=0.04;H1:

20

2

22

≠0.04(双侧)

22

2

=0.04,10, S=0.037。

检验统计量的值

(n1)S2(101)0.03727.701

020.0422对于给定的=0.10和自由度n-1=9,由

20.1022分布表(附表5)查得临界值

12( n-1)=12(9)=02.95(9)=3.325, 2( n-1)=2(19)=02.05(19)=16.919

20.102因 3.32527.70116.919,则P>0.10,故接受H0,认为差异。

2及0.042无显著

6.由某个正态总体中抽出一个容量为21的样本,算得样本方差S2 = 10,根据此结果能否说明总体方差小于15的结论?(α= 0.05)

解:根据题意,应检验

H0:

2

=15, H1:

20

2

<15(单侧)

已知 则

2=15,21, S2=10

检验统计量的值

(n1)S2(211)1013.333

15022对于给定的=0.05和自由度n-1=20,由

2分布表(附表5)查得临界值

12( n-1)=120.05(20)=02.95(20)=10.851,

因为213.33310.851,P>0.05,故接受H0,认为

2及15无显著差异。

7.某剂型药物正常的生产过程中,含碳量服从正态分布N(1.408,0.0482),今从某班生产的产品中任取5件,测量其含碳量(%)为

122 / 137

1.32, 1.55, 1.36, 1.40, 1.44

据分析其平均含量符合规定的要求,问含量的波动是否正常?(α= 0.02)

解:根据题意,应检验

H0:

2

=0.048, H1:

22

≠0.048(双侧)

2

由已知条件及计算可得

20

=0.048,5, S=0.00778。

22

2检验统计量的值

(n1)S2(51)0.0077813.507

020.04822对于给定的=0.02和自由度n-1=4,由

22分布表(附表5)查得临界值

12( n-1)=12(4)=02.99(4)=0.297,

0.0222( n-1)=2(4)=02.01(4)=15.086

20.022因为 0.297213.50715.086,P>0.02,故接受H0,认为含量波动正常。 8.有人研究一种减少室性早搏的药物,为10名患者静脉注射2 的剂量后一定时间内每分钟室性早搏次数减少值分别为

0,7,﹣2,14,15,14,6,16,19,26

试判断药物是否确实有效?(α= 0.05)

解:根据题意,此题应为配对比较总体均值的t检验,采用单侧检验,注射药物后一定时间内每分钟室性早搏次数减少值即为用药前后的差值d。

应检验 H0: d=0;H1:d>0(单侧) 由已知条件及计算得:

n10,d115,d21999,

d1115d11.5, n10123 / 137

Sd11(d2nd2)(19991011.52)8.670 n1101dSd/n11.58.670/104.194

则 t对于给定的

=0.05和自由度n-1=9,查t分布表(附表6),得到临界值

t( n-1)0.05(9)= 1.833,

因为 4.194>t(9)= 1.833,P<0.05,故拒绝H0,接受H1,即可以认为治疗前后早搏次数减少,此药物有效。

9.某医院试验中药青兰在改变兔脑血流图方面的作用,对5只兔子分别测得用药前后的数据如下表所示。

兔 号 1 2 3 4 5

给药前 4.0 2.0 5.0 6.0 5.0

给药后 4.5 3.0 6.0 8.0 5.5

试判断青兰有无改变兔脑血流图的作用。(α= 0.05)

解:根据题意,此题应为配对比较总体均值的t检验,采用双侧检验。应检验

H0: d=0;H1:d≠0(双侧)

5只兔子用药后及用药前数据的差值分别为:

0.5,1.0,1.0,2.0,0.5

由已知条件及计算得:

n5,d5, d26.5,

124 / 137

Sd1(d2nd2)n11(6.551.02)0.6124 4则 t对于给定的

dSd/n1.00.6124/53.6513

=0.05和自由度n-1=4,查t分布表(附表6),得到临界值

t/2(n-1)0.025(4)= 2.776,

因为| =3.6513>t/2

(4)= 2.776,P<0.05,故拒绝H0,接受H1,即可认为

青兰有改变兔脑血流图的作用。

10.某医院用新药及常规药物治疗婴幼儿贫血,将16名贫血儿随机分为两组,分别接受两种药物治疗,测得血红蛋白增加量()见下表,问新药及常规药的疗效有无差别?(α= 0.05)

两种药物治疗婴幼儿贫血结果

新药组 24 36 25 14 26 34 23 30

常规药组

14 18 20 15 22 24 21 25

解:由题意,本题为总体方差未知时两正态总体均值比较的t检验,首先应检验两总体方差是否相等,即检验

H0:2

1=22,H1:

21≠22(双侧)

125 / 137

由题中条件和计算得:

新药组:n1 =8x26.5, S12=6.928; 常规药组:n2=8y19.875, S22=3.980,

S126.92823.03 则 F2S23.980222

对显著性水平=0.10,查F分布表(附表7)得临界值

F/2 (n1-1, n2-1)0.05(7, 7)= 3.79

因1.512< F0.05(7,7)=3.79,P>0.05,故接受H0,即认为两总体方差无显著差异。

再进行两总体方差未知但相等的两正态总体均值比较的t检验,应检验

H0:

1

=

2

;H1:

1

2

则 S2=(S1222)/2=(6.9282+3.9802)/2=31.92, 31.925.65

tSxy11n1n226.519.8755.6511882.345

对给定的α=0.05,查t分布表(附表6),得临界值

t/2(n12-2)= t0.025 (14)=2.145

因 2.345> t0.025 (14)=2.145,P<0.05,则拒绝H0,接受H1,即认为新药及常规药的疗效有差别。

11.从两台自动机床加工产品中分别抽取容量为n1 = 10和n2 = 8的两组产品,测得某个指标的尺寸,得到数据如下表所示。

1.08 1.10 1.12 1.14 1.15 1.25 1.36 1.38 1.40 1.42 1.11 1.12 1.18 1.22 1.33 1.35 1.36 1.38

如果取显著性水平α= 0.10,能认为两台机床加工产品的该指标的方差无

126 / 137

显著性差异吗?(α= 0.05)

解:由题意,本题为两总体方差比较的F检验。应检验 H0:

21

=

22,H1:

21≠22(双侧)。

由题中条件和计算得:

n1=10,n2=8, x=1.24, S12=0.01887, y=1.256 S22=0.01248

则F检验统计量的值:

S120.01887F21.512

S20.01248对显著性水平=0.10,查F分布表(附表7)得临界值

F/2 (n1-1, n2-1)0.05(9,7)= 3.68

因1.512< F0.05(9,7)=3.68,P>0.10,故接受H0,即认为两台机床加工产品的该指标的方差无显著性差异。

12.设有两种玉米的甲、乙块农业试验区,各分为10个小区,各小区的面积相同,除甲区施磷肥外,其他试验条件均相同,试验结果玉米产量()如表所示。

甲区 62 乙区 56

57 59

65 56

60 57

63 58

58 57

57 60

60 55

60 57

58 55

试判别磷肥对玉米产量有无显著性影响?(α= 0.05)

解:由题意,本题为总体方差未知时两正态总体均值比较的t检验。首先应检验两总体方差是否相等,即检验

H0:21=22,H1:

21≠22(双侧)

由题中条件和计算得:

甲区:n1 =10, x=60, S12=2.6672;乙区:n2=10, y=57, S22=1.6332,

127 / 137

S122.66722.667 则 F2S21.6332对显著性水平=0.05,查F分布表(附表7)得临界值

F/2 (n1-1, n2-1)0.025(9, 9)= 4.03

因2.667< F0.025(9,9)=4.03,故接受H0,即认为两总体方差无显著差异。 再进行两正态总体均值比较的t检验,应检验

H0:

1

=

2

;H1:

1

2

则 S2=(S1222)/2=(2.6672+1.6332)/2=4.890, 2.2113

tSxy11n1n260572.21131110103.034

对给定的α=0.05,查t分布表(附表6),得临界值

t/2(n12-2)= t0.025 (18)=2.101

因 3.034> t0.025 (18)=2.101,P<0.05,则拒绝H0,接受H1,即可认为磷肥对玉米产量有显著性影响。

13.为研究矽肺患者肺功能的变化情况,某医院对Ⅰ、Ⅱ期矽肺患者各35名测定其肺活量,得到Ⅰ期患者的均值2710 ,标准差147 ;Ⅱ期患者的均值2830 ,标准差118 。试问Ⅰ、Ⅱ期矽肺患者的肺活量是否有显著性差异?(α= 0.01)

解:由题意,n12=35>30,本题可用大样本情形的两总体均值比较u检验。

应检验H0:

1

=

2

;H1:

1

2

由题中条件知:

Ⅰ期矽肺患者:n1 =35x2710, S12=1472, Ⅱ期矽肺患者:n2=35y2830, S22=1182,

128 / 137

则 uxySSn1n22122271028301471183535223.766

对于给定的=0.01,查正态分布双侧临界值表(附表4),得到临界值

u因3.766> u/2

/20.01/2

=2.576

= 2.576,P<0.01,则拒绝H0,接受H1,即可认为Ⅰ、Ⅱ期

矽肺患者的肺活量有显著性差异。

14.某厂有一批产品,须检验合格才能出厂,按国家标准,次品率不得超过3%,今在其中任意抽取100件,发现有10件是次品,试问这批产品能否出厂?(α= 0.10)

解:由题意,此题应用总体率及已知定值比较的u检验法,应进行单侧检验

H0:0.03; H1:P>0.03

由题意知:P0=0.03, 100, 10, 而样本率

,

则检验统计量u的值

upP0P0(1P0)n0.100.030.030.971004.103

对于给定的=0.10,查正态分布表(附表4),得到临界值

u= u0.100.2/2=1.282

因为 4.103>u0.10=1.282,P<0.10,故拒绝H0,接受H1,即认为该批产品次品率超过3%,不能出厂。

15.某医院用内科疗法治疗一般类型胃溃疡病患者80例,治愈63例;治疗特殊类型胃溃疡病患者99例,治愈31例。试问内科疗法对两种类型胃溃疡病治愈率有无显著性差异?(α= 0.01)

129 / 137

解:由题意,此题应用两总体率比较的大样本u检验法。应检验

H0:P12;H1:P1≠P2(双侧检验)

由题意知 n1=80, p1

p63310.7875,n2=99, p20.3131 8099n1p1n2p263310.5251

n1n28099up1p2p(1p)(11)n1n20.78750.31310.5251(10.5251)(11)8099=6.319

对于给定的=0.01,查正态分布临界值表(附表4),得到临界值

u/20.01/2

=2.576,

因为6.319>u0.01/2=2.576,P<0.01,故拒绝H0,接受H1,即认为内科疗法对两种类型胃溃疡病治愈率有显著性差异。

16.为了观察某药物预防流感的效果,共观察了96人,其中试验组49人,发病7例;对照组47例,发病13例。试问两组发病率有无显著性差异?(α= 0.05)

解:由题意,此题应用两总体率比较的大样本u检验法。应检验

H0:P12;H1:P1≠P2(双侧检验)

已知 n1=49, p1

7130.1429,n2=47, p20.2766 4947pup1p2p(1p)(n1p1n2p27130.2083

n1n249470.14290.27661.613

110.2083(10.2083)()494711)n1n2对于给定的=0.05,查正态分布临界值表(附表4),得到临界值

u/20.05/2

=1.96,

130 / 137

因为 1.6130.05,故接受H0,即认为两组发病率无显著性差异。

17.用某疗法治疗某病,临床观察了20例,治愈13例,问总体治愈率及所传治愈率79%是否相符?(α= 0.05)

解:由题意,此题应用总体率及已知定值比较的小样本检验法。应检验

H0:0.79; H1:P≠0.79(双侧检验)

已知P0=0.79,20,13/20=0.65,对样本率p及P0进行反正弦变换(2arcsinp),查附表9得:

=1.875,Ф0=2.190

则 u对于给定的

01n1.8752.1901201.409

=0.05,查正态分布临界值表(附表4),得到临界值u/2= 1.96。

因为 1.4090.05,故接受H0,即认为总体治愈率及所传治愈率79%相符。

18.某医生研究复方哌唑嗪对高血压的治疗效果,以复方降压片为对照,结果如下,问两种药物效果有无显著性差别?(α= 0.05)

复方哌唑嗪 复方降压片

治疗例数 40 30

有效例数 35 20

有效率(%) 87.50 66.67

解:由题意,此题可应用两总体率比较的小样本法。应检验

H0:P12;H1:P1≠P2(双侧检验)

已知p1=0.875,p2=0.666,n1=40,n2=30,对p1和 p2利用附表9化为1和2:

1=2.420,2=1.910,

131 / 137

则 u(12)对于给定的

n1n24030(2.4201.910)2.112

n1n24030/2=0.05,查正态分布临界值表(附表4),得临界值u=1.96。

因为2.112>u0.05/2=1.96,P<0.05,故拒绝H0,接受H1,即可认为两种药物效果有显著性差别。

五、 思考及练习

(一)填充题 1.从正态总体N(

,2)(,2未知)中随机抽取容量为n的一组样本,

=2.5,H1:>2.5,则

=0.05,则临界值

其样本均值和标准差分别为x,S,现要检验假设H0:

应该用 检验法,检验统计量为 ;如取为 ,拒绝域为 。

2.用P值法进行假设检验时,若P<3.从正态总体N(的概率为0.05。

,则结论应当是 H0。

,2)(,2已知)中以固定n随机抽样,x≥

(二)选择题

1.在假设检验的问题中,显著性水平

的意义是( )。

A.原假设H0成立,经检验不能拒绝的概率 B. 原假设H0成立,经检验被拒绝的概率 C.原假设H0不成立,经检验不能拒绝的概率

D.原假设H0不成立,经检验被拒绝的概率

2.下列关于假设检验的有关结论哪项是正确的( ) A. 检验中显著性水平

是犯“以真为假”的错误(即第一类错误)的概

132 / 137

B. 进行假设检验时,选取的检验统计量不能包含总体分布中的任何参数 C. 用u检验法进行两个总体均值的比较检验时,要求方差相等 D. 统计软件作假设检验时一般给出P值,若P>

,则在

水平下拒绝

H0

3. 对大样本情形,总体比例P的假设检验H0: ( ) 0(已知值)的检验法是

A.u检验法 B. t检验法

C.F检验法 D.查表法

4.在假设检验中,用α和β分别表示犯第一类错误和第二类错误的概率,则当样本容量一定时,下列说法正确的是( )

A. 减小α时, β往往减小 B. 增大α时, β往往增大 C. 减小α时, β往往增大 D. 无法确定

5.参数的区间估计及假设检验法都是统计推断的重要内容,它们之间的关系是( )

A. 没有任何相同之处 B. 假设检验法隐含了区间估计法

C. 区间估计法隐含了假设检验法 D. 两种方法解决问题途径是相通的

(三)计算题

1. 某公司生产某种灯管,该公司的经理称,他们产品的平均使用寿命为3年。为检验他的说法,随机抽取5个灯管,测得灯管寿命数据如下:(单位:年)

1.3, 4.1,4.8, 3.4 ,2.9

已知灯管的使用寿命服从正态分布,试检验他的说法是否正确?(

=0.05)

2.为比较治疗组和对照组的肺表面活性物质2在治疗某病患儿过程中的作用是否不同,某医生在治疗30名患儿后48小时得到下表资料,问治疗后48小时,两组的2是否不同?(

=0.05)

两组患儿2()比较

133 / 137

分组 治疗组 对照组

例数 15 15

均值 12.60 9.72

标准差 1.60 2.00

3.取8份样品,每份一分为二,分别用容量法和仪器分析测定,数据如下: 容量法 仪器分析

35.5 47.1 26.8 51.1 80.1 63.1 75.0 86.4 35.8 48.0 27.1 51.5 81.0 63.0 75.8 86.0

试判断容量法测量结果是否低于仪器分析结果?(=0.05)

4.某研究人员随机抽取20只小鼠分配到甲乙两个不同饲料组,每组10只,在喂养一段时间后,测得小鼠肝中铁含量(μ)结果如下:

甲 3.5

9 乙 2.2

3

0.96 1.14

3.89 2.63

1.23 1.00

1.61 1.35

2.94 2.01

1.96 1.64

3.68 1.13

1.54 1.01

2.59 1.70

设小鼠肝中铁含量数据服从正态分布,试问: (1)两组数据总体方差是否相同?(

=0.10)

=0.05)

(2)不同饲料对鼠肝中铁含量有无影响?(

5.已知我国成人乙肝病毒表面抗原平均阳性率为10%,现随机抽查某地区100位成人的血清,其中23人为阳性。试检验该地区成人乙肝表面抗原阳性率是否高于全国平均水平?(

=0.05)

6.为比较两种药物的疗效,分别治疗了某病患者若干例,结果如下。试判断甲药的有效率是否高于乙药?(

=0.05)

134 / 137

分组 甲药组 乙药组

有效例数 126 204

无效例数 28 82

合计 154 286

六、 思考及练习参考答案

(一)填充题

1.t;; t0.05(n-1);t ≥ t0.05(n-1)。 2.拒绝; 3.1.96

 n(二)选择题

1. B;2. A;3. A;4. C;5. D

(三)计算题 1.应检验 H0: =3;H1: ≠3。则

tx0S/n3.331.33/50.504,

因 0.504〈t0.025(4)=2.776,接受H0,即认为他的说法是否正确。 2.首先应检验H0:

F2S较大2S较小21

=

22,H1:

21≠

22

2.0021.56251

=

2

;H1:

1

2

135 / 137

tSxy11n1n212.609.721.811115154.358

因 4.358-0.3

-0.9 -0.3 -0.4 -0.9 0.1

-0.8 0.4

应检验H0: d=0;H1:d<0(单侧)

tdSd/n0.30870.4734/81.9962<﹣t0.05(7)=﹣1.895,

故拒绝H0,接受H1,即可以认为容量法测量结果低于仪器分析结果。 4.先检验H0:

21

=

22,H1:

21≠

22。

F2S较大2S较小1.08523.727>F0.05(9,9)= 3.18 0.5622故拒绝H0,认为两总体方差不相等。 再检验H0:

1

=

2

;H1:

xy211

2

2.3991.5842.109

t'SSn1n2221.0850.56210102221S12S211.08520.5622df(n1n22)(4)(10102)()14 4442S1S221.0850.562因2.1095. 应进行单侧检验H0:0.10; H1:P>0.10

upP0P0(1P0)n0.230.10.10.91004.33>u0.05=1.64,

故拒绝H0,接受H1,即认为该地区成人乙肝表面抗原阳性率高于全国平均水平。

136 / 137

6.大样本u检验法。应检验H0:P12;H1:P1>P2(单侧检验)

pn1p1n2p21262040.75

n1n2154286up1p2p(1p)(11)0.81820.71332.4328>u0.05=1.64

110.75(10.75)()n1故拒绝H0,接受H1,即可认为甲药的有效率显著高于乙药。n2154286

137 / 137

因篇幅问题不能全部显示,请点此查看更多更全内容