一、学习目的和要求
1. 掌握数据的类型及特性;
2. 掌握定性和定量数据的整理步骤、显示方法;
3. 掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量; 4. 能理解并熟练掌握样本均值、样本方差的计算; 5. 了解统计图形和统计表的表示及意义;
6. 了解用软件进行统计作图、频数分布表及直方图生成、统计量的计算。
二、 内容提要
(一) 数据的分类
定性数据(品质数据) 数据类型 定类数据 (计数数据) 表现形式 类别 (无序) 定类变量 定序数据 (等级数据) 类别 (有序) 定序变量 定量数据 数值数据 (计量数据) 数值 (+-×÷) 数值变量 (离散变量、连续变量) 对应变量 主要统计方法 计算各组频数,进行列计算各种统计量,进行参联表分析、参数方法 2检验等非数估计和检验、回归分析、方差分析等参数方法 常用统计图条形图,圆形图(饼图) 直方图,折线图,散点图, 1 / 137
形
茎叶图,箱形图 (二) 常用统计量
1、描述集中趋势的统计量 名 称 公 式(原始数据) 公 式(分组数据) 意 义 反映数据取值的平均值 x 均水平,是描述数据分布集中趋势的最主要测度值, 中位数 当n为奇数xn1,()2 Me1(xnxn),当n为偶数(1)22(2)中位数所在是典型的位置平均组: 数,不受极端值的影 累积频数超过响 2的那个最低 组 众数 数据中出现次数最多的观众数所在组: 察值 测度定性数据集中 频数最大的组 趋势,对于定量数据意义不大 2、描述离散程度的统计量 名 称 极差 公 式(原始数据) 公 式(分组数据) 意 义 R = 最大值-最小值 R≈最高组上限反映离散程度的最简单测值-最低组下限度值,不能反映中间数据R 2 / 137
值 总体方差 2的离散性 反映每个总体数据偏离其总体均值的平均程度,是 离散程度的最重要测度值, 其中标准差具有及观察值数据相同的量纲 总体标准差 样本方差 1kS(mix)2fin1i12反映每个样本数据偏离其样本均值的平均程度,是离散程度的最重要测度S2 SS21k(mix)2fin1i1 样本标准差S 值, 其中标准差具有及观察值数据相同的量纲 变异系数 反映数据偏离其均值的相对偏差,是无量纲的相对变异性测度 反映样本均值偏离总体均 样本标准误Sx 值的平均程度,在用样本均值估计总体均值时测度偏差 3、描述分布形状的统计量
名 称 公 式(原始数据) 公 式(分组数据) 偏度 意 义 反映数据分布的非对 3 / 137
称性 0时为对称; >0时为正偏或右偏; <0时为负偏或左偏 Kun(n1)(xix)43[(xix)2]2(n1)(n1)(n2)(n3)S4 反映数据分布的平峰或尖峰程度 0时为标准正态; >0时为尖峰分布; <0时为扁平分布 峰度 (原始数据) Ku (mi1kix)4finS43(分组数据) * 在分组数据公式中,, 分别为各组的组中值和观察值出现的频数。
三、综合例题解析
例1.证明:各数据观察值及其均值之差的平方和(称为离差平方和)最小,即对任意常数C,有
(xi1nix)(xiC)2
2i1n证一:设 由函数极值的求法,对上式求导数,得
f(C)2(xiC)2xi2nC, f(C)2n
i1i1nn令 f (C)=0,得唯一驻点
由于f(x)2n0,故当Cx时f (C)y有最小值,其最小值为
。
4 / 137
证二:因为对任意常数C有
(xi1nix)(xiC)xnx(x2CxinC2)222i22ii1i1i1i12nnnnnnx2CxinC2n(x22CxC2)i1
n(xC)202故有 (xix)(xiC)。
2i1i1nn
四、习题一解答
1.在某药合成过程中,测得的转化率(%)如下:
94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;
(3)根据频数分布表的分组数据,计算样本均值和样本标准差。 解:(1)所求频数分布表:
转化率的频数分布表
转化率分
组 90.5~ 91.0~ 91.5~ 92.0~
1 0 3 11
0.025 0.00 0.075 0.275
0.025 0.025 0.10 0.375
频数
频率 累积频率
5 / 137
92.5~ 93.0~ 93.5~ 94.0~94.5
9 7 7 2
0.225 0.175 0.175 0.05
0.60 0.775 0.95 1.00
(2)频数直方图:
直方图12108642010转化率32频数1197790.5-91.0-91.5-92.0-92.5-93.0-93.5-94.0-94.5-
频率折线图:
频率0.30.250.20.150.10.0509090.59191.59292.59393.59494.595转化率频率折线图转化率
(3)由频数分布表可得
转化率分组中值 频数 6 / 137
组 90.5~ 91.0~ 91.5~ 92.0~ 92.5~ 93.0~ 93.5~ 94.0~94.5
1890.75191.25094.252371392.825 则 xmifini1404018S(mix)2fi n1i1290.75 91.25 91.75 92.25 92.75 93.25 93.75 94.25
1 0 3 11 9 7 7 2
=
1[(90.75-92.825)2×1+(91.25-92.825)2×0+…+(94.25-3992.825)2×2]
=0.584
812(mifinx2) 或者 Sn1i121(90.752191.252094.25224092.762)0.584 39SS2=0.584≈0.7642
2.测得10名接触某种病毒的工人的白细胞(109)如下:
7.1,6.5,7.4,6.35,6.8,7.25,6.6,7.8,6.0,5.95
7 / 137
(1)计算其样本均值、方差、标准差、标准误和变异系数。 (2)求出该组数据对应的标准化值; (3)计算其偏度。
解:(1)xi7.16.55.9567.75,10
i110xi1102i7.126.525.952462.35
1n67.756.775 样本均值xxini110n112(xinx2)(462.35106.7752)0.371 方差Sn1i192标准差SS2=0.371≈0.609
标准误SxSn0.609400.193
变异系数8.99%;
(2)对应的标准化值公式为
uixixxi6.775 S0.609对应的标准化值为
0.5340.452,1.0260.698,0.041,0.780.287,1.6831.2731.355; (3)=0.204。
3. 已知某年某城市居民家庭月人均支出分组数据如下表所示
按月人均支出分组(元) 家庭户数占总户数的比例(%)
200以下 200~
1.5 18.2
8 / 137
500~ 800~ 1000以上 合计
46.8 25.3 8.2 100
试计算(1)该市平均每户月人均支出的均值和标准差; (2)并指出其月人均支出的中位数及众数所在组。 解:(1)由原分组数据表可得
支出分组(元) 200以下 200~ 500~ 800~ 1000以上
1511001.535018.211008.2)687.3 则 xmifi(ni1100512(mifinx2) Sn1i12组中值 100 350 650 900 1100
比例(%) 1.5 18.2 46.8 25.3 8.2
1(10021.5350218.2110028.25687.32) 9952468.39SS252468.39229.06;
(2)由原分组数据表可得
支出分组(元)
比例(%)
累积比例(%)
9 / 137
200以下 200~ 500~ 800~ 1000以上
1.5 18.2 46.8 25.3 8.2
1.5 19.7 66.5 91.8 100
中位数所在组,即累积比例超过50的那个最低组,即为500~组。 众数所在组是频数即比例最大的组,也是500~组。
4.设x1, x2, …,和y1, y2, …,为两组样本观察值,它们有下列关系:
1,2,…
2其中a、b为常数且b≠0,求样本均值x及y及样本方差Sx2和Sy之间的关系。
1n1nxia11nnaxayy()(x)解: inini1bbnnbi1i11n1nxaxa21nxx22S(yiy)()() n1i1n1i1bbn1i1b2y11n122(xix)22Sx。 bn1i1b
五、思考及练习
(一)填充题
1. 统计数据可以分为 数据、 数据、 数据、
据等三类,其中 数据、 数据属于定性数据。
2. 常用于表示定性数据整理结果的统计图有 、 ;
而 、 、 、 等是专用于表示定量数据的特征和规律的统计图。
10 / 137
3. 用于数据整理和统计分析的常用统计软件有
等。
4. 描述数据集中趋势的常用测度值主要有 、 、
和
等,其中最重要的是 ;描述数据离散程度的常用测度值主要有 、 、 、 等,其中最重要的是 、 。
(二)选择题
1. 各样本观察值均加同一常数c后( )
A.样本均值不变,样本标准差改变 B.样本均值改变,样本标准差
不变
C.两者均不变 D. 两者均改变 2.关于样本标准差,以下哪项是错误的( )。
A.反映样本观察值的离散程度 B.度量了数据偏离样本均值的大小 C.反映了均值代表性的好坏 D.不会小于样本均值 3.比较腰围和体重两组数据变异度大小宜采用( ) A.变异系数() B.方差(S) C.极差(R) D.标准差(S)
2
(三)计算题
1. 在某次实验中,用洋地黄溶液分别注入10只家鸽内,直至动物死亡。将致死量折算至原来洋地黄叶粉的重量。其数据记录为(单位:)
97.3,91.3,102,129,92.8,98.4,96.3,99.0,89.2,90.1
试计算该组数据的样本均值、方差、标准差、标准误和变异系数。
11 / 137
六、思考及练习参考答案
(一)填充题
1. 定类,定序,数值,定类,定序
2. 条形图、圆形图;直方图、频数折线图、茎叶图、箱形图
3. 、、
4. 均值、众数、中位数,均值,极差、方差、标准差、变异系数,方差、标准差
(二)选择题 1. B; 2;3
(三)计算题
1.均值98.54、方差132.27、标准差11.501、标准误3.637、变异系数11.67%。
第二章 随机事件及概率一、学习目的和要求
1. 掌握事件等的基本概念及运算关系; 2. 熟练掌握古典概率及计算;
3. 理解统计概率、主观概率和概率的公理化定义; 4. 熟练掌握概率的加法公式、乘法公式及计算;
12 / 137
5. 理解并掌握条件概率及事件独立性的概念并进行计算; 6. 掌握并应用全概率公式和贝叶斯公式进行计算。
二、内容提要
(一)基本概念 概 念 符 号 概率论的定义 集合论的含义 具有以下特征的观测或试验: 1.试验在相同的条件下可重复地进行 随机试验 (试验) E 2.试验的所有结果事先已知,且不止一个 3.每次试验恰好出现其中之一,但试验前无法预知到底出现哪一个结果。 样本空间 基本事件 (样本点) 随机事件 (事件) 必然事件 不可能事 试验所有可能结果组成的集合,即所有基本事件的全体 试验的每个不可再分的可能结果,即样本空间的元素 试验中可能发生也可能不发生的全集 元素 A 结果,是由基本事件组成的样本空间的子集 子集 在试验中一定发生的事件 在试验中一定不发生的事件,不含全集 空集 13 / 137
件 任何基本事件 (二)事件间的关系 关 系 符 号 概率论的定义 集合论的含义 事件A的发生必然导致事件B的A是B的子集 包含 相等 和(并) 积(交) 差 互不相容 对立 发生 而且 (A∪B) A及B相等 事件A及B中至少有一个事件发A及B的并 生 (A∩B) 事件A及B同时发生 A及B的交 A及B的差 A及B不相交 A的补集(余集) A-B 事件A发生同时B不发生 事件A及B不可能同时发生 事件A不发生 A
(三)事件的运算规律
运算律 交换律 结合律 分配律 差积转换律 对立律 公 式 , ()(),()() (),()=()() ABABAAB A,AΩ 14 / 137
德·摩根对偶律
ABAB,ABAB (四)概率的定义
类 型 mP(A)=古典概率 n定 义 公 式 A所含的基本事件数基本事件总数 n统计概率 P(A) = p (≈fnAnA) 对样本空间中任意事件A对应的一个实数P(A),满足 公理化定义 (基本性质) 公理1(非负性):0≤P(A)≤1 公理2(规范性):P()=1, P()=0 公理3(可加性):若A12, …,…, 两两互不相容, P(A12+……)= P(A1)+ P(A2)+ … + P()+ … 则称P(A)为随机事件A的概率。
(五)概率的计算公式
名 称 加法公式 对立事件公式 事件之差公式 计算公式 P()(A)(B)-P() 若A、B互不相容():P()(A)(B) P(A)=1-P(A);P(A) =1-P(A) P(A-B)= P(A)-P() 若BA, P(A-B)= P(A)-P(B) 15 / 137
条件概率公式 , (P(A)>0) 若P(A)>0, P()(A)P() 乘法公式 若P(B)>0, P()(B)P() 当P(A1A2…1)>0时,有 P(A1A2…)(A1)P(A21)P(A31A2) …P(1A2…1) 独立事件公式 A、B相互独立:P()(A)P(B) A1, A2, …, 相互独立:P(A1A2…)= P(A1)P(A2)…P() 若A1, A2, …, 为完备事件组*,对事件B 全概率公式 PBP(Ai)P(B|Ai) i1n逆概率公式 若A1, A2, …, 为完备事件组*,P(B)>0 (贝叶斯公式) P(Aj|B)P(Aj)P(B|Aj) P(A)P(B|A)iii1n*完备事件组 1. A1, A2, …, 互不相容且P()>0(1, 2, …, {A1, n); 2. A12+… A2, …, }
三、综合例题解析
例1 从某鱼池中取100条鱼,做上记号后再放入该鱼池中。现从该池中任意捉来50条鱼,发现其中有两条有记号,问池内大约有多少条鱼?
16 / 137
解:设池内大约有n条鱼,令
{从池中捉到有记号鱼}
则从池中捉到有记号鱼的概率
P(A)=
100 n50由统计概率的定义知,它近似于捉到有记号鱼的频率 (A) =2,即
解之得2500,故池内大约有2500条鱼。
例2 口袋里有两个伍分、三个贰分和五个壹分的硬币,从中任取五个,求总值超过一角的概率。
解一:令{总值超过一角},现将从10个硬币中任取5个的每种取法作为每个基本事件,显然本例属于古典概型问题,可利用组合数来解决。所取5个硬币总值超过一角的情形,其币值由大到小可根据其中有2个伍分、有1个伍分和没有伍分来考虑。则
23122132C2C8C2C3C5C2C3C5126=0.5。 P(A)5252C10解二:本例也可以先计算其对立事件
A={总值不超过一角}
考察5个硬币总值不超过一角的情形,其币值由小到大先根据壹分硬币、贰分硬币的不同个数来计算其有利情形的组合数。则
513113C5C54C5C5(C32C3C2)C52C3126=0.5 P(A)1P(A)115252C1051413C8C(1262C5C3C5)或 P(A)1P(A)1=0.5 15252C10例3 将n个人等可能地分配到N(n≤N)间房中去,试求下列事件的概率:
17 / 137
(1){某指定的n间房中各有一人}; (2){恰有n间房,其中各有一人}; (3){某指定的房中恰有m(m≤n)个人}。
解:把n个人等可能地分配到N间房中去,由于并没有限定每一间房中的人数,故是一可重复的排列问题,这样的分法共有种。
(1)对事件A,对指定的n间房,第一个人可分配到该n间房的任一间,有n种分法;第二个人可分配到余下的n-1间房中的任一间,有n-1种分法,以此类推,得到A共含有n!个基本事件,故
(2)对事件B,因为n间房没有指定,所以可先在N间房中任意选出n间
n房(共有CN种选法),然后对于选出的某n间房,按照上面的分析,可知B共n含有CN·n!个基本事件,从而
m(3)对于事件C,由于m个人可从n个人中任意选出,故有Cn种选法,而
其余n-m个人可任意地分配到其余的N-1间房中,共有(N-1)种分配法,故
mC中共含有Cn·(N-1)个基本事件,因此
mCn(N1)nmmCn(P(C)Nn1m1)(1)nm NN注意:可归入上述“分房问题”来处理的古典概型的实际问题非常多,例如: (1)生日问题:n个人的生日的可能情形,这时365天(n≤365); (2)乘客下车问题:一客车上有n名乘客,它在N个站上都停,乘客下车的各种可能情形;
(3)印刷错误问题:n个印刷错误在一本有N页的书中的一切可能的分布(n不超过每一页的字符数);
(4)放球问题:将n个球放入N个盒子的可能情形。
18 / 137
值得注意的是,在处理这类问题时,要分清什么是“人”,什么是“房”,一般不能颠倒。
例4(1994年考研题)设A,B为两事件,且P(A),P()=P(AB),求P(B)。 解:由于
P(AB)P(AB)1P(AB)1[P(A)P(B)P(AB)],
现因为P()=P(AB),则
P(AB)1P(A)P(B)P(AB)
又P(A),故
P(B)1P(A)1p。
注意:事件运算的德·摩根律及对立事件公式的恰当应用。
例5 设某地区位于河流甲、乙的交汇处,而任一何流泛滥时,该地区即被淹没。已知某时期河流甲、乙泛滥的概率分别为0.2和0.3,又当河流甲泛滥时,“引起”河流乙泛滥的概率为0.4,求
(1)当河流乙泛滥时,“引起”河流甲泛滥的概率; (2)该时期内该地区被淹没的概率。 解:令{河流甲泛滥},{河流乙泛滥} 由题意知
P(A)=0.2,P(B)=0.3,P()=0.4
再由乘法公式
P()(A)P()=0.2×0.4=0.08,
则(1)所求概率为
P(A|B)P(AB)0.080.267 P(B)0.3 (2)所求概率为
P()(A)(B)-P() =0.2+0.3-0.08=0.42。
19 / 137
例6 设两个相互独立的事件A和B都不发生的概率为1/9,A发生B不发生的概率及B发生A不发生的概率相等,求P(A)。
解:由题设可知因为A和B相互独立,则
P() = P(A)P(B),
再由题设可知
P(AB)P(A)P(B)1, 9P(AB)P(AB)
又因为
P(AB)P(AB),
即 P(A-B) = P(B-A), 由事件之差公式得
P(A)P(AB)P(B)P(AB)
则有P(A) = P(B),从而有
P(A)P(B)
故有
11(P(A))2, P(A)
93即 P(A)1P(A)2。 3例7(1988年考研题) 玻璃杯成箱出售,每箱20只,假设各箱含0,1,2只残次品的概率相应为0,0.8,0.1和0.1,一顾客欲购一箱玻璃杯,在购买时,售货员随意取一箱,而顾客开箱随机地查看4只,若无残次品,则买下该箱玻璃杯,否则退回。试求
(1)顾客买下该箱的概率α;
(2)在顾客买下的一箱中,确实没有残次品的概率β。
20 / 137
解:由于玻璃杯箱总共有三类,分别含0,1,2只残次品。而售货员取的那一箱可以是这三类中的任一箱,顾客是在售货员取的一箱中检查的,顾客是否买下这一箱是及售货员取的是哪一类的箱子有关系的,这类问题的概率计算一般可用全概率公式解决,第二问是贝叶斯公式也即条件概率问题。
首先令 {顾客买下所查看一箱};
{售货员取的箱中恰好有i件残次品},0,1,2。
显然,B0,B1,B2构成一组完备事件组。且
P(B0)0.8,P(B1)0.1,P(B2)0.1,P(AB0)1,P(AB1)4C194C204C18412
,P(AB2)4.5C2019(1)由全概率公式,有
P(A)P(Bi)P(ABi)0.810.10.1i0245120.94 19(2)由逆概率公式,得
P(B0A)P(B0)P(AB0)P(A)0.810.85 0.94注意:本题是典型的全概率公式及贝叶斯公式的应用。
例8.(小概率事件原理)设随机试验中某事件A发生的概率为ε,试证明,不论ε>0如何小,只要不断独立重复地做此试验,事件A迟早会发生的概率为1。
证:令 {第i次试验中事件A发生}, 1,2,3,… 由题意知,事件A1, A2, …, , …相互独立且
P()=,1,2,3,…,
则在n次试验中事件A发生的概率
P(A1A2An)=1-P(A1A2An)
=1-P(A1)P(A2)P(An)1(1)n
21 / 137
当n→+∞, 即为事件A迟早会发生的概率
P(A1A2An)lim1(1)n1。
n
四、习题二解答
1.考察随机试验:“掷一枚骰子,观察其出现的点数”。如果设
{掷一枚骰子所出现的点数为i }, 1,2,…,6
试用i来表示该试验的基本事件、样本空间Ω和事件A ={出现奇数点}和事件{点数至少是4}。
解:基本事件:{0},{1},{2},{3},{4},{5},{6}。 样本空间Ω={ 0,1,2,3,4,5,6}。 事件{1,3,5};{4,5,6}。 2.用事件A、B、C表示下列各事件: (1)A出现,但B、C不出现; (2)A、B出现,但C不出现; (3)三个都出现;
(4)三个中至少有一个出现; (5)三个中至少有两个出现; (6)三个都不出现; (7)只有一个出现; (8)不多于一个出现; (9)不多于两个出现。
解:(1)ABC (2)ABC (3)ABC
(4)ABCABCABCABCABCABCABC
或或ABC
(5)ABCABCABCABC
22 / 137
(6)ABC或(7)ABC(8)ABC-()或ABC
ABC ABCABC
ABCABC(9)ABCABCABCABCABCABCABC
或
-或ABC
3.从52张扑克牌中,任取4张,求这四张花色不同的概率。
解:现将从52张扑克牌中任取4张的每种取法作为每个基本事件,其结果及顺序无关,故可用组合数来解决该古典概型问题。
1111C13C13C13mC13134P0.1055。 4n52515049/4!C524.在一本标准英语词典中共有55个由两个不同字母组成的单词,现从26个英文字母中任取两个字母排成一个字母对,求它恰是上述字典中单词的概率。
解:现将从26个英文字母中任取两个字母件的每种取法作为每个基本事件,其结果及顺序有关,故可用排列数来解决该古典概型问题。
Pm555520.0846。 nA2626255.某产品共20件,其中有4件次品。从中任取3件,求下列事件的概率。(1)3件中恰有2件次品;(2)3件中至少有1件次品;(3)3件全是次品;(4)3件全是正品。
解:现将从20件产品中任取3件的每种取法作为每个基本事件,其结果及顺序无关,故可用组合数来解决该古典概型问题。
21C16mC4(1)P(A)0.0842; 3nC203C16m(2)P(B)1P(B)11310.49120.5088
nC2023 / 137
122130C16C4C16C4C16mC4或P(B)0.5088; 3nC203mC4(3)P(C)30.0035;
nC203mC16(4)P(D)30.4912。
nC206.房间里有10个人,分别佩戴着1~10号的纪念章,现等可能地任选三人,记录其纪念章号码,试求:(1)最小号码为5的概率;(2)最大号码为5的概率。
解:设{任选三人中最小号码为5},{任选三人中最大号码为5}
(1)对事件A,所选的三人只能从5~10中选取,而且5号必定被选中。
12C5mC11P(A)0.0833; 3n12C10 (2)对事件B,所选的三人只能从1~5中选取,而且5号必定被选中。
12C4mC11P(B)0.05。 3n20C107.某大学学生中近视眼学生占22%,色盲学生占2%,其中既是近视眼又是色盲的学生占1%。现从该校学生中随机抽查一人,试求:(1)被抽查的学生是近视眼或色盲的概率;(2)被抽查的学生既非近视眼又非色盲的概率。
解:设 {被抽查者是近视眼},{被抽查者是色盲}; 由题意知,P(A)=0.22,P(B)= 0.02,P()= 0.01,则 (1)利用加法公式,所求概率为
P()(A)(B)-P()=0.22+0.02-0.01=0.23;
(2)所求概率为
P(AB)(AB)=1-P()=1-0.23 =0.77。
注意:上述计算利用了德·摩根对偶律、对立事件公式和(1)的结果。
24 / 137
8.设P(A)=0.5,P(B)=0.3且P()=0。求:(1)P();(2)P(A)。 解:(1)P()(A)(B)-P()=0.5+0.3-0.1=0.7;
(2)P(A)= P(A)(B)-P(AB)=[1-P(A)](B)-P(B-A)
=1-P(A) (B)-[P(B) -P()]= 1-P(A) + P() =1-0.5+0.1=0.6。
注意:上述计算利用了加法公式、差积转换律、对立事件公式和事件之差公式。
9.假设接受一批药品时,检验其中一半,若不合格品不超过2%,则接收,否则拒收。假设该批药品共100件,其中有5件不合格,试求该批药品被接收的概率。
解:设 {50件抽检药品中不合格品不超过1件}, 据题意,仅当事件A发生时,该批药品才被接收,故所求概率为
50149C5C95mC95P(A)0.1811。 50nC10010.设为任意两个事件,且P(A)>0,P(B)>0。证明: (1)若A及B互不相容,则A和B不独立; (2)若 P()(A),则A和B相互独立。
证明:(1)用反证法。假定A和B独立,因为已知A及B互不相容,则
,P()= P()=0
故 P(A) P(B)= P()=0
但由已知条件P(A)>0,P(B)>0得P(A) P(B)>0,由此导出矛盾,所以若A及
B互不相容,则A和B不独立。
(2)由已知P()(A),又
,
25 / 137
则
P(AB)P(AB)P(BA)P(B)P(AB) P(A)P(A)1P(A)1P(A)即 P()[1-P(A) ]= P(A)[P(B)-P()]
P()-P()P(A) = P(A)P(B)-P(A)P()
故 P() = P(A)P(B) 这即A和B相互独立。
(2)又证:由已知
P()(A)P(AB)P(BA)P(B)P(AB) P(A)1P(A)1P(A)即 P()[1-P(A) ]= P(B)-P()
P()-P()P(A) = P(B)-P() P()-P() = P(B)-P()
P() = P(B)
这即A和B相互独立。
11.已知P(A)=0.1,P(B)=0.3,P(A | B)=0.2,求:(1)P();(2)P(A+
B);(3)P();(4)P(AB);(5)P(A|B)。
解:(1)P()= P(B) P(A | B)=0.3×0.2=0.06; (2)P()(A)(B)-P()=0.1+0.3-0.06=0.34; (3)P(B|A)P(AB)0.060.6; P(A)0.1(4)P(AB)(A-B)(A)-P()=0.1-0.06=0.04; (5)P(A|B)P(AB)P(AB)1P(AB)10.340.9429。 P(B)1P(B)1P(B)10.312.某种动物活到12岁的概率为0.8,活到20岁的概率为0.4,问现年12岁的这种动物活到20岁的概率为多少?
解:设{该动物活到12岁},{该动物活到20岁};由题意知
26 / 137
P(A)=0.8,P(B)=0.4
显然该动物“活到20岁”一定要先“活到12岁”,即有
BA,且,
则所求概率是条件概率
P(B|A)P(AB)P(B)0.40.5。 P(A)P(A)0.813.甲、乙、丙三人各自独立地去破译一密码,他们能译出该密码的概率分别是1/5,2/3,1/4,求该密码被破译的概率。
解:设 {甲译出该密码},{乙译出该密码},{丙译出该密码}. 由题意知,A,B,C相互独立,而且
P(A)=1/5,P(B)=2/3,P(C)=1/4
则密码被破译的概率为
P()=1-P(ABC)=1-P(A)P(B)P(C)0.8
或 P()(A)(B)+ P(C)-P()-P()-P()()
(A)(B)+ P(C)-P(A) P(B)-P(A) P(C)-P(B) P(C) + P(A) P(B) P(C) =15231412531154213412153440.8。 514.有甲乙两批种籽,发芽率分别为0.8和0.7,在两批种籽中各任意抽取一粒,求下列事件的概率:(1)两粒种籽都能发芽;(2)至少有一粒种籽能发芽;(3)恰好有一粒种籽能发芽。
解:设 {甲种籽能发芽}, {乙种籽能发芽} 则由题意知,A及B相互独立,且有
P(A)=0.8,P(B)=0.7,
则所求概率为
(1)P()(A)P(B)=0.8×0.7=0.56;
27 / 137
(2)P() =1-P(AB)=1-P(AB)=1-P(A)P(B)=1-0.2×0.3=0.96; (3)P(ABAB)P(A)P(B)P(A)P(B)0.8×0.3+0.2×0.7=0.38。
15.设甲、乙两城的通讯线路间有n个相互独立的中继站,每个中继站中断的概率均为p,试求:(1)甲、乙两城间通讯中断的概率;(2)若已知0.005,问在甲、乙两城间至多只能设多少个中继站,才能保证两地间通讯不中断的概率不小于 0.95?
解:设{第k个中继站通讯中断}, 1,2,…,则A1, A2, …, 相互独立,而且有P(), 1,2,…。
(1)所求概率为
P(A1+ A2+…+ )=1-P(A1A2An)=1-P(A1A2An)
=1-P(A1)P(A2)P(An)=1-(P(A1))n1-(1-p)n;
(2)设甲、乙两城间至多只能设n个中继站,由题意,应满足
P(A1A2An)=(1-p)n≥0.95,
即 (1-0.005)n≥0.95
0.995n≥0.95
n≤0.9950.950.950.995=10.233
故10,即甲、乙两城间至多只能设10个中继站。
16.在一定条件下,每发射一发炮弹击中飞机的概率是0.6,现有若干门这样的炮独立地同时发射一发炮弹,问欲以99%的把握击中飞机,至少需要配置多少门这样的炮?
解:设至少需要配置n门炮。再设
{第k门炮击中飞机}, 1,2,…,
则A1, A2, …, 相互独立,而且有
P()=0.6, 1,2,…。
28 / 137
由题意,应有
P(A1+ A2+…+ )= 1-P(A1A2An)=1-P(A1)P(A2)P(An)
n=1-(P(A1))n1-0.4≥0.99
即 0.4≤0.01, 则有
nn≥0.40.010.010.4=5.026
故6,因此至少需要配置6门炮。
17.甲袋中有3只白球,7只红球,15只黑球;乙袋中10只白球,6只红球,9只黑球。现从两袋中各取一球,求两球颜色相同的概率。
解:设以A1、A2、A3分别表示从甲袋中任取一球为白球、红球、黑球; 以B1、B2、B3分别表示从乙袋中任取一球为白球、红球、黑球。 则所求两球颜色相同的概率为
P(A1B1+ A2B2+ A3 B3)= P(A1)P(B1)+ P( A2)P(B2)+ P(A3)P( B3)
310761592070.3312。 25252525252562518.在某地供应的某药品中,甲、乙两厂的药品各占65%、35%,且甲、乙两厂的该药品合格率分别为90%、80%,现用A1、A2分别表示甲、乙两厂的药品,
B表示合格品,试求:P(A1)、P(A2)、P(1)、P(2)、P(A1B)和P(B)。
解:由题中已知条件可得
P(A1)=0.65,P(A2)=0.35,P(1)=0.9,P(2)=0.8,
P(A1B)= P(A1)P(1)= 0.65×0.9=0.585,
P(B)= P(A1)P(1)+ P(A2)P(2) =0.65×0.9+0.35×0.8=0.865。
19.某地为甲种疾病多发区,其所辖的三个小区A1,A2,A3的人口比例为9∶7∶4,据统计资料,甲种疾病在这三个小区的发病率依次为4‰,2‰,5‰,求该地甲种疾病的发病率。
29 / 137
解:设以A1、A2、A3表示病人分别来自小区A1、A2、A3,以B表示患甲种疾病。则由题意知
P(A1)=
974,P(A2)=,P(A3)=,
202020P(1)=0.004,P(2)=0.002,P(3)=0.005,
则该地甲种疾病的发病概率为
P(B)= P(A1)P(1)+ P(A2)P(2)+ P(A3)P(3)
9740.0040.0020.0050.00353.5‰。 20202020.若某地成年人中肥胖者(A1)占有10%,中等者(A2)占82%,瘦小者(A3)占8%,又肥胖者、中等者、瘦小者患高血压病的概率分别为20%,10%,5%。(1)求该地成年人患高血压的概率;(2)若知某人患高血压病,他最可能属于哪种体型?
解:设{该地成年人患高血压},则由题意知
P(A1)=0.10,P(A2)=0.82,P(A3)=0.08, P(1)=0.20,P(2)=0.10,P(3)=0.05,
(1)该地成年人患高血压的概率为
P(B)= P(A1)P(1)+ P(A2)P(2)+ P(A3)P(3)
0.10.20.820.10.080.050.106;
(2)若已知某人患高血压病,他属于肥胖者(A1)、中等者(A2)、瘦小者(A3)体型的概率分别为
P(A1)=P(A2)=P(A3)=
P(A1)P(B|A1)0.10.20.1887
P(B)0.106P(A2)P(B|A2)0.820.10.7736
P(B)0.106P(A3)P(B|A3)0.080.050.0377
P(B)0.10630 / 137
因为 P(A2)> P(A1) >P(A3)
故若知某人患高血压病,他最可能属于中等体型。
21.三个射手向一敌机射击,射中概率分别为0.4,0.6和0.7。若一人射中,敌机被击落的概率为0.2;若两人射中,敌机被击落的概率为0.6;若三人射中,则敌机必被击落。(1)求敌机被击落的概率;(2)已知敌机被击落,求该机是三人击中的概率。
解:设A1、A2、A3分别表示第一个射手、第二个射手、第三个射手射中敌机;
B0、B1、B2、B3分别表示无人射中、一人射中、两人射中、三人射中敌机;C表
示敌机被击落。则A1、A2、A3相互独立,且由题意可得
P(A1)=0.4,P(A2)=0.6,P(A3)=0.7
P(B0)= P(A1A2A3)(A1) P(A2) P(A3)= 0.6×0.4×0.3=0.072 P(B1)= P(A1A2A3A1A2A3A1A2A3)=P(A1A2A3)P(A1A2A3)P(A1A2A3) =P(A1)P(A2)P(A3)P(A1)P(A2)P(A3)P(A1)P(A2)P(A3) =0.4×0.4×0.3+0.6×0.6×0.3+0.6×0.4×0.7=0.324
P(B2)= P(A1A2A3A1A2A3A1A2A3)=P(A1A2A3)P(A1A2A3)P(A1A2A3) =P(A1)P(A2)P(A3)P(A1)P(A2)P(A3)P(A1)P(A2)P(A3) =0.4×0.6×0.3+0.6×0.6×0.7+0.4×0.4×0.7=0.436 P(B3)= P(A1A2A3)(A1) P(A2) P(A3)= 0.4×0.6×0.7=0.168
P(0)=0,P(1)=0.2,P(2)=0.6,P(3)=1
(1)敌机被击落的概率为
P(C)(0)P(B0)(1)P(B1)(2)P(B2)(3)P(B3)
=0×0.072+0.2×0.324+0.6×0.436+1×0.168=0.4944;
(2)所求概率为
P(B3)=
P(B3)P(C|B3)0.16810.3398。
P(C)0.494431 / 137
五、思考及练习
(一)填充题
1.若P(A)=0.3,P(B)=0.6,则
(1)若A和B独立,则P()= , P(B-A)= ; (2)若A和B互不相容,则P()= ,P(B-A) = ;
(3)若A B,则 P()= ,P(B-A)= 。
2. 如果A及B相互独立,且P(A)= P(B)= 0.7,则P(AB)= 。 3.在4次独立重复试验中,事件A至少出现1次的概率为试验中事件A出现的概率是 。
(二)选择题
1. 下列说法正确的是( )
A. 任一事件的概率总在(0,1)之内 B. 不可能事件的概率不一定为
0
C. 必然事件的概率一定为1 D. 以上均不对。
2.以A表示事件“甲种药品畅销,乙种药品滞销”,则其A的对立事件为( )
A. 甲,乙两种药品均畅销 B. 甲种药品滞销,乙种药品畅销
C. 甲种药品滞销” D. 甲种药品滞销或乙种药品畅销
3. 有100张从1到100号的卡片,从中任取一张,取到卡号是7的倍数的
65,则在每次8132 / 137
概率为( )
77A. B.
50100715C. D.
481004. 设A和B互不相容,且P(A)>0,P(B)>0,则下列结论正确的是( ) A. P()>0 B. P(A)()
C. P()=0 D. P()(A)P(B)
(三)计算题
1.设Ω={1,2,3,4,5,6,7},{2,3,4},{3,4,5}。试求下列事件:(1)AB;(2)A。
2.某城市的电话号话由0,1,2,…,9这10个数字中任意8个数字组成,试求下列电话号码出现的概率:
(1)数字各不相同的电话号码(事件A); (2)不含2和7的电话号码(事件B); (3)5恰好出现两次的电话号码(事件C)。
3.一部五卷的文集,按任意次序放到书架上去,试求下列事件的概率: (1)第一卷出现在两边;
(2)第一卷及第五卷出现在两边; (3)第一卷或第五卷出现在两边; (4)第三卷正好在正中。
4.电路由电池A及两个并联的电池B、C串联而成,设电池A、B、C是否损坏相互独立,且它们损坏的概率依次为0.3,0.2,0.2,求电路发生间断的概率。
33 / 137
5. 设一医院药房中的某种药品是由三个不同的药厂生产的,其中一厂、二厂、三厂生产的药品分别占1/4、1/4、1/2。已知一厂、二厂、三厂生产药品的次品率分别是7%,5%,4%。现从中任取一药品,试求
(1)该药品是次品的概率;
(2)若已知任取的药品是次品,求该次品是由三厂生产的概率。 6.盒中放有12个乒乓球,其中有9个球是新球。第一次比赛从盘中任取3个来用,比赛后仍放回盒中;第二次比赛时又从盒中任取3个。(1)求第二次取出的球都是新球的概率;(2)若已知第二次取出的球都是新球,求第一次取到的都是新球的概率。
六、思考及练习参考答案
(一)填充题
1. (1)0.72,0.42;(2)0.9,0.6;(3)0.6,0.3 2. 0.09 3. (二)选择题
1. C; 2. D; 3. A; 4 (三)计算题
1. A={1, 5,6, 7},B={1, 2,6, 7},则 (1)AB={1, 6, 7};(2)A{1,3,4,5,6,7}
8109876543A102.(1)PA80.01814
1081013(2) (3)PCC82961080.1488
34 / 137
3. (1)=0.4;(2)=0.1;
14232C2A4A2A37(3)P=0.7;或=0.7; 510A5113232C2C3A3A2A37或P=0.7 510A5(4)=0.2
4.已知 P(A)=0.3,P(B)=0.2,P(C)=0.2 且A、B、C相互独立 则所求概率
P(ABC)(A)(BC)-P(ABC)
= P(A)(B)P(C)-P(A)P(B)P(C) =0.3+0.2×0.2-0.3×0.2×0.2=0.328
5. 令{该药品是次品};{药品是由k厂生产的},1,2,3。 由题意知 P(B1)=0.25, P(B2)=0.25,P(B3)=0.5,
P(1)=0.07,P(2)=0.05,P(3)=0.04,
(1)P(A)(1)P(B1)(2)P(B2)(3)P(B3)
=0.07×0.25+0.05×0.25+0.04×0.50=0.05
(2)
P(B3|A) PA|B3P(B3)P(A|B1)P(B1)P(A|B2)P(B2)P(A|B3)P(B3)0.040.50.02 0.400.070.250.050.250.040.50.05
6.令{第一次比赛任取3球中有k个新球},0,1,2,3;
{第二次取出的球都是新球}。
3C9k由题意得 P()=, P()=3,0,1,2,3。
C123k3C3CkC99k(1)PBP(Ak)P(B|Ak)0.146 33C12C12k0k03335 / 137
33(2)P(A|B)P(A3)P(B|A3)P(A3)P(B|A3)C9C60.146=0.238
3333P(Ai)P(B|Ai)i0P(B)C12C12
第三章 随机变量及其分布
一、 学习目的和要求
1. 理解随机变量及其分布函数的概念;
2. 熟练掌握离散型、连续型随机变量的分布及性质;
3. 熟练掌握常用数字特征:数学期望E(X)和方差D(X)及其性质; 4. 熟练掌握二项分布、泊松分布、正态分布等的性质及概率计算;
5. 了解随机变量函数的分布;
6. 了解随机向量及分布函数的概念、性质;
7. 掌握离散型随机向量和连续型随机向量及其分布; 8. 掌握二维随机向量的数字特征;
9. 了解契比晓雪夫不等式和大数定律及其意义; 10. 掌握中心极限定理及其应用;
11. 了解用计算二项分布、泊松分布、正态分布等常用分布的概率。
二、内容提要
(一)随机变量及常用分布 1. 离散型随机变量及常用分布 名 称 分布律 定 义 性质或背景 1. ≥0,1,2,… 2. 备 注 P{},1,2,… 或 X x1 x2 … … P p1 p2 … … 36 / 137
0-1分布 P{1}, P{0},或 X P 0 1 二项分布1的特例: B(1)( 一重贝努里D(X) 试验) q p 二项分P{ k}= Cknpkqnk, X为n重贝努里试验 中A事件发生的次数 D(X) 二项分布泊松近似布B() 0,1,… 泊松分布P{}=, k=0,1,2,… , D(X)= >0公式 (≈) (n很大,pP() 是常数 较小) 超几何 P{}= 分布 1,2,…() 无放回产品抽样试验 当N→+∞时,时, knkCNCNMlimCnkpkqnk nNCNnMN nM(Nn)(NM)N2(N1)D(X) 2. 连续型随机变量及常用分布 名 称 定 义 对任意a(x) = 标准正态分布 ﹣∞ E(Y))] (X1) (X2) (X, 联程度 ()-E(X)·E(Y) 3. X及Y独立Y)=0 4. D(X±Y) =D(X)(Y)±2(X, Y) 1. |2. |相关系数 ≤1; 1存在常数a、描述X及Y间线性相关程度; =0,称Xb 使得P{}=1; 3. X及Y独立 X及Y不相关, 反之不一定及Y不相关; 成立。 (三)随机变量函数的分布 类 型 X的分布 函数(X)的分布 数学期望公式 40 / 137 离散型 X的分布律 P{}, 1,2,… Y的分布律为 P{()} ,1,2,…。 若有某些g()相等,则对其作适当的并项,即对应概率相加 分布函数法: (y){Y≤y}{g(X)≤y}{x:g(x)y} X fX(x)dx 连续型 (X)的密度:(y)′Y(y) X的密度为 (x) 定理公式法: 若(x)在 (x)非零区间上严格单调, X h(y)是(x)的反函数 fX[h(y)]|h'(y)|, y fY(y) 其它,0, (四)二维随机向量及分布 1. 二维离散型随机向量 名 称 联合 分布律 定 义 PXxi,Yyjpij,i,j1,2,性质或试验背景 备 注 联合分布律的列表结构 (概率分布表) 1. ≥0,1,2,…, 2. X的 边缘分布 PXxipijpi., j1随机变量X的分布由联合分布律“行值律 相加” i1,2,41 / 137 Y的 边缘分布 PYyjpijp.j, i1随机变量Y的分布由联合分布律“列值律 相加” j1,2,.独立性 X及Y相互独立 X、Y的边缘分布完按定义验证独立性, 全确定其联合分实用中由试验独立布律 性得 pijpipj,i,j1,2,. 2. 二维连续型随机向量 名称 定 义 性质或试验背景 备 注 Px1Xx2,y1Yy2y22xx1y1f(x,y)dxdy联合密度 对平面上的区域1. f()≥0 f(x, y) D 2.f(x,y)dxdy1 X的边缘密度 fX(x)f(x,y)dy随机变量X的密度 (x)(x) fY(x)f(x,y)dx随机变量Y的密度 (y)= (y) Y的边缘密度 独立性 X及Y相互独立 X、Y的边缘分布完按定义验证独立性; f(x,y)fX(x)fY(y) 全确定其联合分布实用中由试验独立律 性得 二维 正态分布 (X, Y)~ X及Y相互独立 X~N(1,12) Y~N(2,22) =0; 是X及Y的相关系数 N(μ1,μ2,212,2,) 42 / 137 3. 二维随机向量的分布函数 名 称 联合分布函数定义 离散型 () ﹣∞<x, y<+∞ 定 义 性质或试验背景 备 注 F(x, y)=P{X≤≤y} 1. 0≤F(x, y)≤1; ﹣∞<x, y<+∞ F()可以描述任2. F(-∞, y)= 0, F(∞)=0, 意类型()的分布 F(-∞∞)=0, F(+∞, + ∞)=1; 3. F(x, y)对x, y均为右连续; 4. F(x, y)对x和y单调不减; xy连续型 F(x,y)f(u,v)dudv﹣∞<x, y<+∞ () X的边缘 分布函数 (x)为X的分布函数 由F()可确定(x)及(y),反之未必 Y的边缘 分布函数 (y)为Y的分布函数 (五)大数定律和中心极限定理 名 称 条 件 结 论 备 注 在已知X的均值和方差时,估计X及其均值E(X)的偏差大(小)于的概率 X的E(X)、对任意>0,有 契贝晓夫 不等式 D(X)均存在有限 PXE(X)D(X)或 2PXE(X)1DX 243 / 137 设{}为相互独对任意立且服从同一分布的随机变切比雪夫 大数定律 量序列,又>0,有 当n足够大时, 将依概率收敛于其均值μ 1nlimPXk0 nnk1即PE()=, D()=2 (1,2,…)均存在有限 设(或贝努里 大数定律 n~B(); n对任意ε>0,有 。 以严格数学形式描述“频率的稳定性”。 在试验次数很大时,用事件A的频率作为其概率的近似值 为n重贝努里试验中即A发生的频率 事件A发生的次数,P(A)) 勒维-林德贝格中心极限定理 (独立同分布中心极限定理) 设{}为相互独令,则 立且服从同一nn足够大时,近似服从N(n, n 2limPYnx(x) ) 分布的随机变即n很大时,~N(0, 量序列,又1)(近似) E()=, D()=2(1,2, 德莫佛-拉普…)均存在有限 设n~B(); 令,则 当n很大(n>30)44 / 137 拉斯中心极限定理 (贝努里情形中心极限定理) (或n为n重nlimPYnx(x) 时,有贝努里试验中即n很大时,~Panbbnpanp()().事件A发生的N(0,1)(近似), 或npqnpq 次数,P(A)) ~N( , ) (近似) n 三、综合例题解析 例1(1991年考研题) 一汽车沿一街道行驶,需要通过三个均设有红绿灯的路口。每个信号灯为红或绿及其他信号灯为红或绿相互独立,且红绿两种信号显示的时间相等。以X表示该汽车首次遇到红灯前已通过的路口个数,求X的概率分布。 解:首先,由题设可知,X的可能值为0,1,2,3。现设 = {汽车在第i个路口首次遇到红灯},1,2,3, 则事件A1,A2,A3相互独立,且 (i = 1,2,3), 故有 P{X = 0} = P(A1) = 1, 2P{X1}P(A1)P(A2)122 1 32P{X2}P(A1A2A3)P(A1)P(A2)P(A3)P{X3}P(A1A2A3)P(A1)P(A2)P(A3)1 32所以,X的分布律为 45 / 137 X P 0 1 2 3 12122123123 注意:利用性质:pi1,可检查离散型概率分布律的正确及否。同时, i若X的某个取值x0的概率较难计算,而其他所有取值的概率已算出时,则也可以利用上述性质得到: P{Xx0}1i:xix0pi。 1。 32比如本例中: P{X3}1P{X0}P{X1}P{X2}例2 设连续型随机变量X的分布函数为 x2F(x)ABe, x0 x00, 求:(1)常数A、B;(2)概率密度函数f(x)。 解:(1)由分布函数的性质F(+∞)=1得 (ABe)A1, F(+∞)= xlimx2再由分布函数的连续性知其右极限F(0+0)= F(0),即 F(0+0)= lim(ABe)AB0 x00x2联立上述两式,解之得:A =1, B =﹣1。 则分布函数为 x2F(x)1e, x0 x00, 46 / 137 (2)所求密度函数为 x12e, x0。 f(x)F(x)20, x0 例3(1989年考研题)设随机变量在区间[1,6]上服从均匀分布,求方程 x2 + x + 1 = 0有实根的概率。 解:易知方程x2 + x + 1 = 0有实根当且仅当Δ= ~U[1,6],求P{| 2 -4≥0,即||≥2。 故所求问题转化为:已知|≥2}。 现因在[1,6]上服从均匀分布,则 的概率密度为 方程x2 +ξx + 1 = 0有实根的充要条件是Δ= 2 -4≥0,即||≥2,故 P{2}1P{2}1P{22} 1f(x)dx1(0dx222121114dx)1。 555例4 已知X~N(2, 解:由于X~N(2, 2 2 ),P{2<X<4}=0.3,求P{X<0}。 ),故 42222)()()(0)0.3 σσσP{2X4}(由于,可知 2()(0)0.30.8, 故 P{X0}(0222)()1()10.80.2。 注意:在正态分布的概率计算中,首先要将它标准化,转化为利用标准正态分布的公式求解即可。 例5(1989年考研题)设随机变量X和Y独立,且X服从均值为1,标准差 47 / 137 为2的正态分布,而Y服从标准正态分布,试求随机变量Z = 2X-Y + 3的概率密度函数。 解:由于X和Y相互独立且都服从正态分布,所以Z作为X,Y的线性组合也服从正态分布,故只需求E(Z)和D(Z)就可确定Z的概率密度函数了。 由题设知,X~N(1,2),Y~N(0,1)。则由期望和方差的性质得 E(Z) = E(2X-Y + 3)=2E(X)-E(Y) +3 = 5, D(Z) = D(2X-Y + 3) = 22D(X) (Y) = 9. 又因X,Y是相互独立的正态随机变量,Z是X,Y的线性函数,故Z也为正态随机变量,即Z~N ( , 2 ),且 2 = E(Z)=5, 则Z的概率密度为 fZ(z)132e= D(Z)=9。 (z5)229, z。 注意:本题主要考察的性质是:一是独立正态分布的线性组合仍为正态分布;二是正态分布N ( , 2 )完全由其期望和方差 2 决定。 例6 已知随机变量X的概率分布律为 P{}=1/2k,1,2,…, 试求Ysin(X)的概率分布律。 2解:对随机变量Ysin(0,﹣1, 0, …, 即 2X),当X 取1, 2, …, n, …时,Y的取值为1, X 1 2 3 4 5 6 7 … Ysin(2X) 1 0 -1 0 1 0 48 / 137 -1 … P 112221231241251261 72则Ysin(X)只以﹣1,0,1为其取值,其取值概率为 2故Y的分布律为 例7 设(X,P{﹣1}{3}{7}{11}+… 12312712111128; 111516P{0}= P{2}{4}{6}+… 1221111124264; 1134P{1}{1}{5}{9}+… 121111825292 111516(或P{1}=1-P{﹣1}-P{0}=) Y -1 0 1 P )的联合分布律为 Y X -1 0 1 1/4 1/4 49 / 137 Y2 1/6 a 3131求:(1)常数a;(2)联合分布函数在点(,)处的值F(,)。 2222解:(1)由联合分布律的性质 知 1求得。 ijpij111a, 44631(2)(X,Y)的联合分布函数F(x, y)在点(,)处的值应为 223131111F(,)P{X,Y}P{X1,Y1}P{X1,Y0}。 2222442注:求联合分布函数F(x,y)的值时,只需把取值满足≤x,≤y的点(,)的概率找出来,然后求和就可以了。 2,),则X及Y相互独立的充分必要条件是例8 设(X,Y)~N(1,2,12,2=0。 证:(充分性)由于(X,Y)~N(1,2,1,2,),则其X及Y的边缘密度分别为 fX(x)1e21(x1)222122, x fY(y)当=0时,有 122e(x2)2222, y, 50 / 137 1x12y22f(x,y)exp()()21222111e21(x1)2221122e(y2)2222 fX(x)fY(y),故X及Y相互独立。 (必要性)若已知X及Y相互独立,则对任意x,y,有 f(x,y)fX(x)fY(y), 特别地,取x1,y2,上式变为 1212121212, 从而有 =0。 例9(2001年考研题) 一生产线生产的产品成箱包装,每箱的重量是随机的。假设每箱平均重50千克,标准差为5千克。若用最大载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保障不超载的概率大于0.977。( (2)=0.977,其中 (x)是标准正态分布函数)。 解:设是汽车装运的第i箱的重量(千克),n为最多可以装的箱数,则X1, X2,…, 可视为n个相互独立而且服从同分布的随机变量,再设X为n箱的总重 量,则有 ,且 E(Xi)50, =D(Xi)5,而由列维-林德贝格中心极限定理,X近似服从正态分布N(n则所求箱数n决定于条件 , n2 )。 500050nXn5000nPX5000P()0.977 n5nn因(2)=0.977,则有 51 / 137 解之得n<98.02 , 即最多可以装98箱。 例10 设在n重伯努利试验中,每次试验事件A发生的概率都是0.7。 (1)设X表示1000次独立试验中事件A发生的次数,用中心极限定理计算 P{650<X≤750}; (2)要使在n次试验中,A发生的频率在0.68及0.72之间的概率至少为0.9,问至少要做的试验次数n为多少? 解(1)因X~B(1000,0.7),由德莫佛-拉普拉斯中心极限定理得 650npXnp750npP{650X750}Pnpqnpqnpq75070065070050()()2()12(3.5)1 21021021020.9997710.99954.(2)X为n次独立试验中事件A发生的次数,因此,n次试验中,A发生的频率为X,其中X~B(n,0.7),E(X) = 0.7n,D(X) = 0.21n,依题意,n应使 n0.72n0.7n0.68n0.7nXP0.680.72P{0.68nX0.72n}n0.21n0.21n0.02n 210.9,0.21n 即 由于(1.65) = 0.95,所以,n应使 , 即 n因此,至少要做1430次试验。 注意:运用德莫弗-拉普拉斯定理计算概率近似值时,其关键是:“标准化”和“正态近似”,n越大所得的近似值越精确。 注:(1)若X~B(n, p),则,其中相互独立且都服从参数为p的0-1分布; 5717.251429.31. 452 / 137 (2)二项分布概率的计算,可总结为下述三种方法; 方法一:X~B(n, p),且不太大(n≤20)时,直接计算。 kknkP{Xk}Cnpq,k0,1,,n。 (q1p). 方法二:当n较大,且p较小(n≥20,p<0.1)时,由泊松定理,可近似计算: P{Xk}kk!e,np. 方法三:当n较大,而p不太小时,用中心极限定理作正态近似计算 例11 一复杂系统由n个相互独立起作用的部件所组面,每个部件的可靠性(即部件正常工作的概率)为0.9,且必须至少有80%的部件工作才能使整个系统工作。问:(1)n至少为多大时,才能使系统的可靠性不低于0.95?(2)若该系统由85个部件组成,则该系统的可靠性是多少? 解:令{ n个部件中正常工作的部件数},则X~B(n,0.9)。 (1) 由题意应求出n,使得 0.8n0.9nXnp0.8nnpPX0.8n1P1()npq0.90.1nnpq 1(0.1n0.09n)(n)0.953则,n≥24.206。故n至少为25时,才能使系统的可靠性不低于0.95。 (2)所求可靠性为 85Xnp0.885npPX0.8851P)(3.073)0.9989。 (3npqnpq 四、习题三解答 1. 下面两表是否可作为离散型随机变量的分布列?为什么? 53 / 137 0 1 X ﹣1 0 2 ﹣0.5 0.9 X 2 0.6 0.1 P 0.6 解:对表1,因为 P 0.15 P{﹣1}=﹣0.5 <0, 所以不可作为离散型随机变量的分布列。 对表2,因为 pk13k0.60.10.150.851, 所以不可作为离散型随机变量的分布列。 2.一盒中有五枚纪念章,编号为1,2,3,4,5,从中任取3枚,用X表示取出的纪念章的最大号码,求X的分布律。 解:由题意知:X的取值为3,4,5, P{3}=, P{4}=, P{5}= 故X的分布律为 X P 0 1 2 0.1 0.3 0.6 或 X的分布律为 P{}=, 3,4,5。 3.进行某种试验,成功的概率为3/4,失败的概率为1/4,以X表示直到试验成功所需试验的次数,(1)试写出X的概率分布;(2)求X取偶数的概率。 54 / 137 解:(1)X的概率分布律为 133P{Xk}()k1k,1,2,… 444(2)X取偶数的概率 P{偶数}= P{ 2}+ P{ 4}+…+ P{ 2k}+… 3233333420.2 242k144441151244.设随机变量X的分布列为: X P 0 1 2 3 0.1 0.4 0.2 p3 求:(l)p3;(2)P{0 故 p3=1-0.7=0.3。 (2)P{0 当1≤x<2时,F(x)= P{X≤x}= P{0} + P{1}=0.4+0.2=0.6; 当2≤x<3时,F(x)= P{X≤x}= P{0} + P{1}+ P{2}=0.4+0.2+0.3=0.9; 当x≥3时,F(x)= P{X≤x}= P{0} + P{1} + P{2}+ P{3} =1。 故X的分布函数为 55 / 137 x00, 0.4, 0 x1F(x)0.6, 1 x2 0.9, 2 x3 x31, 5.设随机变量X的分布列为 X P -2 0 2 0.4 0.3 0.3 试求:E(X),E(X2),E(35),D(X),D(35)。 解:E(X)=xkpk20.400.320.30.2; k12(2)0.4020.3220.32.8; E(X)= xk2pk2 33k1E(35)= 3 E(X)+5=3×(﹣0.2)+5=4.4; D(X)(X2)-[E(X)]2=2.8-(﹣0.2)2=2.8-0.04=2.76; D(35)=9 D(X)=9×2.76=24.84。 6.甲、乙两批原料,过筛后得知颗粒分布如下: 粒 度 180 200 220 240 260 百分比(%) 甲 5 15 60 15 5 乙 20 20 20 20 20 56 / 137 平均说来,哪一批颗粒较粗?哪一批颗粒均匀性较差? 解:令X、Y分别为甲、乙两批原料的颗粒粒度,则 E(X)=xkpk1800.052000.152200.62400.152600.05220 k155E(Y)=ykpk1800.22000.22200.22400.22600.2220 k1 因为E(X)= E(Y),故甲、乙两批原料的颗粒一样粗。 DXxkE(X)pk 2k15222(180220)0.05(200220)0.15(220220)0.6 = 22(240220)0.15(260220)0.05=280 DYykE(Y)pk 2k15222(180220)0.2(200220)0.2(220220)0.2 = 22(240220)0.2(260220)0.2=800 因为D(X)< D(Y),故乙批原料的颗粒均匀性较差。 7.设随机变量X的概率分布 P() =a, 1, 2,… N试确定常数a,共计算E(X)及D(X)。 解:因 pkk1NaaaaNa1, NNNN故1。 11E(X)=xkpkkNNk1k111E(X)=xpkkNNk1k12 NNkk1N1N(N1)N1; N22N2kN2k2k1N1N(N1)(2N1)(N1)(2N1) N6657 / 137 (N1)(2N1)N12N21()D(X)(X)-[E(X)]= 62122 2 8.设X服从的概率分布为: P{}1,(1,2,…), 其中0 p是常数,则称X服从参数为p的几何分布g(p)。试求E(X)。 解一: E(X)=(0 k1又 q E(X)=p(q2q23q3) 则 E(X)-q E(X)(12+…) 故 E(X)= 11; 1q11=。 1qpk1解二: E(X)kpqk1pkqk1 k1现求级数的和。由于 (0 dkdk(q)(q)kqk1, dqk0k0dqk1因此 kqk1k1d11(), 2dq1q(1q)从而 E(X)p111p。 22(1q)pp 9. 设随机变量X的概率密度为 Cx, 0x1 f(x) 其他0, 试求:(1)常数C;(2)X落在(0.3,0.7)内的概率;(3)分布函数F(x); 58 / 137 (4)E(X)。 解:(1)x21Cf(x)dxCxdxC[]01, 故2。 0221 0.70.7.722(2)P{0.3X0.7} 0.3f(x)dx 0.32xdx[x2]00.30.70.30.4 (3)当x<0时,F(x) f(x)dx 0dx0; xx2; 当0≤x<1时,F(x) f(x)dx 0dx 02xdx[x2]0 x 0x x x当x≥1时,F(x) f(x)dx 0dx 02xdx 10dx[x2]101。 即 X的分布函数为 0, x0F(x)x2, 0 x1 1, x1 x 01 xx312(4)E(X)xf(x)dx0x2xdx[2]0。 331 10.设随机变量X的分布函数为 1ex, x0F(x) 0, x0试求:(1)P{X<4},P{X>1};(2)概率密度函数f(x)。 解:(1)P{X<4}(4)=1-4, P{X>1}=1-P{X≤1}=1-F(1)= 1-(1-e -1)= 1 ex, x0 (2)f(x)F(x) x00, 11.设随机变量X的概率密度为 0x1x, f(x)2x,1x2 0, 其他59 / 137 试求(1)分布函数F(x);(2)数学期望E(X)。 解:(1)当x<0时,F(x) f(x)dx 0dx0; 当0≤x<1时,F(x) x x x xx2; f(x)dx0dxxdx 02 0x当1≤x<2时,F(x) f(x)dx 0dx 0xdx 1(2x)dx 1x21x2(2x)(2)2x1 2222 01 x当x≥2时,F(x) x f(x)dx0dxxdx(2x)dx0dx 0 1 2 01 2 xx21x22[]0[2x]11。 22即X的分布函数为 x00, 2x, 0 x12F(x)2 x2x1, 1 x22 x21, (2)E(X)xf(x)dx 0xdx 112 2x31x322x(2x)dx[]0[x]11。 3312.设随机变量X在(0,5)上服从均匀分布,求方程4t2 + 4 + (2)=0中, t有实根的概率。 解:随机变量X服从的均匀分布为 10x5, f(x)5 其它,0, 为使方程4t2 + 4 + (2)=0中的t有实根的充要条件是 Δ= (4X)2-4×4(2)=16X2-16X-32≥0, 60 / 137 即 X2-X-2≥0 则所求概率为 P{ X2-X-2≥0}= P{ (X-2)(1)≥0}= P{X≥2且X≥﹣1} { X≤2且X≤﹣1} {X≥2} { X≤﹣1}0=。 13.某车间有20台车床独立工作,每台车床开车时间占总工作时间的0.3,又开车时每台车床需用电力是1单位,问:(1)车间需要电力的最可能值是多少单位?(2)若供给车间9单位电力,则因电力不足而耽误生产的概率等于多少?(3)供给车间至少多少单位电力,才能使因电力不足而耽误生产概率小于1%? 解:设X为20台车床中开车的车床数,则X服从二项分布B(20, 0.3)。 (1)因为 (1)21×0.3=6.3 非整数,故对6.3取整得[6.3]=6,即车间需要电力的最可能值是6单位电力。 (2)所求概率为(查附表2) k(0.3)k(0.7)20k0.04796 P{X>9}= P{X≥10}=P{Xk}C20k10k102020(3)设供给车间m单位电力, 则电力不足的概率为 P{X>m}= P{X≥1}= km1P{Xk}Ckm12020k20(0.3)k(0.7)20k0.01 对20, 0.3, 查附表2得 1=12, 故11,即至少供给车间11单位电力。 14.设X服从二项分布B(2,p),Y服从二项分布B(3,p), 若已知P{X≥1}=5/9, 试求P{Y≥1}的值。 解:因X服从二项分布B(2,p),又 P{X≥1}=1-P{0}=1-(1-p)2= 则 (1-p)2=1-=,1-p =, 5499235961 / 137 故p =。 又因为Y服从二项分布B(3,p), 即B(3,),故 3P{Y≥1}= 1-P{0}=1-(1-p)3 =1-=()13132319。 2715.某地胃癌的发病率为0.01%,现普查5万人,试求(1)没有胃癌患者的概率;(2)胃癌患者少于5人的概率。 解:设X为胃癌患者人数,则X服从二项分布B(50000,0.0001)。因为50000很大,而0.0001非常小,算。 (1) 所求概率为 50000×0.0001=5,故可利用泊松近似公式进行计 P{0}=0.999950000≈5=0.00674 (1) 所求概率为 P{X<5}=1-P{X≥5}=1- 5000050000k5Ck50000(0.0001)k(0.9999)50000k 1k55k5e10.55950.4405。 k!16.一电话交换台每分钟接到的呼唤次数服从参数为4的泊松分布,试求:(1)一分钟内有8次呼唤的概率;(2)一分钟内呼唤次数大于10的概率。 解:设X表示电话交换台每分钟接到的呼唤次数,则X服从的分布为 P{}=,1,2,…; (1)P{8}0.02977; (2)P{X>10}= P{X≥11}=。 17. 设X~N(5, 22),查表计算概率:(1)P{4≤X<7};(2)P{>1}。 解:(1)P{4≤X<7} = (1)-(1- (1)- (﹣0.5) (0.5)=0.8413-1+0.6915=0.5328 (0.5))= (1)-1+ 62 / 137 (2)P{>1}= 1-P{≤1} =1-P{﹣1≤X≤1}=1-[] =1-[ (﹣2)- (﹣3)]= 1-[1- (2)-1+(3)]=1+ (2)-(3) =1+0.9773-0.9987=0.9786 18.将一温度调节器放置在贮存某种液体的容器内,调节器调整在d℃,则液体温度X是一个随机变量,且X~N(d,0.52)。(1)若90,求X<89的概率;(2)若要保持液体温度至少为80℃的概率不小于0.99,问d至少为多少? 解:(1)因X~N(90, 0.52), 则 P{X<89} (﹣2)= 1- (2) =1-0.9773=0.0227 (2)依题意应有 P{X≥80}≥0.99, 即 P{X≥80}=1-P{X≤80} =1-≥0.99, 则 ≥0.99, 查表得 , 故 d ≥ 80+0.5×2.33=81.165。 19.某工厂生产的螺栓长度()服从参数 =10.05, =0.06的正态分布, 如果规定长度在10.05±0.12内为合格品,求任取一螺栓为不合格品的概率。 解:螺栓为合格品的概率xk1kpkkpqk1k1pkqk1p(12q3q2),
对此级数逐项求导,得