高考大题规X解答系列(六)——概率与统计
考点一 离散型随机变量的分布列与期望
例1(2021·某某联考)甲盒中有三个白球和三个红球,乙盒中仅装有三个白球,
球除颜色外完全一样.现从甲盒中任取三个球放入乙盒中.
(1)求乙盒中红球个数X的分布列与期望; (2)求从乙盒中任取一球是红球的概率. 【标准答案】——规X答题 步步得分 (1)由题意知X的可能取值为0,1,2,3.
32C01C193C33C3
P(X=0)=3=,P(X=1)=3=,2分得分点①
C620C62010C29C313C33C3
P(X=2)=3=,P(X=3)=3=,4分得分点②
C620C620
所以X的分布列为
X P 5分得分点③
0 11 92 93 20120 20 20 3
所以E(X)=0×+1×+2×+3×=.6分得分点④
202020202(2)当乙盒中红球个数为0时,P1=0,7分得分点⑤ 13
当乙盒中红球个数为1时,P2=×=,8分得分点⑥
2064023
当乙盒中红球个数为2,P3=×=,9分得分点⑦
20620131
当乙盒中红球个数为3时,P4=×=,10分得分点⑧
20640
99
1991
1 / 19
word
1
所以从乙盒中任取一球是红球的概率为P1+P2+P3+P4=.12分得分点⑨
4【评分细如此】
(1)第一问中,正确算出P(X=0),P(X=1),P(X=2),P(X=3)各得1分,列出分布列得1分,求出期望得1分.
(2)第二问中,分类讨论,每种情况各占1分. (3)其他方法按步骤酌情给分.
例2(2019·课标Ⅰ,21)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪
种新药更有效,为此进展动物试验.试验方案如下:每一轮选取两只白鼠对药效进展比照试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,假如施以甲药的白鼠治愈且施以乙药的白鼠未治愈,如此甲药得1分,乙药得-1分;假如施以乙药的白鼠治愈且施以甲药的白鼠未治愈,如此乙药得1分,甲药得-1分;假如都治愈或都未治愈,如此两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为
X.
(1)求X的分布列;
(2)假如甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效〞的概率,如此p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中
a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
①证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列; ②求p4,并根据p4的值解释这种试验方案的合理性. 【标准答案】——规X答题 步步得分 (1)X的所有可能取值为-1,0,1.
P(X=-1)=(1-α)β, P(X=0)=αβ+(1-α)·(1-β),
2 / 19
word P(X=1)=α(1-β).
所以X的分布列为
X P 4分得分点①
-1 (1-α)β 0 1 αβ+(1-α)(1-β) α(1-β) (2)①由(1)得a=0.4,b=0.5,c得分点② 因此piPi-1pipi+1,
故0.1(pi+1-pi)=0.4(pi-pi-1), 即pi+1-pi=4(pi-pi-1).6分得分点③ 又因为p1-p0=p1≠0,
所以{pi+1-pi}(i=0,1,2,…,7)是公比为4,首项为p1得分点④ ②由①可得
p8=p8-p7+p7-p6+…+p1-p0+p0
48-1
=(p8-p7)+(p7-p6)+…+(p1-p0)=p1.
3由于p8=1,故p1=8,
4-1
所以p4=(p4-p3)+(p3-p2)+(p2-p1)+(p1-p0) =44-13
3
p1=
1
257
.10分得分点⑤
p4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药
治愈率为0.8时,认为甲药更有效的概率为p4=≈0.003 9,11分得分点⑥
257
得分点⑦ 【评分细如此】
1
3 / 19
word ①每个式子1分,表格1分;给出X的可能取值给1分; ②得出a、b、c的值(有正确的)得1分; ③得到Pi+1-Pi=4(Pi-Pi-1)得1分; ④给出结论得1分;
⑤得出P8,P4,P1的表达式各得1分; ⑥说明P4非常小得1分; ⑦说明实验方案合理得1分. 【名师点评】
1.核心素养:此题主要考查相互独立事件的概率、随机变量的期望、方差的应用、二项分布、决策问题等,考查数据处理能力、运算求解能力,考查或然与必然思想,考查的核心素养的逻辑推理、数学建模、数学运算、数据分析.
2.解题技巧:破解此类题的关键:一是认真读题,读懂题意;二是会利用导数求最值;三是会利用公式求服从特殊分布的离散型随机变量的期望值;四是会利用期望值,解决决策型问题.
〔变式训练1〕
(2021·某某五市十校教研教改共同体联考)某学校为了了解学生对新冠病毒的传播和预防知识的掌握情况,学校决定组织一次有关新冠病毒预防知识竞答.竞答分为必答题(共5题)和选答题(共2题)两局部.每位同学答题相互独立,且每道题答对与否互不影响.甲同42学答对每道必答题的概率为,答对每道选答题的概率为. 55
(1)求甲恰好答对4道必答题的概率;
(2)在选答阶段,假如选择回答且答对奖励5分,答错扣2分,选择放弃回答得0分.甲1
同学对于选答的两道题,选择回答和放弃回答的概率均为,试求甲同学在选答题阶段,得
2分X的分布列.
[解析](1)甲恰好答对4道必答题的概率为
4 / 19
word
P=C45
41256
4×=. 55625
121
(2)依题意,每道题选择回答并答对的概率为×=,
255133
选择回答且答错的概率为×=,
25101
选择放弃回答的概率为.
2
甲得分的可能性为-4分,-2分,0分,3分,5分和10分. 所以P(X=-4)=,
100
9
P(X=-2)=C12
1133
××=, 22510
111
P(X=0)=×=,
224
P(X=3)=C12
11233
×××=, 2255251121××=, 2255
P(X=5)=C12
1121
2P(X=10)=××=.
22525所以X的分布列为
X P -4 9-2 30 143 35 1510 251100 10 25 考点二 线性回归分析 例3(2018·全国2)如下图是某地区2000年至2016年环境根底设施投资y(单位:
亿元)的折线图.
5 / 19
word
为了预测该地区2018年的环境根底设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①;^
yt,根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:yt.
(1)分别利用这两个模型,求该地区2018年的环境根底设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【分析】(1)模型①中取t=19,模型②中取t=9,求出对应的函数值即可;(2)利用所
^
给折线图中数据的增长趋势,加以分析即可.
【标准答案】——规X答题 步步得分
(1)利用模型①,该地区2018年的环境根底设施投资额的预测值为 ^
y×19=226.1(亿元).3分得分点①
利用模型②,该地区2018年的环境根底设施投资额的预测值为 ^
y×9=256.5(亿元).6分得分点② (2)利用模型②得到的预测值更可靠. 8分得分点③ 理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线yt上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境根底设施投资额的变化趋势.2010年相对2009年的环境根底设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境根底设施投资额的变化
6 / 19
word ^
规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型yt可以较好地描述2010年以后的环境根底设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境根底设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比拟合理,说明利用模型②得到的预测值更可靠.
(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分) 12分得分点④ 【评分细如此】
①根据模型①求出预测值给3分; ②根据模型②求出预测值给3分; ③判断模型②得到的预测值更可靠给2分; ④作出正确的判断,写出合理理由,给4分; 【名师点评】
1.核心素养:此题主要考查线性回归方程的实际应用,考查考生的应用意识,分析问题与解决问题的能力以与运算求解能力,考查数学的核心素养是数据分析、数学建模、数学运算.
2.解题技巧:统计中涉与的图形较多、常见的有条形统计图、折线图、茎叶图、频率分布直方图、应熟练地掌握这些图形的特点,提高识图与用图的能力.
〔变式训练2〕
(2021·某某某某质检)经销商小王对其所经营的某一型号二手汽车的使用年数x(0 word 系为ωx2x+17.2,根据(1)中所求的回归方程,预测x为何值时,小王销售一辆该型号汽车所获得的利润z最大. n 附:回归直线的斜率和截距的最小二乘估计公式分别为b= ^ xiyi-nx·y-- ^-^,a=y-bi=1 nxxi-n- 2 2 i=1 - x. -1 [解析](1)由表中数据,得x=×(2+4+6+8+10)=6, 5-1 y=×(16+13+9.5+7+4.5)=10, 5由最小二乘法得 b= ^ 2×16+4×13+6×9.5+8×7+10×4.5-5×6×10 =-1.45, 4+16+36+64+100-5×36 ^ a=10-(-1.45)×6=18.7, 所以y关于x的回归直线方程为yx+18.7. (2)由题意,z=y-ω xx2x+17.2) x2x+1.5, 其中0 =-0.05(x-3)2+1.95, 所以预测x=3时,销售一辆该型号汽车所获得的利润最大. 考点三 独立性检验 例4(2018·课标全国Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完 成某项生产任务的两种新的生产方式.为比拟两种生产方式的效率,选取40名工人,将他 8 / 19 word 们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高,并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过 m和不超过m的工人数填入下面的列联表: 第一种生产方式 第二种生产方式 超过m 不超过m (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=nad-bca+bc+d2 a+c b+d. P(K2≥k) k 【分析】(1)根据茎叶图中的数据大致集中在哪个茎,作出判断; (2)通过茎叶图确定数据的中位数,按要求完成2×2列联表; (3)根据(2)中2×2列联表,将有关数据代入公式计算得K2的值,借助临界值表作出统计推断. 【标准答案】——规X答题 步步得分 得分点① 理由如下: (i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高. 9 / 19 word (ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. (iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高. (iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多.关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间一样,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高. 79+81 (2)由茎叶图知m=得分点② 2列联表如下: 第一种生产方式 第二种生产方式 8分得分点③ 4015×15-5×520×20×20×20 2 超过m 15 5 不超过m 5 15 (3)由于K2==10>6.635,11分得分点④ 所以有99%的把握认为两种生产方式的效率有差异. 12分得分点⑤ 【评分细如此】 ①答案给出了4种理由,考生答出任意一种或其他合理理由,均给4分; ②由茎叶图求出中位数,给2分; ③按要求完成2×2列联表,给2分; 10 / 19 word ④根据公式正确求出K2的值,给3分; ⑤借助于临界值表作出判断,给1分. 【名师点评】 1.核心素养:茎叶图与独立性检验是高考命题的重点,在每年的高考试题都以不同的命题背景进展命制.此类问题主要考查学生的分析问题和解决实际问题的能力,同时考查“数据分析〞的数学核心素养. 2.解题技巧:(1)审清题意:弄清题意,理顺条件和结论; (2)找数量关系:把图形语言转化为数字,找关键数量关系; (3)建立解决方案:找准公式,将2×2列联表中的数值代入公式计算; (4)作出结论:依据数据,借助临界值表作出正确判断. 〔变式训练3〕 (2021·某某百校联考)2020年3月受新冠肺炎疫情的影响,我市全体学生只能网上在线学习.为了了解学生在线学习的情况,市教研院数学教研室随机从市区各高中学校抽取60名学生对线上教学情况进展调查(其中男生与女生的人数之比为2:1),结果发现男生中有10名对线上教学满意,女生中有12名对线上教学不满意. (1)请完成如下2×2列联表,并回答能否有90%的把握认为“对线上教学是否满意与性别有关〞; 男生 女生 合计 满意 不满意 合计 60 (2)以这60名学生对线上教学的态度的频率作为1名学生对线上教学的态度的概率,假如从全市学生中随机抽取3人,设这3人中对线上教学满意的人数为X,求随机变量X的分布列与数学期望. 附:参考公式与临界值表 11 / 19 word K2= nad-bca+bc+d2 a+c b+d,其中n=a+b+c+d. P(K2>k0) k0 [解析](1)由题意可知抽取60名学生中男生有40人,女生有20人,如此列联表如下: 男生 女生 合计 60×10×12-30×82因为K= 18×42×40×20 满意 10 8 18 2 不满意 30 12 42 合计 40 20 60 10=≈1.429<2.706, 7 所以没有90%的把握认为“对线上教学是否满意与性别有关〞. 33,, (2)X的可能取值为0,1,2,3,由题意可知,X~B 10 P(X=k)=Ck37 k3-k,k=0,1,2,3, 3 1010 随机变量X的分布列为 X P 3 9 0 3431 2 3 1000 4411000 1891000 100027E(X)=3× =. 1010 考点四 正态分布 例5 国庆70周年阅兵式上的女兵们是一道靓丽的风景线,每一名女兵都是经过 层层筛选才最终入选受阅方队,筛选标准非常严格,例如要求女兵身高(单位:cm)在区间[165,175]内.现从全体受阅女兵中随机抽取200人,对她们的身高进展统计,将所得数据分为[165,167),[167,169),[169,171),[171,173),[173,175]五组,得到如下列图的频 12 / 19 word 率分布直方图,其中第三组的频数为75,最后三组的频率之和为0.7. - (1)请根据频率分布直方图估计样本的平均数x和方差s2(同一组中的数据用该组区间的中点值代表); (2)根据样本数据,可认为受阅女兵的身高X(cm)近似服从正态分布N(μ,σ2),其中μ- 近似为样本平均数x,σ2近似为样本方差s2. (ⅰ)求P(167.86 参考数据:假如X~N(μ,σ2),如此P(μ-σ [解析](1)由题知五组频率依次为0.1,0.2,0.375,0.25,0.075,1分 - 故x×××××174=170,2分 s2=(170-166)2×0.1+(170-168)2×0.2+(170-172)2×0.25+(170-174)2×0.075 =4.6;4分 (2)由题知μ=170, σ=4.6= 1155 ≈2.14,5分 0.954 4-0.682 6 2 (ⅰ)P(167.86 13 / 19 word 1-0.954 4 (ⅱ)P(X>174.28)==0.022 8, 2 故10人中至少有1人的身高在174.28 cm以上的概率 P=1-(1-0.022 8)10=1-0.977 210≈ 〔变式训练4〕 (2021·某某某某模拟)3D打印通常是采用数字技术材料打印机来实现的,常在模具制造、工业设计等领域被用于制造模型,后逐渐用于一些产品的直接制造,已经有使用这种技术打印而成的零部件.该技术应用十分广泛,可以预计在未来会有广阔的开展空间,某制造企业向A高校3D打印实验团队租用一台3D打印设备,用于打印一批对内径有较高精度要求的零件.该团队在实验室打印出了一批这样的零件,从中随机抽取10件零件,度量其内径的茎叶图如下列图(单位:μm). (1)计算平均值μ与标准差σ; (2)假设这台3D打印设备打印出的零件内径Z服从正态分布N(μ,σ2),该团队到工厂安装调试后,试打了5个零件,度量其内径分别为:86,95,103,109,118(单位:μm),试问:此打印设备是否需要进一步调试,为什么? 参考数据:P(μ-2σ 97+97+98+102+105+107+108+109+113+114 μ= 10=105 μm, 14 / 19 word σ2= -82+-82+-72+-32+02+22+32+42+82+92 10 =36, 所σ=6μm. (2)结论:需要进一步调试. 理由如下:如果机器正常工作,如此Z服从正态分布N(105,62), P(μ-3σ 而86∉(87,123),根据3σ原如此知机器异常,需要进一步调试.(还可有其它解释,合理即可) 考点五 *概率、统计与函数、数列、不等式的综合 例6(2021·百师联盟期末)出版商为了解某科普书一个季度的销售量y(单位:千 本)和利润x(单位:元/本)之间的关系,对近年来几次调价之后的季销售量进展统计分析,得到如下的10组数据. 序号 1 2 3 4 5 6 7 8 9 10 10 x y 根据上述数据画出如下列图的散点图: (1)根据图中所示的散点图判断y=ax+b和y=cln x+d哪个更适宜作为销售量y关于利润x的回归方程类型?(给出判断即可,不需要说明理由); (2)根据(1)中的判断结果与参考数据,求出y关于x的回归方程; (3)根据回归方程分析:设该科普书一个季度的利润总额为z(单位:千元),当季销售量 15 / 19 word y为何值时,该书一个季度的利润总额预报值最大?(季利润总额=季销售量×每本书的利 润) 参考公式与参考数据: ^^ ①对于一组数据(u1,ν1),(u2,ν2),…,(un,νn),其回归直线ν=α+βu的斜率和截 n^ 距的公式分别为β= i=1 ui-un- νi-ν- 2 - ^-^-,α=ν-βu. i=1 ui-u②参考数据: 10-x -y -u 10i=1-(xi-x)2 10i=1-(ui-u)2 i=1-(xi-x) 10i=1-(ui-u) -(yi-y) -(yi-y) -110 表中ui=ln xi,u=ui. 10i=1 ≈1.40.计算时,所有的小数都准确到0.01. [解析](1)y=cln x+d更适宜作为销售量y关于利润x的回归方程类型. (2)令u=ln x,先建立y关于u的线性回归方程, 10 ^由于c=i=1 ui-u10 - yi-y2 - ==-10.20, i=1 -ui-u^--- a=y-c·u×1.75=24.48, 所以y关于u的线性回归方程为 ^ yu, 即y关于x的回归方程为 ^ y=24.48-10.20ln x. 16 / 19 word (3)由题意得 z=xy=x(24.48-10.20ln x), z′=[x(24.48-10.20ln x)]′ =14.28-10.20ln x, 令z′=0即14.28-10.20ln x=0, 解得ln x=1.40,所以x≈4.06. 当x∈(0,4.06)时,z′>0, 所以z在(0,4.06)上单调递增, 当x∈(4.06,+∞)时,z′<0, 所以z在(4.06,+∞)上单调递减, 所以当x=4.06时,即季销量y=10.20千本时,季利润总额预报值最大. 〔变式训练5〕 (2021·某某省局部重点高中期末联考)11月,2019全国美丽乡村篮球大赛在中国农村改革的发源地——某某凤阳举办,其间甲、乙两人轮流进展篮球定点投篮比赛(每人各投一次为一轮).在一样的条件下,每轮甲乙两人站在同一位置,甲先投,每人投一次球,两人有1人命中,命中者得1分,未命中者得-1分;两人都命中或都未命中,两人均得0分.设12 甲每次投球命中的概率为,乙每次投球命中的概率为,且各次投球互不影响. 23 (1)经过1轮投球,记甲的得分为X,求X的分布列; (2)假如经过n轮投球,用pi表示经过第i轮投球,累计得分,甲的得分高于乙的得分的概率. ①求p1,p2,p3; ②规定p0=0,经过计算机计算可估计得pi=api+1+bpi+cpi-1(b≠1),请根据①中 p1,p2,p3的值分别写出a,c关于b的表达式,并由此求出数列{pn}的通项公式. [解析](1)X的可能取值为-1,0,1. 17 / 19 word 121 P(X=-1)=1-×=, 233 12112 P(X=0)=×+1-×1-=, 23223211 P(X=1)=×1-=. 362∴X的分布列为 X P 1 (2)①由(1)知,P1=, 6 -1 130 121 1 6 经过两轮投球甲的累计得分高有两种情况:一是两轮甲各得1分;二是两轮有一轮甲得0分,有一轮甲得1分, 11117 1∴P2=×+C2××=. 662636 经过三轮投球,甲的累计得分高有四种情况:一是三轮甲各得1分;二是三轮有两轮各得1分,一轮得0分;三是1轮得1分,两轮各得0分;四是两轮各得1分,1轮得-1分, 111114311322122∴P3=+C3×+C3××+C32×=. 6626263216 ②由pi=api+1+bpi+cpi-1, 知pi=pi+1+pi-1, 1-b1-b1743 将p0=0,p1=,p2=,p3=代入, 6362166c1 求得=,=, 1-b71-b7 aca18 / 19 word 61 ∴a=(1-b),c=(1-b), 7761 ∴pi=pi+1+pi-1, 7771 pi+1=pi-pi-1. 661 ∴pi+1-pi=(pi-pi-1), 61 ∵p1-p0=, 6 1 ∴{pn-pn-1}是等比数列,首项和公比都是, 6 pn-pn-1=n, 6 ∴pn=p0+(p1-p0)+(p2-p1)+…+(pn-pn-1) 111-6n161 1-. ==6n15 1-6 1 19 / 19 因篇幅问题不能全部显示,请点此查看更多更全内容