【高中教育】最新高考数学考点解读+命题热点突破专题17统计与统计案例文
2024-06-10
来源:步旅网
——教学资料参考参考范本—— 【高中教育】最新高考数学考点解读+命题热点突破专题17统计与统计案例文 ______年______月______日 ____________________部门 1 / 15 【命题热点突破一】抽样方法 某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x,某件产品A被抽到的概率为y,则x,y的值分别为( ) A.25, B.20,6 C.25, D.25,6 【答案】D 【特别提醒】 三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. 【变式探究】 从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________. 【答案】74 【解析】每8件产品抽取一件,编号为58的产品在样本中,则样本中产品的最大编号为58+16=74. 【命题热点突破二】用样本估计总体 【20xx高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5), 2 / 15 11 [22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ) (A)56 (D)140 【答案】D 【变式探究】(1)将某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图183所示),其中茎为十位数,叶为个位数,则这组数据的中位数和平均数分别是( ) 图183 A.91,91.5 B.91,92 C.91.5,91.5 D.91.5,92 (2)20xx年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有________人. 【答案】(1)C (2)6912 【解析】(1)中位数为=91.5,平均数为90+=91.5. (2)根据样本估计总体的思想,可知该地区群众对“键盘侠”持反对态度的概率约为,所以该地区9600人中对“键盘侠”持反对态度的大约有9600×=6912(人). 【特别提醒】 统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数. 3 / 15 (B)60 (C)120 【变式探究】 (1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是[0,5),[5,10),…,[35,40],作出的频率分布直方图如图184所示,则原始的茎叶图可能是( ) 图184 图185 (2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图186所示,数据分组依次如下: [70,90),[90,110),[110,130),[130,150]. 估计该班数学成绩的平均分数为( ) 图186 A.112 B.114 C.116 D.120 【答案】(1)B (2)B 【命题热点突破三】统计案例 例3、某高校共有15 000人,其中男生10 500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方 4 / 15 法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:小时). (1)应收集多少名女生的样本数据? (2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图187所示),其中样本数据分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率. (3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”. P(K≥k0) k0 20.10 2.706 0.05 3.841 0.010 6.635 0.005 7.879 附:K2=(a+b)(c+d)(a+c)(b+d) 【解析】:(1)300×=90,所以应收集90名女生的样本数据. (2)由频率分布直方图得每周平均参加体育运动超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均参加体育运动时间超过4小时的概率约为0.75. (3)由(2)知,300名学生中有300×0.75=225(名)学生每周平均参加体育运动的时间超过4小时,其余75名学生每周平均参加体育运动的时间不超过4小时.又因为抽取的300名学生中有210名男生、90名女生,所以每周平均参加体育运动时间与性别的列联表如下: 每周平均参加体育运动 男生 45 女生 30 总计 75 n(ad-bc)2 5 / 15 的时间不超过4小时 每周平均参加体育运动 的时间超过4小时 总计 165 210 60 90 225 300 结合列联表可得K2的观测值k==≈4.762>3.841. 所以有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”. 【特别提醒】 在计算K2时要注意公式中各个字母的含义,分子上是总量乘2×2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积. 【变式探究】 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y之间的关系. 时间x 命中率y 1 0.4 2 0.5 3 0.6 4 0.6 5 0.4 (1)求小李这5天的平均投篮命中率; (2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率. 设线性回归方程为=x+,则由公式可得== (-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)=0.01, (-2)2+(-1)2+02+12+22所以=-=0.5-0.01×3=0.47, 所以=x+=0.01x+0.47. 6 / 15 当x=6时,=0.53,故小李该月6号打6小时篮球的投篮命中率约为0.53. 【特别提醒】 回归直线一定过样本点的中心(x,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:正相关时回归直线方程的斜率为正值;负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的. 【高考真题解读】 1.【20xx年高考四川】(本小题满分12分) 我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨)、一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.xxx (I)求直方图中a的值; (II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (III)若该市政府希望使85%的居民每月的用水量不超过标准(吨),估计的值,并说明理由.xx 【答案】(Ⅰ);(Ⅱ)36000;(Ⅲ)2.9.a0.30 【解析】 7 / 15 (Ⅱ)由(Ⅰ),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为 300 000×0.12=36 000. (Ⅲ)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85, 而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85, 所以2.5≤x<3. 由0.3×(x–2.5)=0.85–0.73, 解得x=2.9. 所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准. 2.【20xx高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ) 8 / 15 (A)56 (D)140 【答案】D (B)60 (C)120 【解析】由频率分布直方图知,自习时间不少于22.5小时为后三组,有(人),选D.200(0.160.080.04)2.5140 1.(20xx·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( ) A.167 【答案】 B 【解析】 由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选B. 2.(20xx·安徽,6)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( ) A.8 B.15 C.16 D.32 【答案】 C 3.(20xx·重庆,3)××市20xx年各月的平均气温(℃)数据的茎叶图如下: 则这组数据的中位数是( ) 0 1 2 2 8 9 2 5 8 0 0 0 3 3 8 1 2 B.137 C.123 D.93 A.19 【答案】 B B.20 C.21.5 D.23 9 / 15 【解析】 从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20,选B. 4.(20xx·新课标全国Ⅱ,31)根据下面给出的20xx年至20xx年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( ) A.逐年比较,20xx年减少二氧化硫排放量的效果最显著 B.20xx年我国治理二氧化硫排放显现成效 C.20xx年以来我国二氧化硫年排放量呈减少趋势 D.20xx年以来我国二氧化硫年排放量与年份正相关 【答案】 D 5.(20xx·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x(万元) 支出y(万元) 8.2 6.2 8.6 7.5 10.0 8.0 11.3 8.5 11.9 9.8 根据上表可得回归直线方程=x+,其中=0.76,=y-x.据此估计,该社区一户年收入为15万元家庭的年支出为( )ybabab A.11.4万元 C.12.0万元 【答案】 B B.11.8万元 D.12.2万元 10 / 15 【解析】 回归直线一定过样本点中心(10,8),∵=0.76,∴=0.4,由=0.76x+0.4得当x=15万元时,=11.8万元.故选B. bayy 6.(20xx·山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( ) A.6 B.8 【答案】 C C.12 D.18 7.(20xx·陕西,9)设样本数据x1,x2,…,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为( ) A.1+a,4 C.1,4 【答案】 A 【解析】 B.1+a,4+a D.1,4+a 11 / 15 8.(20xx·湖南,2)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2