2 总体分布的估计 第19课时 频率分布表
【学习导航】 学习要求 1.感受如何用样本频率分布表去估计总体分布; 2.自己亲自体验制作频率分布表的过程,注意分组合理并确定恰当的组距; 【课堂互动】 自学评价
案例1 为了了解7月25日至8月24日北京地区的气温分布状况,我们对往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):
7月25日至8月10日8月8日 至8月24日 222 32.5 30.3 30.2 22.8 29.4 25.6
24.7 30.0 30.1 29.5 30.3
怎样通过上表中的数据,分析比较两时间段的高温(≥)状况呢? 【分析】
要比较两时间段的高温状况,最直接的方法就是分别统计这两时间段中高温天数.如果天数差距明显,则结论显然,若天数差距不明显,可结合其它因素再综合考虑.上面两样本中的高温天数的频率用下表表示: 时间 总天数
高温天数(频数) 频率
7月25日至8月10日8月8日至8月24日开始,分别统计各组中的频数,再计算各组的频率,并将结果填入下表: 分 组 频数累计 频数
频率 100 3 0.03 合 计 100 1
【小结】编制频率分布表的步骤如下:
(1)求全距,决定组数和组距,组距=全距/组数; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
(3)登记频数,计算频率,列出频率分布表. 在分组时,为了容易看出规律,一般分组使每组的长度相等,组数不宜太多也不宜太少.一般地,称区间的左端点为为下组限,右端点 为上组限。我们可以采用下组限在内而上组限不在内的分组方法,也可采用下组限不在内而上组限在内 的分组方法。如果取全距时不利于分组(如不能被组数整除),如何处理可适当增大全距,如在左、右两端各增加适当范围(尽量使两端增加的量相同. 精典范例
例1 某铸件厂从规定尺寸为的一堆零件中任取100件,
测得它们的实际尺寸如下: 25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.40 25.39 25.41 25.36 25.38 25.31 25.56
25.37 25.44 25.33 25.46 25.40 25.49 25.34 25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.36
25.42 25.39 25.46 25.38 25.35 25.31 25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.35
25.41 25.37 25.47 25.39 25.42 25.42 25.24 25.47 25.35 25.45 25.43 25.37 25.40 25.34 25.51 25.45 25.44 25.40 25.38 25.43 25.41 25.40
25.38 25.40 25.36 25.33 25.42 25.40 25.50 25.37 25.49 25.35 25.39 25.39 25.47
1)这100件零件尺寸的全距是多少?
2)如果将这100个数据分为11组,则如何分组?组距为多少?
3)画出以上数据的频率分布表。
4)如果规定尺寸在 之间的零件为合格产品抽样检查,合格品率大于85%,这批零件才能通过检验,则这批产品能通过检验吗? 【解】
1)该组数据中最小值为25.24,最大值为25.56,它们相
差0.32,故可取区间
[25.235,25.565],并将此区间等分成11个区间,这100个零件尺寸的全距为 25.235 - 25.565=0.33 2)组距为 3) 分 组 频数累计 频 数 频 率 100 2 0.02 合 计 100 1
4)尺寸在 之间的零件的累计频率为0.12+0.18+0.25+0.16+0.13=0.840.85 故这批零件不能通过抽样检验。 追踪训练一
1.一个容量为20的数据样本,分组与频数为:则样本数据在区间 上的可能性为( D )
,
(A)5% (B)25% (C)50% (D)70%
2.下面是不同厂家生产的手提式电脑的重量(单位:kg),试列出其频率分布表 1.9 2.0 2.1 2.4 2.4 22.4 2.2 1.6 2.8 3.2 220
分析:全距 3.2-故可取区间[1.45,3.25]并将此区间分成6个小区间 分 组 频数累计 频 数 频 率
20 2 0.10 合 计 20 1
3.一本书中,分组统计100个句子中的字数,得出下列结果:字数1~5个的15句,字数6~10个的27句,字数11~15个的32句,字数16~20个的15字,字数21~25个的8句,字数26~30个的3句,请作出字数的频率分布表,并利用组中值对该书中平均每个句子包含的字数作出估计。 分 组 频数累计 频数 频率 1~0.15 6~10 42 27 0.27 11~2
0.32 16~200.15 21~20.08 26~30 100 3 0.03 合 计 100 1
可以估计,该书中平均每个句子子包含字数为: 3×0.15+8×0.27+13×0.32+18×0.15+23×0.08+28×0.03≈12个.
4.李老师为了分析一次数学考试情况,全校抽了50人,将分数分成5组,第一组到第三组的频数10,23,11,第四组的频率为0.08,那么落在第五组(89.5~99.5分)的频数是多少?频率是多少?全校300人中分数在89.5~99.5中的约有多少人? 解: 频率是每一小组的频数与数据总数的比值,第四组的频率是0.08,则第四组的频数是4,从而可求出第五组的频数、频率,并由样本估计出全校300人中分数在89.5~99.5之间的人数.第四组的频数为 ,第五组的频数为-11-4=2,频率为 ,所以全校在
89.5~99.5之间的约有 人. 第4课时频率分布表
分层训练 1.在10人中,有4个学生,2个干部,3个工人,1个农民,数0.4是学生占总( ) (A)频数 (B)概率 (C)频率 (D)累积频率 2.在用样本频率估计总体分布的过程中,下列正确的是 ( ) (A) 总体容量越大,估计越精确 (B) 总体容量越小,估计越精确 (C) 样本容量越大,估计越精确 (D) 样本容量越小,估计越精确 3.一个容量为20的数据样本,分组与频数为 则样本数据的可能性为55%的区间是( ) (A) 4.一个容量为20的样本,已知某组的频率为 ,则该组的频数为___________ 5.一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=___________. 6.已知样本7,10,14,8,
7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,12,那么这组数据落在8.5~11.5内的频率为________ 7.将一个容量为100的样本数据,按照从小到大的顺序分为8个组,如下表. 组 号 1 2频 数
10并且知道第6组的频率是第3组频率的两倍,问第6
组的频率是多少?
8.列出下列数据的频率分布表。2.1 12.3 13.002 12.9 13.22.7 1222.8 1222
13.6思考 运用 9.某中学为了参加全国中学生运动会,打算组织100名学生组成校运动队,限制每名学生只参加一个运动项目,其中有13人报名参加了田径,10人进入了体操队,11选择了乒乓球队,另外参加三大球足球、篮球和排球的各有24人、27人和15人,请列出学生参加各运动队的频率分布表
10.有一个容量为45的样本数据,分组后各组的频数如下,根据累积频率分布,估计小于27.5的数据约为总体的多少。
因篇幅问题不能全部显示,请点此查看更多更全内容