第一章
绪论
一、填空题
1. 统计工作与统计学的关系是__统计实践____和___统计理论__的关系。
2. 总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3. 统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。
4. 要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5. 样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。
6. 标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 性别是_品质标志_标志,标志表现则具体体现为__男__或__女 _两种结果。
8. 统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9. 指标与标志的主要区别在于:
(1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。
(2) 标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10. 一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 1. 2. 3. 4. 5. 6. 7.
统计总体的同质性是指( A )。 A.总体各单位具有某一共同的品质标志或数量标志 设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D )。D.800家工业企业的全部工业产品 有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为( A )。A.200家公司的全部职工 一个统计总体( D ) D.可以有多个指标 以产品等级来反映某种产品的质量,则该产品等级是( C )。 C.品质标志 某工人月工资为1550元,工资是( B )。 B.数量标志 某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D )。 D.变量值 工业企业的职工人数、职工工资是( D )。 D.前者是离散变量,后者是连续变量 统计工作的成果是( C )。 C.统计资料 统计学自身的发展,沿着两个不同的方向,形成( C )。 C.理论统计学与应用统计学
三、多项选择题
统计的含义包括( ACD )。 A.统计资料 C.统计工作 D.统计学 统计研究运用各种专门的方法,包括( ABCDE )。A.大量观察法 B.统计分组法 C.综合指标法 D.统计模型法 E.统计推断法 全国第5次人口普查中( BCE )。 B.总体单位是每一个人 C.全部男性人口数是统计指标 E.人的年龄是变量 下列各项中,属于连续变量的有( ACD )。A.基本建设投资额 C.国民生产总值中3次产业比例 D.居民生活费用价格指数 下列指标中,属于数量指标的有( AC )。 A.国民生产总值 C.全国人口数 下列标志中,属于品质标志的有( BE )。 B.所有制 E.产品质量 下列各项中,哪些属于统计指标?( ACDE )
A.我国2005年国民生产总值 C.某地区出生人口总数 D.某企业全部工人生产某种产品的人均产量 E.某市工业劳动生产率 8. 统计指标的表现形式有( BCE )。 B.总量指标 C.相对指标 E.平均指标 9. 总体、总体单位、标志、指标间的相互关系表现为( ABCD )。
A.没有总体单位也就没有总体,总体单位也不能离开总体而存在 B.总体单位是标志的承担者 C.统计指标的数值来源于标志 D.指标是说明总体特征的,标志是说明总体单位特征的 10. 国家统计系统的功能或统计的职能有( ABCD )。 A.收集信息职能 B.提供咨询职能 C.实施监督职能 D.支持决策职能 四、判断题 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 第二章
统计数据的收集
总体的同质性是指总体中的各个单位在所有标志上都相同。(×) 数量指标是指由数量标志汇总来的,质量指标是由品质标志汇总来的。(×) 品质标志和质量指标一般不能用数值表示。(×) 全国人口普查的总体单位是户。(×) 商品的价格在标志分类上属于数量标志。(√)
因为统计指标都是用数值表示的,所以数量标志就是统计指标。(×) 差异性是统计研究现象总体数量的前提。(√) 统计分组法在整个统计活动过程中都占有重要地位。(√) 推断统计学是描述统计学的基础。(×)
可变标志是总体同质性特征的条件,而不变标志是总体差异性特征的条件。(×)
1
一、填空题
1. 常用的统计调查方式主要有___普查___、___抽样调查__、___重点调查___、__典型调查 __、__统计报表 __等。 2. 典型调查有两类:一是____解剖麻雀式____,二是____划类选典式_____。
3. 统计调查按调查对象包括的范围不同可分为___全面调查___、___非全面调查___。 4. 重点调查是在调查对象中选择一部分__重点单位_进行调查的一种__非全面__调查。 5. 抽样调查属于__非全面__调查,但其调查目的是要达到对__总体数量__特征的认识。
6. 常用的统计调查方法主要有__访问调查__、___邮寄调查__、__电脑辅助电话调查__、__电话调查__和__网络调查__等。 7. 无论采用何种调查方法进行调查都要先制定_____调查方案______。
8. 若要调查某地区工业企业职工的生活状况,调查对象是_工业企业全部职工_,调查单位是_工业企业每一名职工_,填报单位是__每一个工业企业__。
9. 调查表一般由__表头__、___表体___和__表外附加__3部分组成。 10. 调查表一般有____一览表___和___单一表____两种形式。 二、单项选择题
1. 某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量80%的5个大型水泥厂的生产情况进行调查,这种调查方式是( D )。 D.重点调查
2. 全面调查是对调查对象总体的所有个体进行调查,下述调查属于全面调查的是( B )。 B.某地区对工业企业设备进行普查 3. 抽样调查与重点调查的主要区别是( D )。 D.选取调查单位的方法不同 4. 人口普查规定统一的标准时间是为了( A )。 A.避免登记的重复与遗漏 5. 以下哪种场合宜采用标准式访问( A )。 A.居民入户调查 6. 某地区进行国有商业企业经营情况调查,则调查对象是( B )。 B.该地所有国有商业企业 7. 调查项目( A )。 A.是依附于调查单位的基本标志 8. 统计调查的基本任务是取得原始统计资料,所谓原始统计资料是( C )。 C.直接向调查单位进行登记取得的资料 9. 某市进行工业企业生产设备普查,要求在7月1日至7月10全部调查完毕,则这一时间规定是( B )。 B.调查期限 10. 问卷设计的主体部分是( C )。 C.问题和答案 三、多项选择题 1. 2.
普查是一种( BCD )。 B.专门调查 C.全面调查 D.一次性调查 某地对集市贸易个体户的偷漏税情况进行调查,1月5日抽选5%样本检查,5月1日抽选10%样本检查,这种调查是( ABC )。 A.非全面调查 B.一次性调查 C.不定期性调查 3. 邮寄问卷适用于以下哪些调查对象( ABCD )。 A.企业 B.机关团体 C.个人 D.特定的群体 4. 非全面调查是指( CDE )。 C.重点调查 D.典型调查 E.抽样调查 5. 某市对全部工业企业生产设备的使用情况进行普查,则每一台设备是( AC )。 A.调查单位 C.总体单位 6. 下列各调查中,调查单位和填报单位一致的是( CD )。 C.工业企业普查 D.商业企业调查 7. 制定一个周密的统计调查方案,应确定( ABCE )。
A.调查目的和调查对象 B.调查单位和填报单位 C.调查项目和调查表 E.调查时间和时限 8. 调查单位是( BCE )。 B.需要调查的社会经济现象总体中的个体 C.调查项目的承担者 E.调查对象所包含的具体单位 9. 抽样调查的优越性表现在( ABCE )。 A.经济性 B.时效性 C.准确性 E.灵活性 10. 在一份问卷中有这样一问题“您的职业是 ?①教师 ②公务员 ③军人 ④企业管理人员 ⑤职工 ⑥个体户 ⑦其他 ”,请问该问题属于( ABC )。 A.事实性问题 B.半开放半封闭问题 C.答案的设计是多项式的 四、判断题 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 第三章
统计数据的整理与显示
重点调查中的重点单位是根据当前工作的重点来确定的。( × ) 对有限总体进行调查只能采用全面调查。( × )
我国的人口普查每10年进行一次,因此它是一种连续性调查方法。( × ) 制定调查方案的首要问题是确定调查对象。( × ) 开放式问题是指备选答案可供选择的问题。( × ) 访问调查回答率较低,但其调查成本低。( × ) 电话调查的问题要明确且数量要少。( √ ) 实验法是一种特殊的观察法。( √ )
一览表是指一份表格上只体现一个调查单位的情况表。( × ) 表头是统计调查表的主体。( × )
一、填空题 1. 2.
统计整理的关键在于_____统计分组_____。
按每个变量值分别作为一组叫__单项式分组__,其组数等于___变量值个数___。
2
3. 已知一个组距式分组的最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为____1000____和____950____。
4. 在确定组限时,最小组的下限要低于或等于__最小变量值__,最大组的上限要高于或等于___最大变量值__。 5. 为了消除异距数列中组距不同对各组次数的影响,需要计算__频数密度___。 6. 统计数据的显示形式主要有___统计表___和___统计图___。
7. 统计表主要由__表头_、__行标题__、__列标题__和__数字资料__4部分组成。
8. 数据的预处理是数据整理的先行步骤,它是在对数据分类或分组之前对__原始数据__和_第二手数据__所做的处理,包括对数据的_审核_、_筛选_和__排序_。
9. 对统计数据准确性审核的主要方法有__逻辑检查__和_计算检查_两种。 10. 直方图是用___矩形____的宽度和高度来表示频数分布的图形。 二、单项选择题 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 1. 2. 3. 4. 5. 6. 7.
进行统计分组的关键是( B )。 B.正确选择分组标志 按某一标志分组的结果表现为( B )。 B.组内同质性,组间差异性 划分离散变量的组限时,相邻两组的组限( C )。 C.既可以是间断的,也可以是重叠的 某连续变量的分组中,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组的组中值为( C )。 C.230 下列分组中按品质标志分组的是( B )。 B.产品按质量优劣分组 用组中值代表各组内的一般水平的假定条件是( D )。 D.各组频数在本组内呈均匀分布 频数分布用来表明( A )。 A.总体单位在各组的分布状况 在分组时,若有某单位的变量值正好等于相邻组的下限时,一般应将其归在( B )。 B.下限所在组 在进行组距式分组时,当全距不变的情况下,组距与组数的关系是( B )。 B.反比例关系 多变量的图示方法是( D )。 D.雷达图
三、多项选择题
统计分组的作用在于( ABE )。A.区分现象的类型 B.反映现象总体的内部结构变化 E.研究现象之间数量的依存关系 指出下列分组哪些是按品质标志分组( AD )。 A.企业按所有制分组 D.产品按合格与不合格分组 构成频数分布表的基本要素是( AD )。 A.各组的组别 D.分配在各组的次数 组限的确定通常有两种方法,它们是( BC )。B.对连续变量采用重叠分组法 C.对离散变量采用不重叠分组法 对统计总体进行分组时,采用等距分组还是异距分组,决定于( AD )。A.现象的特点 D.数据分布是否均匀 统计数据的审核主要是审核数据的( ABC )。 A.准确性 B.及时性 C.完整性 统计数据整理的内容一般有( ABCE )。 A.对原始数据进行预处理 B.对统计数据进行分组 C.对统计数据进行汇总 E.编制统计表、绘制统计图 8. 国民经济中常用的统计分组有( ABCDE )。
A.经济成分分组 B.登记注册类型分组 C.国民经济行业分类 D.3次产业分类 E.机构部门分类
9. 某单位100名职工按工资额分为3000元以下、3000~4000元、4000~6000元、6000~8000元、8000元以上等5个组。这一分组( BDE )。 B.分组标志是连续变量 D.相邻的组限是重叠的 E.某职工工资6000元,应计在6000~8000元组内 10. 变量数列中频率应满足的条件是( BC )。 B.各组频率大于或等于0 C.各组频率之和等于1 四、判断题 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
统计数据整理就是对原始资料的整理。( × )
能够对统计总体进行分组,是由统计总体中各个单位所具有的差异性特点决定的。( √ ) 对一个既定的统计总体而言,合理的分组标志只有一个。( × )
组中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。( × ) 凡是分组表都是次数分布表。( × )
按数量标志分组的目的,就是要区别各组在数量上的差别。( × )
连续型变量可以作单项式分组或组距式分组,而离散型变量只能作组距式分组。( × ) 在组距相等的条件下,频数分布和频数密度的分布是一致的。( √ ) 年代都是以数字表示的,所以按年代排列各种指标属于按数量标志分组。( × ) 饼形图是以圆的面积或圆内各扇形的面积来表示数值大小或总体内部结构的一种图形。( √ )
六、计算题 1.
有一个班40名学生的统计学考试成绩如表3-3所示。
表3-3 40名学生的统计学考试成绩表 89 88 76 99 74 60 82 60 93 94 82 77 79 97 78 87 84 79 98 67 59 72 56 81 77 73 65 83 63 89 86 95 92 84 85 79
99 65 66 70
学校规定:60以下为不及格;60~75分为中;76~89分为良;90~100为优。试把该班学生分为不及格、中、良、优4组,编制一张频数分布表。
解:统计学考试成绩频数分布表如下表3-7所示。表3-7 40名学生的统计学考试成绩频数分布表
3
成绩分组 60分以下 60 ~ 75 76 ~ 89 90 ~100 合 计 学生人数(人) 2 11 19 8 40 比率(%) 5.0 27.5 47.5 20.0 100.0 2. 宏发电脑公司在全国各地有36家销售分公司,为了分析各公司的销售情况,宏发公司调查了这36家公司上个月的销售额,所得数据如表3-4所示。 表3-4 分公司销售额数据表 (单位:万元) 60 72 78 86
60 73 78 87
62 74 79 88
65 75 79 89
65 76 80 89
66 76 82 90
67 76 83 91
70 76 84 92
71 77 84 92
根据上面的资料进行适当分组,并编制频数分布表。 解:“销售额”是连续变量,应编制组距式频数分布表。具体过程如下:
第一步:计算全距:R926032
第二步:按经验公式确定组数:K13.3lg367 第三步:确定组距:d32/75
第四步:确定组限:以60为最小组的下限,其他组限利用组距依次确定。 第五步:编制频数分布表。如表3-8所示。表3-8 分公司销售额频数分布表 按销售额分组(万元) 公司数(个) 频率(%) 60 ~ 65 3 8.33 65 ~ 70 4 11.11 70 ~ 75 5 13.89 75 ~ 80 10 27.78 80 ~ 85 5 13.89 85 ~ 90 5 13.89 90 ~ 95 4 11.11 合 计 36 100.00 3. 有27个工人看管机器台数如表3-5所示。表3-5 工人看管机器台数表 (单位:台)
5 2 2
4 4 2
2 3 3
4 4 4
3 3 5
4 2 3
3 6 2
4 4 4
4 4 3
试编制一张频数分布表。 解:“工人看管机器台数”是离散变量,变量值变动范围很小,应编制单项式频数分布表。
编制结果如表3-9所示。表3-9 工人看管机器台数频数分布表 看管机器台数(台) 工人数(人) 工人数的比重(%) 2 6 22 3 7 26 4 11 41 5 2 7 6 1 4 合 计 27 100 4. 对下面职工家庭基本情况调查表(如表3-6所示)中的答复进行逻辑检查,找出相互矛盾的地方,并进行修改。
4
姓名 刘 盛 陈心华 刘淑影 刘平路
性别 年龄 男 女 女 男
44 40 18 16
与被调查者 的关系 被调查者本人
夫妻 长女 长子
工作单位 长城机电公司 市第一针织厂 待业青年 医学院
参加工作年月 1973.7 1975.4 1999 2000
职务或工种 干部 工人 无 学生
固定工或临时工 临时 固定 临时 无
表3-6 职工家庭基本情况
调查表
解:职工家庭基本情况调查表修正如表3-10所示。 表3-6 职工家庭基本情况
调查表
姓名 刘 盛 陈心华 刘淑影 刘平路
性别 年龄 男 女 女 男
44 40 18 16
与被调查者 的关系 被调查者本人
夫妻 父女 父子
工作单位 长城机电公司 市第一针织厂 待业青年
医学院学习
参加工作年月 1973.7 1975.4 — 2000
职务或工种 干部 工人 无 学生
固定工或临时工 固定 固定 无 无
5
第四章 数据分布特征的测度 一、填空题
1. 平均指标的数值表现称为__平均数__,其计算方法按是否反映了所有数据水平而可分为___数值平均数__和__位置平均数__两类。
xf 2. 加权算术平均数的公式为 ,从中可以看到,它受__变量值__大小 xf和__权数__大小的影响。
3. 当变量值较大而次数较多时,平均数接近于变量值较___大__的一方;当变量值较小而次数较多时,平均数靠近于变量值较___小__的一方。
4. 某班70%的同学平均成绩为85分,另30%的同学平均成绩为70分,则全班总平均成绩为___80.5___。 5. 统计中的变量数列是以__平均数__为中心而左右波动,所以平均数反映了总体分布的____集中趋势____。
6. 中位数是位于一组数据_中间位置_的那个变量值,众数是在总体中出现次数__最多__的那个变量值。中位数和众数也可以称为___位置__平均数。
7. 在___左偏____分布下,MoMex,在___右偏____分布下,MoMex,在____正态___分布之下,MoMex。在适度偏态情况下,Mox等于__3_ 倍Mex。 8. 极差是一组数据的__最大值__与_最小值_之差,在组距分组资料中,其近似值是__ _最高组上限-最低组下限___。 9. 已知某组数据的平均数是200,离散系数是30%,则该组数据的方差是_____3600______。
10. 测定峰度,往往以 4阶中心矩m4 为基础。依据经验,当0时,频数分配曲线为__正态曲线__;当0时,为__平顶__曲线;当0时,为___尖顶__曲线。 二、单项选择题
1. 计算平均指标时最常用的方法和最基本的形式是( D )。 D.算术平均数 2. 若两组数据的标准差相等而平均数不等,则( B )。 B.平均数大代表性大 3. 如果所有变量值的频数都减少为原来的1/5,而变量值仍然不变,那么算术平均数( A )。 A.不变 4. 已知5个水果商店苹果的单价和销售额,要求计算5个商店苹果的平均单价,应该采用( C )。 C.加权调和平均法 5. 计算平均数的基本要求是所要计算的平均数的总体单位应是( B )。 B.同质的
6. 由组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,有一个假定条件,即( C )。 C.各组标志值在本组内呈均匀分布
7. 离中趋势指标中,最容易受极端值影响的是( A ) A.极差 8. 当数据组高度偏态时,哪一种平均数更具有代表性?( C ) C.众数 9. 一组数据的偏态系数为1.3,表明该组数据的分布是( D )。 D.右偏分布 10. 当一组数据属于左偏分布时,则( D )。 D.众数在右边、平均数在左边 三、多项选择题 1.
加权算术平均数的大小受哪些因素的影响( ABC )。
A.受各组频数或频率的影响 B.受各组标志值大小的影响 C.受各组标志值和权数的共同影响 2. 平均数的作用是( ABD )。
A.反映总体的一般水平 B.对不同时间、不同地点、不同部门的同质总体平均数进行对比 D.测定总体各单位分布的集中趋势 3. 众数是( ABCD )。
A.位置平均数 B.总体中出现次数最多的标志值 C.不受极端值的影响 D.适用于总体单位数多,有明显集中趋势的情况 4. 加权算术平均数的计算公式有( BC )。 xffx B. C. ff5. 几何平均数主要适用于( BCDE )。 B.标志值的连乘积等于总比率的情况 C.标志值的连乘积等于总速度的情况 D.具有等比关系的变量数列 E.求平均比率时 6. 标志变异指标能反映( CD )。 C.总体分布的离中趋势 D.变量分布的离散趋势 7. 在下列哪些情况下,必须计算离散系数来比较两数列的离散程度大小( AD )。
A.平均数大的标准差亦大,平均数小的标准差亦小 D.两数列的计量单位不同
8. 不同数据组间各标志值的差异程度可以通过标准差系数进行比较,因为标准差系数( AB )。
A.消除了不同数据组各标志值的计量单位的影响 B.消除了不同数列平均水平高低的影响 9. 关于极差,下列说法正确的有( ABD )。
A.只能说明变量值变异的范围 B.不反映所有变量值差异的大小 D.最大的缺点是受极端值的影响 10. 平均指标与变异指标结合运用体现在( ACE )。
A.用变异指标说明平均指标代表性的大小 C.以平均指标为基础,用变异指标说明经济活动的均衡性 E.以平均指标为基础,用变异指标说明总体各单位的离散程度
四、判断题 1. 2. 3. 4. 5. 6. 7. 8. 9.
权数对算术平均数的影响作用取决于本身绝对值的大小。( × ) 一个数列不可能没有众数,也不可能没有中位数。( × )
中位数和众数都属于平均数,因此它们数值的大小受到总体内各单位标志值大小的影响。( × ) 标志变异度指标越大,均衡性也越好。( × ) 在正态分布情况下,X与Mo、Me之间相等。( √ )
若数据组的均值是450,标准差为20,那么,所有的观察值都在45020的范围内。( × ) 总体中各标志值之间的差异程度越大,标准差系数就越小。( × ) 如果两个数列的极差相同,那么,它们的离中程度就相同。( × )
离中趋势指标既反映了数据中各标志值的共性,又反映了它们之间的差异性。( × )
6
10. 在对称分布的条件下,高于平均数的离差之和与低于平均数的离差之和,必然相等,全部的离差之和一定等于0。( √ ) 六、计算题 1.
某厂对3个车间1季度生产情况分析如下:
第1车间实际产量为190件,完成计划95%;第2车间实际产量为250件,完成计划100%;第3车间实际产量为609件,完成计划105%。则3个车间产品产量的平均计划完成程度为: 95%100%105%1车间产品单位成本为18元/件,2车间产品单位成本为12元/件,3车间产品单位成本为15100%。另外,181215元/件,则33个车间平均单位成本为:15元/件。以上平均指标的计算是否正确?如不正确请说明理由并改正。
3答:两种计算均不正确。
平均计划完成程度的计算,因各车间计划产值不同,不能对其进行简单平均,这样也不符合计划完成程度指标的特定含义。正确的计算方法是: m190250609101.84% 平均计划完成程度xm190250609平均单位成本的计算也因各车间的产量不同,不能简单相加,产量的多少对平均单位成本有直接的影响。所以正确的计算方法为: 122501560915555xf18190 平均单位成本xx0.951.01.0514.83(元/件)
f19025060910492. 某高校某系学生的体重资料如表4-6所示。
试根据所给资料计算学生体重的算术平均数、中位数和众数。
表4-6 学生体重资料表 按体重分组(公斤) 学生人数(人) 52以下 28 52~55 39 55~58 68 58~61 53 61以上 24 合计 212 解:先列表计算有关资料如表4-8所示。表4-8 学生体重计算表 按体重分组(公斤) 52以下 52~55 55~58 58~61 61以上 合计
组中值(x) 50.5 53.5 56.5 59.5 62.5 _ 学生人数(f) 28 39 68 53 24 212 xf 1414.0 2086.5 3842.0 3153.5 1500.0 11996.0 向上累积频数 28 67 135 188 212 _ (1)学生平均体重:
xxff1199656.58(公斤) 212(2)学生体重中位数:
f
MeL2Sm1fm212672d55356.72(公斤) 68 (3)学生体重众数:
MoL
fmfm1dfmfm1(fmfm1)683955356.98(公斤)(6839)(6853)
3. 已知某公司职工的月工资收入为1965元的人数最多,其中,位于全公司职工月工资收入中间位置的职工的月工资收入为1932元,试
根据资料计算出全公司职工的月平均工资。并指出该公司职工月工资收入是何种分布形式? 解:月平均工资为:
x3MeMo3193219651915.50(元)
22因为xMeMo,所以该公司职工月工资收入呈左偏分布。
4. 当每天生产线的每小时产量低于平均每小时产量,并大于2个标准差时,该生产线被认为是“失去控制”。对该生产线来说,昨天平
均每小时产量是370件,其标准差每小时为5件。表4-7所示的是该天头几个小时的产量,该生产线在什么时候失去了控制?
7
时间(时) 8:00 9:00 10:00 2:00 产量(件) 369 367 365 357 解:由已知得: 产量控制界限的上限为:370+2×5=380(件) 产量控制界限的下限为:370-2×5=360(件) 因此,可以认为该生产线在下午1时失去控制。在下午1时,产量跌到了360件以下,它在控制界限以外。
表4-7 生产线产量表
11:00 12:00 1:00 363 361 359
第五章 抽样及抽样分布
一、填空题 1.
2. 3. 4. 5. 1. 2. 3. 4. 5. 1.
抽样调查可以是_随机_抽样,也可以是_非随机_抽样,但作为抽样推断基础的必须是___随机_抽样。 在抽样推断中,不论是总体参数还是样本统计量,常用的指标有__均值__、__比例 _和方差。 抽样误差是由于抽样的_随机性_而产生的误差,这种误差不可避免,但可以_控制_。 样本平均数的平均数等于____总体平均数____。
在实际的抽样推断中,常用的抽样方法有___简单随机抽样___、___分层抽样__、____等距抽样___和____整群抽样____等。 抽样推断是建立在( C )基础上的。 C.随机抽样 在抽样方法中,最简单和最基本的一种抽样方法是( C )。 C.简单随机抽样 在抽样推断中,可以计算和控制的误差是( B )。 B.抽样标准误差 样本统计量是( B )。 B.不唯一但可抽样计算而可知 样本容量也称( B )。 B.样本单位数
二、单项选择题
三、多项选择题
在重复抽样中( ABDE )。
A.每个单位在每次抽样都有相同被抽中的概率 B.每个单位都有可能在样本中出现n次
nD.n次抽样之间相互独立 E.可以形成N个可能样本
2
影响抽样误差的因素有( ABDE )。A.总体方差 B.样本容量n D.抽样方式 E.抽样方法 从一个总体中可以抽取许多个样本,因此( ABDE )。
A.抽样指标的数值不是唯一确定的 B.抽样指标是用来估计总体参数的 D.样本指标是随机变量 E.样本指标称为统计量 重复抽样下,影响样本容量的因素有( ABCE )。A.概率度 B.抽样极限误差 C.总体方差 E.抽样估计方法 抽样调查的误差可包括( ABC )。 A.系统性误差 B.登记性误差 C.偶然性误差 抽样调查是非全面调查,但却可以对全面调查的资料进行验证和补充。( √ )
样本容量是指一个总体一共可以组成多少不同的样本,而样本个数则是一样本中的单位数。( × ) 每一次抽样的实际误差虽然不可知,但却是唯一的,因而抽样误差不是随机变量。( × ) 系统性误差和登记误差是可加以避免的,而偶然性误差是不可避免的。( √ )
分层抽样要求组与组之间的差异越大越好,而整群抽样则希望群与群之间的差异越小越好。( √ )
2. 3. 4. 5. 1. 2. 3. 4. 5.
四、判断题
六、计算题
1. 假定总体共有1000个单位,总体均值32,总体标准差5。从中抽取一个样本容量为30的简单随机样本用于获得总体信息。(1)x的数学期望是多少? (2)x的标准差是多少? 50.91 解:(1)样本均值的数学期望=总体均值=32 (2)样本均值的标准差n25。样本均值的抽样标准差30x等于多少? 2. 从一个总体标准差为5的总体中抽出一个样本容量为40的样本,样本均值为50.79 解:样本均值的抽样标准差xn403. 设总体均值17,总体标准差10。从该总体中抽取一个样本容量为100的随机样本,样本均值为x100。则x100的抽样分布
是什么?
解:因为样本均值的期望值=总体均值=17 10总体标准差1 样本均值的标准差=n100x100N(17,1) 又因为样本容量大于30,是大样本,所以4. 假定总体比例0.55,从该总体中分别抽取样本容量为100、200、500和1000的样本。
(1)分别计算样本比例的标准差p。 (2)当样本量增大时,样本比例的标准差有何变化? 解:(1)n100时,样本比例的标准差
p(1)n0.55(10.55)0.05
100同理可以计算出,n200,500,1000时的样本比例的标准差分别为0.035,0.022,0.16。 (2)当样本容量增大时,样本比例的标准差越来越小。
8
第六章 参数估计
一、填空题 1. 2. 3. 4. 5. 1. 2. 3. 4. 5. 1. 2. 3. 4. 5.
抽样推断的主要内容有____参数估计____和_____假设检验___两个方面。 抽样推断运用____概率估计_______方法对总体的数量特征进行估计。 总体参数估计的方法有____点估计___和____区间估计___两种。 优良估计的三个标准是___无偏性___、___有效性___和___一致性___。 Z/2表示_______误差范围___________。
二、单项选择题 抽样推断的目的是( A )。 A.以样本指标推断总体指标 总体参数是( B )。 B.唯一但未知 在重复抽样条件下,平均数的抽样平均误差计算公式是( B )。 B.
n抽样平均误差和抽样极限误差相比,其差值( D )。 D.不一定
随着样本单位数增大,样本统计量也趋于接近总体参数,成为抽样推断优良估计的( B )。
nB.一致性
三、多项选择题
抽样推断的特点是( ACDE )。A.随机取样 C.以部分推断总体 D.运用概率估计方法 E.抽样误差可以计算和控制 区间估计的3要素是( ABC )。A.点估计值 B.抽样平均误差 C.估计的可靠程度 影响必要样本容量的因素主要有( ABCDE )。A.总体的标志变异程度 B.允许误差的大小 C.抽样方式D.抽样方法 E.估计的可靠程度 在区间估计中,如果其他条件保持不变,概率保证程度与精确度之间存在下列关系( CDE )。 C.前者愈低,后者愈高 D.前者愈高,后者愈低 E.两者呈相反方向变化 计算抽样平均误差,总体标准差常常是未知的,经常采用的方法有( ABCE )。 A.用过去同类问题的全面调查或抽样调查的经验数据
B.用样本的标准差 C.凭抽样调查才经验确定 E.先组织试验性抽样,用试验样本的标准差 抽样误差范围愈小,则抽样估计的置信度也愈小。( √ )
在保证概率度和总体方差一定的条件下允许误差大小与抽样数目多少成正比。( × ) 抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。( √ ) 在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。( × ) 扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。( × )
四、判断题 1. 2. 3. 4. 5.
六、计算题
1. 随机抽取400只袖珍半导体收音机,测得平均使用寿命5000小时。若已知该种收音机使用寿命的标准差为595小时,求概率保证程度为99.73%的总体平均使用寿命的置信区间。 解:已知n400,x5000,595,199.73%,Z/23,总体平均使用寿命的置信区间为:
xZ/2
595n400500089.2550003(4910.75,5089.25)
该批半导体收音机平均使用寿命的置信区间是4910.75小时~5089.25小时。 2.
一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了500个观众作样本,结果发现喜欢该节目的有175人。试以
95%的概率估计观众喜欢这一专题节目的区间范围。若该节目主持人希望估计的极限误差不超过5.5%,问有多大把握程度? 解:已知n500,置信区间为:
p1750.35,195%,Z/21.96,500因此,在概率保证程度为95%时,观众喜欢这一专题节目的
pZ/2p(1p)0.35(10.35)0.351.96 n5000.350.042(30.8%,39.2%)9
若极限误差不超过5.5%,则
Z/2dp(1p)n5.5%5.5%2.58
0.35(10.35)2.13%500于是,把握程度为99%。 3.
假定总体为5000个单位,被研究标志的方差不小于400,抽样允许误差不超过3,当概率保证程度为95%时,问(1)采用重复抽样
需抽多少单位?(2)若要求抽样允许误差减少50%,又需抽多少单位? 解:已知n5000,2400,d3,195%,Z/21.96
(Z/2)221.962400170.74,需抽查171个单位。 (1)n22d3(Z/2)221.962400682.95,需抽查683个单位。 (2)n22d1.54.
调查一批机械零件合格率。根据过去的资料,合格品率曾有过99%、97%和95%三种情况,现在要求抽样极限误差不超过1%,要求估
计的把握程度为95%,问需抽取多少个零件?
解:根据提供的3个合格率,取总体方差最大值进行计算,故用
p95%,Z/21.96
(Z/2)2p(1p)1.96295%5%n1824.76,需抽查1825件。
d20.012
第七章 参数假设检验
一、填空题
假设检验也称__显著性检验__,是对未知总体的某一特征提出___假设__,再根据样本资料来___检验___该假设是否成立的统计推断方法。
小概率原理认为,概率很小的事件在一次试验里是___不__可能出现的。设计假设检验时,要以公认的小概率水平来确定___显著性水平__。
在假设检验时,由于我们拒绝或接受某种假设,都是以__样本__的资料为依据的,这就有可能犯两类错误,其中第I类错误为___弃真错误___,第II类错误为___纳伪错误__。
对总体均值的假设检验,若正态分布总体的方差已知,应采用___Z___检验法;若正态总体的方差未知且小样本的情况下,则应采用____t___检验法。
对总体比例的假设检验,一般采用___Z____检验法。 二、单项选择题
10
某橡胶厂生产汽车轮胎,根据历史资料统计结果,平均里程为25000公里,标准差为1900公里。现在从新批量的轮胎中随机抽取400个做试验,求得样本平均里程25300公里。试按5%的显著性水平判断新批量轮胎的平均耐用里程与通常的耐用里程有没有显著的差异,或者它们属于同一总体的假设是否成立?这是:(甲)双侧检验问题;(乙)单侧检验问题。原假设表述为:(丙)
H0:2500公里;(丁)
H0:2500公里( A )。 A.
甲丙
假设检验和抽样估计的不同和联系:(甲)都是对总体某一数量特征的推断,都是运用概率估计来得到自己的结论;(乙)前者需要事先对总体参数作出某种假设,然后根据已知的抽样分布规律确定可以接受的临界值;(丙)后者无须事先对总体数量特征做出假设。它是根据已知的抽样分布规律作出恰当的区间,给定总体参数落在这一区间的概率。( D ) D.乙丙
假设检验是利用样本的实际资料来检验原先对总体某些数量特征所作的假设,如果两者的差异很小,则有理由认为这种差异:(甲)是由随机因素引起的(我们可以接受无差异的原假设);(乙)是由随机因素引起,同时还存在条件变化的因素造成的(我们就不能接受无差异的原假设,而应拒绝它)。两者的差异愈大:(丙)则原假设真实的可能性愈小;(丁)则原假设真实的可能性愈大。( A )A.甲丙 假设检验中,显著性水平表示( B )。 B.假设检验中,第II类错误的概率表示( C ) C.三、多项选择题
在假设检验中,与的关系是( AE )。
A.在其他条件不变的情况下,增大,必然会减少 E.增加样本容量可以同时减少和 在假设检验中,当我们做出拒绝原假设而接受备择假设的结论时,表示( ACE )。 A.有充足的理由否定原假设
C.犯错误的概率不大于
E.在
H0H0为真时拒绝不真时接受
H0H0的概率 的概率
H0为真的假设下发生了小概率事件
已知总体服从正态分布,现抽取一小样本,拟对总体方差进行双侧假设检验,0.05,则原假设的拒绝区域为( AC )。 A.
2(,0.975(n1)) C.
2(0.025(n1),)
某机场的塔台面临一个决策上的问题:如果荧幕上出现一个小的不规则点,并逐渐接近飞机进,工作人员必须作一判断:
H0:一切正常,那只是荧幕上受到一点干扰罢了;
H1:可能会发生碰撞意外。在这个问题中,( ACE )。
E.不宜太小
A.错误地发出警报属于第1类错误
C.错误地发出警报的概率为
设总体为正态总体,总体方差未知,在小样本条件下,对总体均值进行假设检验:则下列说法正确的有( DE )。 D.
H0:0,H1:0,0.1,
(,t0.05)和
(t0.05,)为原假设的拒绝区域 E.若检验统计量绝对值越大,则原假设越容易被拒绝
四、判断题
假设检验的基本思想可以利用小概率事件原理来解释。( √ ) 当总体服从正态分布,但总体方差未知的情况下,在假设检验中,原假设为在假设检验中,表示
H0:0,H1:0H0为真,却拒绝
,则
H0的拒绝域为
|t|t(n1)。( × )
H0,备择假设为
H1,则“
H0”为犯第2类错误。( × )
P{接受H0|H1为真}。( √ )
11
在假设检验中,当接受原假设时,可以认为原假设绝对正确。( × ) 六、计算题
某质量管理部门从某厂抽出若干金属线组成的样本做断裂强度试验。已知这类金属线的断裂强度服从正态分布,标准差为10千克。按照标准,要求该金属线的平均断裂强度高于500千克。由5根金属线所组成的样本,其断裂强度的平均值为504千克。以0.01的显著性水平判断该厂产品是否符合标准。 解:由题意可知,这是关于总体均值的假设检验问题,其检验过程如下:
(1)建立假设:H0:500,H1:500 (2)选择并计算统计量:因为总体方差已知,所以用Z统计量进行检验。
Zx5045000.89
/n10/5(3)确定临界值:因为显著性水平(4)进行统计决策:因Z5.
0.01,所以左单侧临界值Z2.33。
0.892.33,所以不能拒绝原假设,即接受该厂产品符合标准。
某广告公司在广播电台做流行歌曲磁带广告,它的插播广告是针对平均年龄为21岁的年轻人的。这家广告公司经理想了解其节目是
否为目标听众所接受。假定听众的年龄服从正态分布,现随机抽取400多位听众进行调查,得出的样本结果为x0.05的显著水平判断广告公司的广告策划是否符合实际?
解:由题意可知,这是关于总体均值的双侧检验问题,其假设检验过程如下: (1)建立假设:H025岁,S216。以
:21,H1:21
(2)选择并计算统计量:因为是大样本,所以用Z统计量进行检验。
Zx252120
S/n4/400(4)进行统计决策:因|Z|201.96,所以拒绝原假设,即调查结果表明该公司的节目并没有吸引它所预期的听众,广告策划不符
合实际,需要改变和调整。 6.
有一厂商声称,在他的用户中,有75%以上的用户对其产品的质量感到满意。为了解该厂家产品质量的实际情况,组织跟踪调查。在
对60名用户的调查中,有50人对该厂产品质量表示满意。在显著性水平0.05下,问跟踪调查的数据是否充分支持该厂商的说法? 解:由题意可知,这是关于总体比例的右单侧检验问题,其假设检验过程如下: (1)建立假设:H0:75%,H1:75%
(2)选择并计算统计量:由于P=0.83,np=30×0.83=50>5,n(1-p)=10.2>5,所以选择Z统计量进行检验。
Zp(1)n0.830.751.43
0.75(10.75)60(3)确定临界值:因为显著性水平(4)进行统计决策:因Z7.
0.05,所以右单侧临界值Z1.645。
1.431.645,故不拒绝原假设,即调查数据没有提供充分的证据支持该厂商的说法。
0.36,问检验结果是
根据设计,某零件的内径标准差不得超过0.30厘米,现从该产品中随机抽验了25件,测得样本标准差为S12
否说明该产品的标准差增大了?
解:由题意可知,这是关于总体方差的右单侧检验问题,其假设检验过程如下: (1)建立假设:H0:20.302,H1:20.302
(2)选择并计算统计量:
2(n1)S22(251)0.36234.56 20.30236.415。 0.05,所以右单侧临界值(3)确定临界值:因为显著性水平(4)进行统计决策:因
234.5636.415,故不拒绝原假设,即检验结果不能说明该产品的标准差增大了。
13
因篇幅问题不能全部显示,请点此查看更多更全内容