一、 选择题
1. ( B ) 是总体里最小的、不可再分的单元。
A.抽样单元 B.基本单元 C.初级单元 D.次级单元 2. 抽样调查的根本功能是( C )
A. 获取样本资料 B. 计算样本资料
C . 推断总体数量特征 D. 节约费用
3. 概率抽样与非概率抽样的根本区别是( B )
A.是否能保证总体中每个单位都有完全相同的概率被抽中
B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差
4. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆错。
5. 优良估计量的标准是( B )
A.无偏性、充分性和一致性 B.无偏性、一致性和有效性
C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性
6.抽样标准误差的大小与下列哪个因素无关( C ) A.样本容量 B.抽样方式、方法 C.概率保证程度 D.估计量
7. 抽样标准误差与抽样极限误差之间的关系是( B ) A.ˆ)SE(ˆ)ˆ)tSE(SE(ˆ B.tSE() C. D.
t8. 应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成
( A )关系
A.正比例 B.反比例 C.负相关 D.以上皆是
1f229. 能使V(ylr)(SY2SX2SYX)达到极小值的值为( B )
n2SYXSYSXSYXSYXA. B.2 C.2 D.
SSYXSXSYX10. 某县欲估计今年的小麦总产量,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到y118.63吨,这些村去年的产量平均为x104.21吨。用比率估计方法估计今年该地区小麦总产量为( B ) 。
A.12820.63 B.14593.96 C.12817.83 D.14591.49
1
11. 在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为( C )。
A.375 B.540 C.240 D.360 12. 抽样框最直接反映的是( C )
A.目标总体 B.实际总体 C.抽样单元 D.基本单元
13. 在给定费用下使估计量的方差达到最小,或者对于给定的估计量方差使得总费用达到最小的样本量分配为( C )
A. 常数分配 B.比例分配 C. 最优分配 D.梯次分配 14. 分层抽样也常被称为( D )
A.整群抽样 B.系统抽样 C.组合抽样 D.类型抽样 15. 非概率抽样与概率抽样的主要区别为( D )
A. 适用的场合不同 B. 总体特征值的估计不同 C. 样本量的确定不同 D. 抽样时是否遵循随机原则 16. 分层抽样中的层的划分标准为( B )。 A.尽可能使层间的差异小,层内的差异大 B.尽可能使层间的差异大,层内的差异小 C.尽可能使层间的差异大,层内的差异大 D.尽可能使层间的差异小,层内的差异小
二、判断题
×1.总体比率与总体比例两者是一样的概念,只是符号不同。( ) √2.比估计量是有偏估计量。( )
×3.分层抽样在划分层时,要求层内差异尽可能大,层间差异尽可能小。( ) ×4.对于同一总体,样本容量同抽样标准误差之间是正相关关系。( ) ×5.设总体容量为N,样本容量为n,采用有顺序放回简单随机抽样,样本配合种数为CN。( ) ×6.一个调查单位只能对接与一个抽样单位。( )
√7. 营业员从笼中抓取最靠近笼门的母鸡,该种抽样方式属于非概率抽样。( ) √8. 当调查单位的抽样框不完整时,无法直接实施简单随机抽样。( ) √9 分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。( ) ×10 分层的基本原则是尽可能地扩大层内方差,缩小层间方差。( )
√11 分层抽样的效率较简单随机抽样高,但并不意味着分层抽样的精度也比简单随机抽样高。( )
√12 分层抽样克服了简单随机抽样可能出现极端的情况。( ) √13 分层抽样的样本在总体中分布比简单随机抽样均匀。( ) ×14 分层后各层要进行简单随机抽样。( )
√15 分层抽样的主要作用是为了提高抽样调查结果的精确度,或者在一定的精确度的减少样本的单位数以节约调查费用。( )
√16 分层后总体各层的方差是不同的,为了提高估计的精度,通常的做法是在方差较大的层多抽一些样本。( )
√17 在不同的层中每个单位的抽样费用可能是不等的。( )
×18 在分层抽样的条件下,样本容量的确定与简单随机抽样的共同点都是取决于总体的方差。( )
√19 有时在抽样时无法确定抽样单位分别属于哪一层,只有在抽取样本之后才能区分。( ) ×20 比例分配指的是按各层的单元数占样本单元数的比例进行分配。( )
2
n
√21 所谓最优分配是指给定估计量方差的条件下,使总费用最小。( )
√22 在奈曼分配时,如果某一层单元数较多,内部差异较大,费用比较省,则对这一层的样本量要多分配一些。( )
√23 在实际工作中如果第k层出现kn超过kN,最优分配是对这个层进行100%的抽样。( ) √24 在实际工作中,如果要给出估计量方差的无偏估计,则每层至少2个样本单元,层数不能超过n/2。( )
×25 无论层的划分与样本量的分配是否合理,分层抽样总是比简单随机抽样的精度要高。( ) ×26 即使层权与实际情况相近,利用事后分层技术也难以达到提高估计精度的目的。( ) ×27.在任何条件下,估计量的方差都与估计量的均方差相等,因此一般所讲的估计误差也就是指估计量的方差。( )
×28.估计抽样误差时,在各种抽样技术条件下都可以用样本方差代替总体方差。 ( ) ×29.比估计就是比例估计。 ( )
×30.比估计与回归估计都充分利用了有关辅助变量,因此一般情况下都较简单估计的精度要高。( )
三、名词解释 1. PPS抽样 2. 概率抽样 3. 不等概率抽样
4. πPS抽样的Brewer方法
四、计算题
1、(简单随机抽样的均值、比例估计和样本量的确定)某住宅区调查居民的用水情况,该区共有N=1000户,调查了n=100户,得y=12.5吨,s=1252,有40户用水超过了规定的标准。
2要求计算: ○1该住宅区总的用水量及95%的置信区间; ○2若要求估计的相对误差不超过10%,应抽多少户作为样本? ○3以95%的可靠性估计超过用水标准的户数; 解:已知N = 1000,n = 100,fn1000.1,y=12.5,s21252 N10001估计该住宅区总的用水量Y为: ○
ˆY=Ny=100012.5=12500
估计该住宅区总的用水量Y的方差和标准差为:
1-f210.12ˆv(Y)=Nv(y)=N2s100021252=11268000n100
ˆˆ112680003356.7842s(Y)=v(Y) 因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:
3
ˆts(Y)=12500ˆ1.963356.7842125006579 Y 即,我们可以以95%的把握认为该住宅总的用水量在 5921吨~19079吨之间。 ○2根据题意,要求估计的相对误差不超过10%,即r≤0.1,假定置信度为95%
t2s21.96212523078 根据公式:n022ry0.1212.52n03.0780.05,所以需要对n0进行修正: Nn3078 n = 0755
n01+3.0781N 若要求估计的相对误差不超过10%,应抽不少于755户作为样本。 ○3以95%的可靠性估计超过用水标准的户数;
令超过用水标准的户数为A,样本中超过用水标准的户数为a = 40,估计超过用水标准的比例P为:
a40p = 40%n100
估计超过用水标准的比例P的方差和标准差为:
由于
v(p)1f10.1pq40%60%0.002182n11001
在95%的可靠性下,超过用水标准的比例P的估计区间为: pts(p)40%1.964.67%
因此,我们有95%的把握认为,超过用水标准的比例P在30.85%49.15%之间,超过用水标准的户数的点估计为:100040%400户,超过用水标准的户数在100030.85%户~100049.15%户之间,即309户~492户之间。
2、(内曼分配和按比例分配的均值和比例估计)有下列数据 层 1 2 3 设n1000
○1采用按比例分层抽样的方法估计Y和P并计算其标准误; ○2采用奈曼分配的方法估计Y和P并计算标准误;
4
s(p)v(p)0.0021824.67%Wh yh sh ph 0.35 0.55 0.1 3.1 3.9 7.8 2 3.3 11.3 0.54 0.39 0.24 解:○1根据题中已知条件,采用按比例分层抽样的方法估计Y为: ystWhyh0.353.10.553.90.17.84.01
h1L 估计Y的方差和标准误差为:
1fv(yst)n
WhSh2h1L1(0.35220.553.320.111.32)0.02015851000
s(yst)v(yst)0.02015850.141981 估计P及其方差和标准误差为:
ppropWhph0.350.540.550.390.10.240.4275h1L1fL1v(pprop)Wpq(0.350.540.460.550.390.610.10.240.76)0.000218 hhhnh11000s(pprop)v(pprop)0.0002180.014765○2采用Neyman分配的方法估计Y和P的方法和与○1是一样的,即
ystWhyh0.353.10.553.90.17.84.01
h1LppropWhph0.350.540.550.390.10.240.4275h1L
但是采用Neyman分配估计Y和P的方差的方法不同,分别为:
1L1L122v(yst)(WhSh)WhSh(0.3520.553.30.111.3)20.013286nh1Nh11000s(yst)v(yst)0.0132860.11526511v(pprop)(Whphqh)2(0.350.540.460.550.390.610.10.240.76)0.000236nh11000s(pprop)v(pprop)0.0002360.015362L
3、(比率估计)某养兔场共有100只兔子,上月末称重一次对每只兔的重量 作了纪录,并计算平均重量为3.1磅,一个月后随机抽取10只兔子标重如下: 序1 2 3 4 5 6 7 8 9 10 号 上3.2 3 2.9 2.8 2.8 3.1 3 3.2 2.9 2.8 次 本4.1 4 4.1 3.9 3.7 4.1 4.2 4.1 3.9 3.9 次 ○1估计这批兔子较上月末增重的比率及其标准误差; 5
○2估计现有兔子的平均重量及其标准误差; ○3将比估计方法与均值估计法进行比较,哪一种方法效率高?分析其原因。
解:○1已知:N = 100 ,n = 10 ,设X,Y分别代表上月兔子总重量和本月兔子总重量,则
n10X = 3.1,f = 0.1。
N100由表中数据可得:
110110y = yi4 , x = xi2.9710i=110i=11102sy(yiy)20.022210-1i1 1012s2(xx)0.0246xi10-1i1110syx(xix)(yiy)0.01510-1i1因此,对这批兔子较上月末增重的比率估计为: ˆy41.3468 R = x2.97ˆ方差的估计为: Rˆ标准误ˆ1f(s2Rˆ2s22Rsˆ)10.1(0.02221.346820.024621.34680.015)0.0002474Rv(R)yxyx22nX10(3.1)差的估计为:
ˆˆ0.00024740.015729 s(R) = v(R)○2对现有兔子的平均重量的比率估计为:
ˆyR = RX=1.34683.14.17508
yR方差的估计为:
ˆ2s22Rsˆ)10.1(0.02221.346820.024621.34680.015)0.0023775 v(yR)1f(s2Ryxyxn10yR标准误差的估计为:
s(yR) = v(yR)0.00237750.04876 ○3对现有兔子的平均重量的均值估计为:
110y = yi4
10i=1y方差的估计为: v(y)1f210.1sy0.02220.001998 n106
因此,得到现有兔子平均重量的比率估计量设计效应的估计为:
ˆ deff = v(yR)0.0023775 =1.1899 v(y)0.001998对于本问题,均值估计方法的效率比比率估计方法的效率要高。原因是:比率估计是有偏的,
当样本量足够大时,估计的偏倚才趋于零,而本问题中的样本量较小,使用比率估计量时不能忽视其偏倚,所以无法保证估计的有效,使得估计效率比均值估计方法的效率低。
4、对某地区171980户居民家庭收入进行调查,以居民户为抽样单位,根据城镇和乡村将居民划为2层,每层按简单随机抽样抽取300户,经整理得如下数据: 层 城镇 乡村 Nh 23560 148420 yh 15180 9856 Wh 0.137 0.863 sh 2972 2546 试根据此估计:
(1)居民平均收入及其95%的置信区间。
(2)若是按比例分配和奈曼分配时,各层样本量分别应为多少?
解:(1) 由题中相关数据资料:ystWhyh10585.39(元)
h122Sh v(yst)W(1fh) 545.571816059.736416605.3082(元)nh1h22hse(Yst)128.86(元/户),t1.96
该地区居民平均收入的95%的置信区间为:
Ysttse(Yst)(10332.82,10837.96)元
(2)按比例分配:
n1nW16000.13782(户) n2nW26000.863518(户)
按奈曼分配:
nhnWhShL
Wh1hSh2由表中资料:n600,W1S1407.164,W2S22197.198,WhSh2604.362
h1由上可得根据奈曼分配,各层所需样本容量为:
7
n1600n2600
407.16494
2604.3622197.198506
2604.3625、某工厂生产的新产品供应国内市场的300家用户,试销售滿一年后,现欲请用户对该厂的新产品进行评价。现把这些用户分成本地区、本省外地区、外省三层。现有资料如下:
本地区 本省外地外省 区 N1154 N293 2S122.25 S23.24 N353 S323.24 C19 C225 C336 若要求估计评价成绩均值的方差V(yst)0.1,并且费用最省(假定费用为线性形式),求样本量n在各层的分配。
(Nii/Ci)(NiiCi)126.382102.4解:n=27.0628
N2S2ystNii29000819.54(Nii/Ci)NS22ystNi2i
(Nii/Ci)=
1541.5931.8531.8126.38 356NiiCi)=154*1.5*393*1.8*553*1.8*62102.4
N2S2yst=30020.129000
Ni2i=154*2.2593*3.2453*3.24819.54
N11/C1287717.05917
126.3833.487.427
126.3815.93.5234
126.38n1nNii/Ci)n2nN22/C2Nii/Ci)28n3nN33/C3Nii/Ci)28即各层的样本量分别为17、7、4
8
6、 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。 农场规模(英平均每一农场的玉米面积农场数Nh 标准差Sh 亩) Yh 0—40 394 5.4 8.3 41—80 461 16.3 13.3 81—120 391 24.3 15.1 121—160 334 34.5 19.8 161—200 169 42.1 24.5 201—240 113 50.1 26.0 148 63.8 35.2 241 总和或均值 2010 26.3 -- 现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问: (1)按比例分配时,各层的样本量为多少?
(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等) 解:(1)比例分配:
N根据表中所给的数据,利用公式nhnh直接可计算出各层样本量:
Nn120,n223,n319,n417,n58,n66,n77
(2)最优分配:
当各层的单位调查费用相等时,最优分配样本量计算公式为:
nhnNhShL
hNShh1同样将表中的相关数据代入公式即可求出此时各层的样本量为:
n110,n218,n317,n419,n512,n69,n715
7、 某县欲调查某种农作物的产量,由于平原、丘陵和山区的产量有差别,故拟划分为平原、丘陵和山区三层采用分层抽样。平原区共有150个村庄,丘陵区共有100个村庄,山区共有250个村庄。按照各种地形等比例各抽取5%样本,进行实割实测产量,结果计算如下表。 (1)在95%的概率保证程度下,试估计该县农作物平均每村产量的区间范围。 (2)若村庄的农作物产量低于150吨,县政府并将其归为低产量村,从而对其加强农业补贴政策。因此,试图在95%的概率保证程度下估计该县低产量村比例的区间范围。 地形 村庄总个数 样本村个数 样本平均产样本产量标样本低产量(吨) 准差 量村个数 平原 140 7 202.5 82.20 2 丘陵 100 5 147 36.84 1 山区 240 12 121.11 47.35 7
9
解:(1) x27202.5514712121.11150.24 7512 样本方差:inini282.22736.842547.352123374.5
24 抽样平均误差ux2n(1n3374.5)(15%)11.56 N24 概率保证程度为95.45%,可查表获得t=1.96,xtux211.5623.12
在95.45%的概率保证程度下,可得该县农作物平均每村产量的置信区间为(150.24-23.12,
150.24+23.12)。
217(2) 样本成数p41.67%
7512样本方差
2514757512pi(1pi)ni77551212p(1p)0.21
n24i抽样平均误差upp(1p)n0.21(1)(15%)9.12% nN24概率保证程度为95.45%,可查表获得t=1.96,xtux29.12%18.24% 在95.45%的概率保证程度下可得该县低产量村比例的置信区间为(41.67%-18.24%,
41.67%+18.24%)
10
因篇幅问题不能全部显示,请点此查看更多更全内容