您的当前位置:首页正文

人大版 贾俊平_统计学_第三版 课后习题答案

2024-08-18 来源:步旅网


第2章 统计数据的描述——练习题

●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:

B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2) 用Excel制作一张频数分布表;

(3) 绘制一张条形图,反映评价等级的分布。 解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。

(2)频数分布表如下:

服务质量等级评价的频数分布

服务质量等级

A B C D E 合计

家庭数(频数)

14 21 32 18 15 100

频率% 14 21 32 18 15 100

(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题2.1)。即得到如下的条形图:

EDCBA02040服务质量等级评价的频数分布 频率%服务质量等级评价的频数分布 家庭数(频数)

●2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):

152 124 129 116 100 103 92 95 127 104

1

105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组,

全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;

为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;

按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;

将各组企业数除以企业总数40,得到各组频率,填入表中第三列;

在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。

整理得到频数分布表如下:

40个企业按产品销售收入分组表 按销售收入分组 企业数 频率 向上累积 (万元) (个) (%) 企业数 频率 100以下 100~110 110~120 120~130 130~140 140以上 合计 5 9 12 7 4 3 40 12.5 22.5 30.0 17.5 10.0 7.5 100.0 5 14 26 33 37 40 — 12.5 35.0 65.0 82.5 92.5 100.0 — 向下累积 企业数 40 35 26 14 7 3 — 频率 100.0 87.5 65.0 35.0 17.5 7.5 — (2)按题目要求分组并进行统计,得到分组表如下:

某管理局下属40个企分组表

按销售收入分组(万元) 企业数(个)

先进企业 良好企业 一般企业 落后企业 合计

11 11 9 9 40

频率(%) 27.5 27.5 22.5 22.5 100.0

● 3.某百货公司连续40天的商品销售额如下(单位:万元):

41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

2

解:全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;

为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;

按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数——天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列;

将各组天数除以总天数40,得到各组频率,填入表中第三列; 得到频数分布表如下:

某百货公司日商品销售额分组表

按销售额分组(万元)

25~30 30~35 35~40 40~45 45~50 合计

频数(天)

4 6 15 9 6 40

频率(%) 10.0 15.0 37.5 22.5 15.0 100.0

直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.3)

403020100

●4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:

700 716 728 719 685 709 691 684 705 718

706 708 668 706 694 688 701 693

715 729 710 692 690 689 671 697

712 694 693 691 736 683 718 664

722 681 697 747 689 685 707 681

691 695 674 699 696 702 683 721

708 685 658 682 651 741 717 720

690 706 698 698 673 698 733 677

692 661 666 700 749 713 712 679

707 735 696 710 708 676 683 695

701 665 698 722 727 702 692 691

713 699 725 726 704 729 703 696 717 688 (1)利用计算机对上面的数据进行排序;

(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图; (3)绘制茎叶图,并与直方图作比较。 解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,

3

25~3300~3355~4400~4455~50某百货公司日商品销售额分组表 频数(天)某百货公司日商品销售额分组表 频率(%)

即完成数据排序的工作。(见Excel练习题2.4)

(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下: (见Excel练习题2.4)

100只灯泡使用寿命非频数分布

按使用寿命分组(小时) 灯泡个数(只) 频率(%)

650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 合计

2 5 6 14 26 18 13 10 3 3 100

2 5 6 14 26 18 13 10 3 3 100

制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:

(见Excel练习题2.4)

302520151050

(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,

得到茎叶图如下:

65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7

4

650~676600~696800~717000~737200~740100只灯泡使用寿命非频数分布灯泡个数100只灯泡使用寿命非频数分布频率(%)

将直方图与茎叶图对比,可见两图十分相似。

●5.下面是北方某城市1~2月份各天气温的记录数据:

-3 2 -4 -7 -11 -1 7 8 9 -14 -18 -15 -9 -6 -1 0 5 -4 -6 -8 -12 -16 -19 -15 -22 -25 -24 -8 -6 -15 -11 -12 -19 -25 -24 -18 -14 -22 -13 -9 -6 0 -1 5 -4 -3 2 -4 -4 -16 -1 7 5 -6

-6

-9 -19 -17 -9 -5 -7 -3 -21 -24 -3

(1) 指出上面的数据属于什么类型; (2) 对上面的数据进行适当的分组;

(3) 绘制直方图,说明该城市气温分布的特点。 解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。

(2)分组如下:

由于全部数据中,最大的为9,最小的为-25,知数据全距为9-(-25)=34;

为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值-25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;

按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题2.5)统计各组内数据的个数——天数,并填入表内,得到频数分布表如下表;

北方某城市1~2月份各天气温

分组 -25~-20 -20~-15 -15~-10 -10~-5 -5~0 0~5 5~10 合计

天数(天)

8 8 10 14 14 4 7 65

(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.5)

北方某城市1~2月份各天气温 天数(天)151050北方某城市1~2月份各天气温 天数(天)-25~-20-15~-10-5~05~10

5

●6.下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:

年龄 18~19 21~21 22~24 25~29 30~34 35~39 40~44 45~59 % 1.9 34.7 34.1 17.2 6.4 2.7 1.8 1.2 (1) 对这个年龄分布作直方图;

(2) 从直方图分析成人自学考试人员年龄分布的特点。 解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.6)

%4035302520151050%

(2)年龄分布的特点:自学考试人员年龄的分布为右偏。 7.下面是A、B两个班学生的数学考试成绩数据:

A班: 44 57 59 60 61 61 62 63 63 65 66 66 67 69 70 70 71 72 73 73 73 74 74 74 75 75 75 75 75 76 76 77 77 77 78 78 79 80 80 82 85 85 86 86 90 92 92 92 93 96 B班: 35 39 40 44 44 48 51 52 52 54 55 56 56 57 57 57 58 59 60 61 61 62 63 64 66 68 68 70 70 71 71 73 74 74 79 81 82 83 83 84 85 90 91 91 94 95 96 100 100 100

(1) 将两个班的考试成绩用一个公共的茎制成茎叶图; (2) 比较两个班考试成绩分布的特点。 解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下:

A班 数据个数 树 叶 树茎 B班 树叶 数据个数 18~1921~2122~2425~2930~3435~3940~4445~590 1 2 11 23 7 4 97 97665332110 98877766555554443332100 6655200 3 4 5 6 7 8 59 0448 122456677789 011234688 00113449 123345 2 4 12 9 8 6 6

6 0 632220 9 10 011456 000 6 3 (2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。

8.1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。 月份 北京 长春 南京 郑州 武汉 广州 成都 昆明 兰州 西安 1 49 70 76 57 77 72 79 65 2 41 68 71 57 75 80 83 65 3 47 50 77 68 81 80 81 58 4 50 39 72 67 75 84 79 61 5 55 56 68 63 71 83 75 58 6 57 54 73 57 74 87 82 72 7 69 70 82 74 81 86 84 84 8 74 79 82 71 73 84 78 74 9 68 66 71 67 71 81 75 77 10 47 59 75 53 72 80 78 76 11 66 59 82 77 78 72 78 71 12 56 57 82 65 82 75 82 71 资料来源:《中国统计年鉴1998》,中国统计出版社1998,第10页。 解:箱线图如下:(特征请读者自己分析) 各城市相对湿度箱线图958575655545Min-Max51 41 49 46 41 43 58 57 55 45 53 52 67 67 74 70 58 42 62 55 65 65 73 72 3525%-75%北京长春南京郑州武汉广州成都昆明兰州西安Median value●9.某百货公司6月份各天的销售额数据如下(单位:万元): 257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 (1)计算该百货公司日销售额的均值、中位数和四分位数;

(2)计算日销售额的标准差。 解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223, 于是得该百货公司日销售额的均值:(见Excel练习题2.9)

x8223 x===274.1(万元)

n30 7

或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中

输入“A1:A30”,回车,得到均值也为274.1。

在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠

中的第15、第16两个数272和273的平均数:

Me=

272273=272.5(万元) 2由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15

个数据的中间位置(第8位)靠上四分之一的位置上,

由重新排序后的Excel表中第8位是261,第15位是272,从而:

QL=261+

273272=261.25(万元) 4 同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四

分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:

QU=291-

273272=290.75(万元)。 4(2)未分组数据的标准差计算公式为:

(xx)i302 s=i1n1 利用上公式代入数据计算是个较为复杂的工作。手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。(见Excel练习题2.9)

我们可以利用Excel表直接计算标准差:

点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV” →“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。于是:

。(见Excel练习题2.9) s21.17(万元)

●10.甲乙两个企业生产三种产品的单位成本和总成本资料如下: 产品 单位成本 总成本(元) 名称 (元) 甲企业 乙企业 A 15 2100 3255 B 20 3000 1500 C 30 1500 1500 比较哪个企业的总平均成本高?并分析其原因。 解:设产品单位成本为 x,产量为f,则总成本为xf,

由于:平均成本x=

xff=

总成本,而已知数据中缺产量f 的数据,

总产量又因个别产品产量f =

该产品成本xf=

该产品单位成本x 8

从而 x=

xfxfx,于是得:

xf甲企业平均成本=

xfx乙企业平均成本=

210030001500=19.41(元),

210030001500152030325515001500=18.29(元),

325515001500152030xfxfx=

对比可见,甲企业的总平均成本较高。

原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

●11.在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元) 企业数(个)

200~300

300~400 400~500 500~600 600以上

19 30 42 18 11

120 合计

计算120家企业利润额的均值和标准差。

解:设各组平均利润为 x,企业数为f,则组总利润为xf,

由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:

按利润额分组(万元)

200~300 300~400 400~500 500~600 600以上 合计

于是,120家企业平均利润为:

x=

组中值 x 250 350 450 550 650 —

企业数(个)

f 19 30 42 18 11 120

总利润 xf 4750 10500 18900 9900 7150 51200

xff=

51200= 426.67(万元); 120分组数据的标准差计算公式为: s=(xx)f1i2f 手动计算须列表计算各组数据离差平方和(x-426.67)2f,并求和,再代入计算公式:

9

列表计算如下

组中值 x 250 350 450 550 650 合计

企业数(个)

f 19 30 42 18 11 120

(x-426.67)2f 593033.4891 176348.667 22860.1338 273785.2002 548639.1779 1614666.668

表格中(x-426.67)2f的计算方法: 方法一:将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:=(a3-426.67)* (a3-426.67)*b3,回车,得到该行的计算结果;

点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x-426.67)2f计算完毕;

于是得标准差:(见Excel练习题2.11)

s =2(xx)fif1=1614666.668=116.48(万元)。

1201点击第三列的合计单元格后,点击菜单栏中的“∑”号,回车,即获得第三列数据的和。 方法二:将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个x,120个数据生成后,点选A列的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV” →“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:116.4845,即为这120个数据的标准差。(见Excel练习题2.11)

于是得标准差:

s =116.4845(万元)。

●12.为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。

(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者

这两组样本的平均身高相同?

(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或

者这两组样本的标准差相同?

(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对

两位调查研究人员来说,这种机会是相同的?

解:(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。

●13.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么? (2)以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。

(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间? (4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?

10

解:(1)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组:

因为女生的离散系数为

V=

s5==0.1 x50男生体重的离散系数为 V=

s5==0.08 x60对比可知女生的体重差异较大。

(2) 男生:x=

60公斤5公斤=27.27(磅),s ==2.27(磅);

2.2公斤2.2公斤50公斤5公斤=22.73(磅),s ==2.27(磅);

2.2公斤2.2公斤 女生:x= (3)68%;

(4)95%。

● 14.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:

成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75

(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?

(2)比较分析哪一组的身高差异大? 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。

(2)利用Excel进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得:

成年组身高的离散系数:vs4.20.024; 172.12.4970.035; 71.3又得幼儿组身高的平均数为71.3,标准差为2.497,从而得:

幼儿组身高的离散系数:vs 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

15.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):

方法A 方法B 方法C

164 167 168 165 170 165 164

129 130 129 130 131 130 129 125 126 126 127 126 128 127

11

168 164 162 163 166 167 166 165 127 128 128 127 128 128 125 132 126 127 127 125 126 116 126 125

(1) 你准备采用什么方法来评价组装方法的优劣? (2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。 解:(1)下表给计算出这三种组装方法的一些主要描述统计量:

方法A 平均 中位数 众数 标准偏差 极差 最小值 最大值 165.6 165 164 2.13 8 162 170 方法B 平均 中位数 众数 标准偏差 极差 最小值 最大值 128.73 129 128 1.75 7 125 132 方法C 平均 中位数 众数 标准偏差 极差 最小值 最大值 125.53 126 126 2.77 12 116 128 评价优劣应根据离散系数,据上得: 2.13

=0.0129, 165.61.75方法B的离散系数VB==0.0136,

128.732.77方法C的离散系数VC==0.0221;

125.53方法A的离散系数VA=

对比可见,方法A的离散系数最低,说明方法A最优。

(2)我会选择方法A,因为方法A的平均产量最高而离散系数最低,说明方法A的产量高且稳定,有推广意义。

16.在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。

(1)你认为该用什么样的统计测度值来反映投资的风险?

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?

(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?

-30 0 30 60 -30 0 30 60 频 50 收 益 率 收 益 率 (a)商业类股票 50 (b) 高科技类股票 频数

解:(1)方差或标准差;(2)商业类股票;(3)(略)。 数 25 17.下图给出了2000年美国人口年龄的金字塔,其绘制方法及其数字说明与【例2.10】相 25 同,试对该图反映的人口、政治、社会、经济状况进行分析。 0 0 12

2000年美国人口年龄结构金字塔95-99(01-05)90-94(06-10)85-89(11-15)80-84(16-20)75-79(21-25)70-74(26-30)65-69(31-35)60-64(36-40)55-59(41-45)50-54(46-50)45-49(51-55)40-44(56-60)35-39(61-65)30-34(66-70)25-29(71-75)20-24(76-80)15-19(81-85)10-14(86-90)5-9(91-95)0-4(96-00)-20-10010女男年龄20人数(百万)

第3章 概率与概率分布——练习题(全免)

1 .某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间有何关系?

序号 性别 1 男 2 男 3 男 4 女 5 男 6 男 7 女 8 男 9 女 10 女 11 男 12 男 职称 工程师 技术员 技术员 技术员 技术员 工程师 工程师 技术员 技术员 工程师 技术员 技术员 解:设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6

(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2

2. 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。

解:求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率P(A)。 考虑逆事件A“任取一个零件为正品”,表示通过三道工序都合格。据题意,有:

P(A)(10.2)(10.1)(10.1)0.648

13

于是 P(A)1P(A)10.6480.352

3. 已知参加某项考试的全部人员合格的占80%,在合格人员中成绩优秀只占15%。试求任一参考人员成绩优秀的概率。

解:设A表示“合格”,B表示“优秀”。由于B=AB,于是

P(B)=P(A)P(B|A)=0.8×0.15=0.12

4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。

解:设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。

P(B)=P(A)P(B|A)P(A)P(B|A) =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1

或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1

5.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A=活到55岁,B=活到70岁。所求概率为:

P(B|A)=P(AB)P(B)0.63===0.75 P(A)P(A)0.846.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策?

解:这是一个计算后验概率的问题。

设A=优质率达95%,A=优质率为80%,B=试验所生产的5件全部优质。 P(A)=0.4,P(A)=0.6,P(B|A)=0.955, P(B|A)=0.85,所求概率为:

P(A|B)=P(A)P(B|A)0.30951==0.6115

P(A)P(B|A)P(A)P(B|A)0.50612决策者会倾向于采用新的生产管理流程。

7. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少?

解:令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)=0.25,P(A2)=0.30, P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率分别为:

(1)P(B)=P(A1)P(B|A1)P(A2)P(B|A2)P(A3)P(B|A3)

14

=0.25×0.04+0.30×0.05+0.45×0.03=0.0385

0.450.030.0135==0.3506

0.250.04+0.300.05+0.450.030.03858.某人在每天上班途中要经过3个设有红绿灯的十字路口。设每个路口遇到红灯的事件是相

(2)P(A3|B)=互独立的,且红灯持续24秒而绿灯持续36秒。试求他途中遇到红灯的次数的概率分布及其期望值和方差、标准差。

解:据题意,在每个路口遇到红灯的概率是p=24/(24+36)=0.4。

设途中遇到红灯的次数=X,因此,X~B(3,0.4)。其概率分布如下表:

xi P(X= xi) 0 0.216 1 0.432 2 0.288 3 0.064 期望值(均值)=1.2(次),方差=0.72,标准差=0.8485(次) 9. 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):

(1)至少获利50万元的概率; (2)亏本的概率;

(3)支付保险金额的均值和标准差。

解:设被保险人死亡数=X,X~B(20000,0.0005)。

(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X ≤10)=0.58304。 (2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为: P(X>20)=1-P(X≤20)=1-0.99842=0.00158 (3)支付保险金额的均值=50000×E(X) =50000×20000×0.0005(元)=50(万元) 支付保险金额的标准差=50000×σ(X)

=50000×(20000×0.0005×0.9995)1/2=158074(元) 10.对上述练习题3.09的资料,试问:

(1)可否利用泊松分布来近似计算? (2)可否利用正态分布来近似计算?

(3)假如投保人只有5000人,可利用哪种分布来近似计算?

解: (1)可以。当n很大而p很小时,二项分布可以利用泊松分布来近似计算。本例中,λ= np=20000×0.0005=10,即有X~P(10)。计算结果与二项分布所得结果几乎完全一致。 (2)也可以。尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。

本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995, 即有X ~N(10,9.995)。相应的概率为: P(X ≤10.5)=0.51995,P(X≤20.5)=0.853262。

可见误差比较大(这是由于P太小,二项分布偏斜太严重)。

【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。

(3)由于p=0.0005,假如n=5000,则np=2.5<5,二项分布呈明显的偏态,用正态分

15

布来计算就会出现非常大的误差。此时宜用泊松分布去近似。

11.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。 解:(1)P(X150)P(Z150200)=P(Z1.6667)=0.04779 30合格率为1-0.04779=0.95221或95.221%。

(2) 设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:

P(|X200|K)P{|Z|=即:P{Z|X200|K}0.9

3030K}0.95,K/30≥1.64485,故K≥49.3456。 3012.某商场某销售区域有6种商品。假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少?

解:设X =同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)

(1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1 (取整数) (2)P(X2)1P(X2)1=1-0.9011=0.0989

2k0C6k0.2k0.86k

第4章 抽样与抽样分布——练习题(全免)

1. 一个具有n64个观察值的随机样本抽自于均值等于20、标准差等于16的总体。

⑴ 给出x的抽样分布(重复抽样)的均值和标准差

⑵ 描述x的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z统计量对应于x15.5的值。 ⑷ 计算标准正态z统计量对应于x23的值。 解: 已知 n=64,为大样本,μ=20,σ=16,

⑴在重复抽样情况下,x的抽样分布的均值为

a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。

⑴x<16; ⑵x>23; ⑶x>25; ⑷.x落在16和22之间; ⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013

3. 一个具有n100个观察值的随机样本选自于30、16的总体。试求下列概率的近似值:

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699

16

4. 一个具有n900个观察值的随机样本选自于100和10的总体。

⑴ 你预计x的最大值和最小值是什么? ⑵ 你认为x至多偏离多么远?

⑶ 为了回答b你必须要知道吗?请解释。

解:a. 101, 99 b. 1 c. 不必

5. 考虑一个包含x的值等于0,1,2,…,97,98,99的总体。假设x的取值的可能性是相同的。则运用计算机对下面的每一个n值产生500个随机样本,并对于每一个样本计算x。对于每一个样本容量,构造x的500个值的相对频率直方图。当n值增加时在直方图上会发生什么变化?存在什么相似性?这里n2,n5,n10,n30和n50。

解:趋向正态

6. 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、

金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。

⑴ 描述x(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x服从怎样

的分布以及x的均值和方差是什么?证明你的回答;

⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率

呢?在209美元和217美元之间的概率呢?

解: a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938

7. 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为406克、标准差

为10.1克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量x。

(1)描述x的抽样分布,并给出x和x的值,以及概率分布的形状;

(3) 假设某一天技术人员观察到x400.8,这是否意味着装袋过程出

现问题了呢,为什么?

解: a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了

8. 在本章的统计实践中,某投资者考虑将1000美元投资于n5种不同的股票。每一种股

票月收益率的均值为10%,标准差4%。对于这五种股票的投资组合,投资

者每月的收益率是rri52。投资者的每月收益率的方差是r2n3.2,它是

投资者所面临风险的一个度量。

⑴ 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的

风险将会增加还是减少?请解释;

⑵ 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,

并与只投资5种股票的情形进行比较。

解:a. 增加 b. 减少

9. 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以

牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。 ⑴ 如果该生产过程仍旧正常,则x的样本分布为何?

⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,

17

样本均值x≤830牛顿的概率是多少?

⑶ 在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现

状有何看法(即夹克级别均值是否仍为840牛顿)?

⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛

顿。在这种情况下x的抽样分布是什么?当x具有这种分布时,则x≤830牛顿的概率是多少?

解: a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06

10. 在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:

由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。

一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。

通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选n5块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值x描绘在下图中。假设这个过程是在统计控制中的,则x的分布将具有过程的均值,标准差具有过程

的标准差除以样本容量的平方根,xn。下面的控制图中水平线表示过程均值,

两条线称为控制极限度,位于的上下3x的位置。假如x落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。

当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从2%和

1%的近似的正态分布。

⑴ 假设n4,则上下控制极限应距离多么远?

⑵ 假如这个过程是在控制中,则x落在控制极限之外的概率是多少?

⑶ 假设抽取样本之前,过程均值移动到3%,则由样本得出这个过程失控的(正

确的)结论的概率是多少?

解:a. 0.015 b. 0.0026 c. 0.1587

4.11. 参考练习4.10。肥皂公司决定设置比练习4.10中所述的3x这一限度更为严格的控制

极限。特别地,当加工过程在控制中时,公司愿意接受x落在控制极限外面的概率是

0.10。

⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的

样本中使用n4个观察值,则控制极限应该设定在哪里? ⑵ 假设a部分中的控制极限已付诸实施,但是公司不知道,(而不是2%)。现在是3%若n4,则x落在控制极限外面的概率是多少?若n9呢? 解: a. (0.012, 0.028) b. 0.6553, 0.7278

4.12. 参考练习4.11。为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。

18

警戒限一般被设定为1.96x。假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。

⑴ 假设肥皂加工过程是在控制中(即,它遵循2%和1%的正态分布),则x的下一个值落在警戒限之外的概率是什么?

⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的x的这40个值中有多

少个点落在上控制极限以上? ⑶ 假设肥皂加工过程是在控制中,则x的两个未来数值落在下警戒线以下的概率是多

少?

解: a. 0.05 b. 1 c. 0.000625

第5章 参数估计

●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差σx等于多少?

(2) 在95%的置信水平下,允许误差是多少?

解:已知总体标准差σ=5,样本容量n=40,为大样本,样本均值x=25, (1)样本均值的抽样标准差σx=σ5==0.7906 n40(2)已知置信水平1-α=95%,得 Zα/2=1.96,

于是,允许误差是E =Zα/2σ=1.96×0.7906=1.5496。 n●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差;

(5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 σx=σ15==2.1429 n49(2)已知置信水平1-α=95%,得 Zα/2=1.96,

于是,允许误差是E =Zα/2σ=1.96×2.1429=4.2000。 n(3)已知样本均值为x=120元,置信水平1-α=95%,得 Zα/2=1.96, 这时总体均值的置信区间为 xZα/2124.2σ=120±4.2=

115.8n可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。

19

●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):

3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 解:⑴计算样本均值x:将上表数据复制到Excel表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x=3.316667,

⑵计算样本方差s:删除Excel表中的平均值,点击自动求值→其它函数→STDEV→选定计算数据列→确定→确定,得到s=1.6093

也可以利用Excel进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到:

(x-x)=90.65 2i再对总和除以n-1=35后,求平方根,即为样本方差的值

s=(x-x)=2in190.65=1.6093。 35⑶计算样本均值的抽样标准误差: 已知样本容量 n=36,为大样本, 得样本均值的抽样标准误差为 σx=s1.6093==0.2682

36n⑷分别按三个置信水平计算总体均值的置信区间:

① 置信水平为90%时:

由双侧正态分布的置信水平1-α=90%,通过2β-1=0.9换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 Zα/2=1.64, 计算得此时总体均值的置信区间为

xZα/23.7565s=3.3167±1.64×0.2682=

2.8769n 可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)

小时;

② 置信水平为95%时:

由双侧正态分布的置信水平1-α=95%,得 Zα/2=1.96,

计算得此时总体均值的置信区间为

xZα/2

3.8423s=3.3167±1.96×0.2682=

2.7910n20

可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)小时;

③ 置信水平为99%时:

若双侧正态分布的置信水平1-α=99%,通过2β-1=0.99换算为单侧正态分布的置信水平β=0.995,查单侧正态分布表得 Zα/2=2.58, 计算得此时总体均值的置信区间为

xZα/24.0087s=3.3167±2.58×0.2682=

2.6247n 可知,当置信水平为99%时,该校大学生平均上网时间的置信区间为(2.62,4.01)

小时。

4. 从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。 解:(7.1,12.9)。

5.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是:

10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 求职工上班从家里到单位平均距离95%的置信区间。 解:(7.18,11.57)。

●6. 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。

解:已知样本容量n =200,为大样本,拥有该品牌电视机的家庭比率p =23%,

拥有该品牌电视机的家庭比率的抽样标准误差为

σp=p(1p)0.230.77==2.98% n200⑴双侧置信水平为90%时,通过2β-1=0.90换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 Zα/2=1.64,

此时的置信区间为 pZα/227.89%p(1p)=23%±1.64×2.98%= n18.11%可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为

(18.11%,27.89%)。

⑵双侧置信水平为95%时,得 Zα/2=1.96, 此时的置信区间为 pZα/228.8408%p(1p)=23%±1.96×2.98%= n17.1592%可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为

;(17.16%,28.84%)。

21

●7.某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%; (2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查? 解: 已知总体单位数N=500,重复抽样,样本容量n =50,为大样本,

样本中,赞成的人数为n1=32,得到赞成的比率为 p =

n132==64% n50(1)赞成比率的抽样标准误差为

p(1p)0.640.36==6.788% n50由双侧正态分布的置信水平1-α=95%,得 Zα/2=1.96,

计算得此时总体户数中赞成该项改革的户数比率的置信区间为 pZα/277.304%p(1p)= 64%±1.96×6.788%= n50.696%可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为

(50.70%,77.30%)。

(2)如预计赞成的比率能达到80%,即 p=80%,

p(1p)0.80.2=6.788%,即=6.788% nn 得样本容量为 n =

0.80.2= 34.72 取整为35,

(6.788%)2即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。

8.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本 来自总体2的样本

n114 x153.2

s1296.8

(1) 求1290%的置信区间;

n27 x243.4

2s2102.0

(2) 求1295%的置信区间。

解:(1.86,17.74);(0.19,19.41)。

9.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本 来自总体2的样本

x125

s1216

x223

2s220

(1)设n1n2100,求1295%的置信区间;

22

222(2)设n1n210,12,求1295%的置信区间; (3)设n1n210,12,求1295%的置信区间; (4)设n110,n220,12,求1295%的置信区间;

(5)设n110,n220,12,求1295%的置信区间。 解:(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。 10.下表是由4对观察值组成的随机样本:

配对号 来自总体A的样本 来自总体B的样本

1 2 3 4

2 5 10 8

0 7 6 5

22222(1)计算A与B各对观察值之差,再利用得出的差值计算d和sd;

(2)设1和2分别为总体A和总体B的均值,构造d(12)95%的置信区间。 解:(1)d1.75,sd2.63;(2)1.75±4.27。

11.从两个总体中各抽取一个n1n2250的独立随机样本,来自总体1的样本比率为

p140%,来自总体2的样本比率为p230%。

(1)构造1290%的置信区间;

(2)构造1295%的置信区间。 解:(1)10%±6.98%;(2)10%±8.32%。

12.生产工序的方差是共需质量的一个重要度量。当方差较大时,需要对共需进行改进以减小方差。下面是两部机器生产的袋茶重量(克)的数据: 机器1 机器2 3.45 3.20 3.22 3.50 2.95 3.16 3.20 3.22 2.98 3.75 3.38 3.45 3.48 3.18 3.90 3.70 3.28 3.35 3.20 3.12 3.25 3.22 3.38 3.30 3.30 3.34 3.28 3.30 3.28 3.19 3.20 3.29 3.35 3.16 3.34 3.35 3.30 3.05 3.33 3.27 3.28 3.25 2212构造两个总体方差比95%的置信区间。

解:(4.06,14.35)。

●13.根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?

解:已知总体比率=2%=0.02,由置信水平1-α=95%,得置信度Zα/2=1.96,允许误差E≤ 4%

即由允许误差公式 E=Zα/2σpn整理得到样本容量n的计算公式:

23

Zα/2σP2Zα/2π(1-π)2Z2α/2π(1-π)1.9620.020.98)=)=(n=(≥=47.0596 22EE0.04E 由于计算结果大于47,故为保证使“≥”成立,至少应取48个单位的样本。

●14.某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求允许误差不超过20元,应抽取多少个顾客作为样本?

解:已知总体标准差x=120,由置信水平1-α=95%,得置信度Zα/2=1.96,允许误差E≤ 20

即由允许误差公式 E=Zα/2σxn整理得到样本容量n的计算公式:

n=(Zα/2σxE)2≥(1.961202)=138.2976 20由于计算结果大于47,故为保证使“≥”成立,至少应取139个顾客作为样本。 15.假定两个总体的标准差分别为:112,215,若要求误差范围不超过5,相应的置信水平为95%,假定n1n2,估计两个总体均值之差12时所需的样本容量为多大? 解: 57。

16.假定n1n2,允许误差E0.05,相应的置信水平为95%,估计两个总体比率之差

12时所需的样本容量为多大?

解: 769。

第6章 假设检验——练习题(全免)

6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,

所以原假设与备择假设应为:H0:1035,H1:1035。

H0:0.04,H1:0.04。6.2 =“某一品种的小鸡因为同类相残而导致的死亡率”,

6.3 H0:65,H1:65。

6.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但

检验结果却提供证据支持店方倾向于认为其重量少于60克;

(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。 6.5 (1)检验统计量zxs/n,在大样本情形下近似服从标准正态分布;

(2)如果zz0.05,就拒绝H0;

(3)检验统计量z=2.94>1.645,所以应该拒绝H0。

24

6.6 z=3.11,拒绝H0。 6.7 z=1.93,不拒绝H0。 6.8 z=7.48,拒绝H0。 6.9 2=206.22,拒绝H0。 6.10 z=-5.145,拒绝H0。 6.11 t=1.36,不拒绝H0。 6.12 z=-4.05,拒绝H0。 6.13 F=8.28,拒绝H0。 6.14 (1)检验结果如下:

t-检验: 双样本等方差假设

变量 1

变量 2

平均 100.7

109.9

方差 24.11578947

33.35789474

观测值 20

20

合并方差 28.73684211

假设平均差 0 df 38

t Stat -5.427106029 P(T<=t) 单尾 1.73712E-06 t 单尾临界 1.685953066 P(T<=t) 双尾 3.47424E-06 t 双尾临界

2.024394234

t-检验: 双样本异方差假设

变量 1

变量 2

平均 100.7

109.9

方差 24.11578947

33.35789474

观测值 20 20

假设平均差 0 df 37

t Stat -5.427106029 P(T<=t) 单尾 1.87355E-06 t 单尾临界 1.687094482 P(T<=t) 双尾 3.74709E-06 t 双尾临界

2.026190487

25

(2)方差检验结果如下:

F-检验 双样本方差分析

平均 方差 观测值 df F

P(F<=f) 单尾 F 单尾临界

变量 1

100.7

24.11578947

20 19

0.722940991 0.243109655 0.395811384

变量 2

109.9

33.35789474

20 19

第7章 方差分析与试验设计——练习题(全免)

7.1 F4.6574F0.018.0215(或Pvalue0.04090.01),不能拒绝原假设。 7.2 F17.0684F0.053.8853(或Pvalue0.00030.05),拒绝原假设。

xAxB44.43014.4LSD5.85,拒绝原假设; xAxC44.442.61.8LSD5.85,不能拒绝原假设; xBxC3042.612.6LSD5.85,拒绝原假设。

7.3 方差分析表中所缺的数值如下表: SS df MS 差异源 组间 组内 总计 420 3836 4256 2 27 29 210 142.07 — F 1.478 — — P-value 0.245946 — — F crit 3.354131 — — F1.478F0.053.554131(或Pvalue0.2459460.05),不能拒绝原假

设。

7.4 有5种不同品种的种子和4种不同的施肥方案,在20快同样面积的土地上,分别采用

5种种子和4种施肥方案搭配进行试验,取得的收获量数据如下表:

F种子7.2397F0.053.2592(或Pvalue0.00330.05),拒绝原假设。 F施肥方案9.2047F0.053.4903(或Pvalue0.00190.05),拒绝原假设。

7.5 F地区0.0727F0.056.9443(或Pvalue0.93110.05),不能拒绝原假

设。F包装方法3.1273F0.056.9443(或Pvalue0.15220.05),不能拒绝原假设。

26

7.6 F广告方案10.75F0.055.1432(或Pvalue0.01040.05),拒绝原假设。

F广告媒体3F0.055.9874(或Pvalue0.13400.05),不能拒绝原假设。 F交互作用1.75F0.055.1432(或Pvalue0.25190.05),不能拒绝原假

设。

第8章 相关与回归分析——练习题

●1. 表中是道琼斯工业指数(DJIA)和标准普尔500种股票指数(S&P500)1988年至1997年对应股票的收益率资料:

年份 1988 1989 1990 1991 1992 DJIA收益率(%) S&P500收益率(%) 年份 16.0 31.7 -0.4 23.9 7.4 16.6 31.5 -3.2 30.0 7.6 1993 1994 1995 1996 1997 DJIA收益率(%) 16.8 4.9 36.4 28.6 24.9 S&P500收益率(%) 10.1 1.3 37.6 23.0 33.4 计算两种指数收益率的相关系数,分析其相关程度,以0.05的显著性水平检验相关系数的显著性。

解:(1)解法一:利用Excel进行表格计算相关系数

设DJIA收益率为x,S&P500收益率为y,将已知表格复制到Excel中, 列出计算x2、xy、y2及其合计数的栏目并进行计算,得结果如下:

(利用Excel计算进行表格计算的方法类似于标准差的Excel计算) DJIA收益率年份 (%) S&P500收益率(%) X2 xy y2 x 1988 1989 1990 1991 1992 1993 1994 1995 1996 16.0 31.7 -0.4 23.9 7.4 16.8 4.9 36.4 28.6 y 16.6 31.5 -3.2 30.0 7.6 10.1 1.3 37.6 23.0 256 1004.89 0.16 571.21 54.76 282.24 24.01 1324.96 817.96 265.6 998.55 1.28 717 56.24 169.68 6.37 1368.64 657.8 275.56 992.25 10.24 900 57.76 102.01 1.69 1413.76 529 27

1997 合计 24.9 190.2 33.4 187.9 620.01 4956.2 831.66 5072.82 1115.56 5397.83 代入相关系数计算公式得: r =

nxyxynxx)22nyy)22

=105072.82190.2187.9104956.2105397.83 = 0.948138

解法二:利用Excel函数“CORREL”计算相关系数 (Correlation coefficient, 相关系数)

①将已知数据表复制到Excel中,同类数据置于同一列;

②在表格外选择某一单元格后,点选菜单栏中“∑”右边的“▼”后,选择

“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“CORREL”,然后点击“确定”;

③在“函数参数”窗口中,点击“Array1”输入栏后,在Excel表中刷取“DJIA

收益率”数据,再点击“Array2”输入栏后,在Excel表中刷取“S&P500收益率”数据,然后点击“确定”。

(由于相关系数中,两变量是对等的,故两列数据的选择顺序可以对换,而

计算结果是相同的。)

这时即在第②步骤中所选择的单元格中出现相关系数的计算结果。

可知,相关系数为 rXY0.948138,

以上相关系数的计算结果说明,DJIA收益率与S&P500收益率的相关程度属于高度正相关。

(2)计算t统计量(免)

trn21r20.9481381021o.94813822.6817398.436851

0.317859 给定显著性水平=0.05,查t分布表得自由度n-2=10-2=8的临界值t2为2.306, 显然tt2,表明相关系数 r 在统计上是显著的。

● 2.利用【例8-3】的表8.3中提供的各省市人均GDP和第一产业中就业比例的数据,试

分析各省市人均GDP与第一产业就业比例的相关性,并对其显著性作统计检验。 解: 表8.3中提供的各省市人均GDP和第一产业中就业比例的数据为:

序号 地区 1 2 3

GDP 2845.65 1840.10 5577.78 就业比例% 序号 11.2 20.0 49.6 17 18 19

地区 湖北 湖南 广东

GDP 4662.28 3983.00 10647.70

就业比例%

48.4 60.5 40.0

28

北京 天津 河北

4 5 6 7 8 9 10 11 12 13 14 15 16 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 1779.97 1545.79 5033.08 2032.48 3561.00 4950.84 9511.91 6748.15 3290.13 4253.68 2175.68 9438.31 5640.11 46.9 53.9 37.2 50.7 49.6 12.5 41.4 35.7 58.7 45.8 51.6 52.3 63.1 20 21 22 23 24 25 26 27 28 29 30 31

广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆

2231.19 545.96 1749.77 4421.67 1084.90 2074.71 138.73 1844.27 1072.51 300.95 298.38 1485.48

61.8 60.3 54.7 58.8 66.4 73.6 71.8 55.7 59.4 60.0 56.5 56.6

利用Excel中的”数据分析”计算各省市人均GDP和第一产业中就业比例的相关系数,方法同上第1题,即应用统计函数“CORREL”进行计算,也可以构成计算表格进行计算: 解法一:构成Excel计算表格对相关系数计算公式中的计算元素进行列表计算: 序号 地区 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 GDP x 2845.65 1840.10 5577.78 1779.97 1545.79 5033.08 2032.48 3561.00 4950.84 9511.91 6748.15 3290.13 4253.68 2175.68 9438.31 5640.11 4662.28 3983.00 10647.70 2231.19 545.96 1749.77 4421.67 就业比例% y 11.2 20.0 49.6 46.9 53.9 37.2 50.7 49.6 12.5 41.4 35.7 58.7 45.8 51.6 52.3 63.1 48.4 60.5 40.0 61.8 60.3 54.7 58.8 x2 8097723.9225 3385968.0100 3168293.2009 2389466.7241 4130974.9504 24510816.7056 xy 31871.3 36802.0 83480.6 83318.1 103046.7 61885.5 y2 125.44 400.00 2460.16 2199.61 2905.21 1383.84 2570.49 2460.16 156.25 1713.96 1274.49 3445.69 2097.64 2662.56 2735.29 3981.61 2342.56 3660.25 1600.00 3819.24 3636.09 2992.09 3457.44 31111629.7284 276657.9 25331894.2864 187230.6 12680721.0000 176625.6 90476431.8481 393793.1 45537528.4225 240909.0 10824955.4169 193130.6 18093793.5424 194818.5 4733583.4624 112265.1 89081695.6561 493623.6 31810840.8121 355890.9 21736854.7984 225654.4 15864289.0000 240971.5 113373515.2900 425908.0 4978208.8161 298072.3216 3061695.0529 137887.5 32921.4 95712.4 19551165.5889 259994.2 29

24 25 26 27 28 29 30 31 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 1084.90 2074.71 138.73 1844.27 1072.51 300.95 298.38 1485.48 106766.16 66.4 73.6 71.8 55.7 59.4 60.0 56.5 56.6 1564.7 1177008.0100 4304421.5841 19246.0129 3401331.8329 1150277.7001 90570.9025 89030.6244 2206650.8304 72037.4 152698.7 9960.8 102725.8 63707.1 18057.0 16858.5 84078.2 4408.96 5416.96 5155.24 3102.49 3528.36 3600.00 3192.25 3203.56 合 计 596668656.0540 4964521.9 85687.89 将计算结果代入相关系数计算公式中, 由上得 r=nxyxynxx)22nyy)22

=314964521.9106766.161564.731596668656.05413156831.652 7097715416.5208038.53185687.89 = =

13156831.652= -0.342391

84247.94456.11解法二:应用Excel中的函数“CORREL”计算,

①将已知数据表复制到Excel中;

②在表格外选择某一单元格,点选菜单栏中“∑”右边的“▼”后,选择“其

它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“CORREL”,然后点击“确定”;

③在“函数参数”窗口中,点击“Array1”输入栏后,在Excel表中刷取“就

业比例%”数据,再点击“Array2”输入栏后,在Excel表中刷取“GDP”数据,然后点击“确定”。

这时即在第②步骤中所选择的单元格中出现相关系数的计算结果。 结果也是 r=-0.34239,

这说明人均GDP与第一产业中就业比例是负相关,但相关系数只有-0.34239,表明二者相关程度并不大,属于低度负相关关系。 相关系数检验:(免)

在总体相关系数0的原假设下,计算t统计量:

trn21r20.342393121(0.34239)21.9624

查t分布表,自由度为31-2=29,当显著性水平取0.05时,t2=2.045;当显著性水平取0.1时,t2=1.699。

由于计算的t统计量的绝对值1.9624小于t2=2.045,所以在0.05的显著性水平

30

下,不能拒绝相关系数0的原假设。即是说,在0.05的显著性水平下不能认为人均GDP与第一产业中就业比例有显著的线性相关性。

但是计算的t统计量的绝对值1.9624大于t2=1.699,所以在0.1的显著性水平下,可以拒绝相关系数0的原假设。即在0.1的显著性水平下,可以认为人均GDP与第一产业中就业比例有一定的线性相关性。

●3.表中是16支公益股票某年的每股账面价值和当年红利:

公司序号 1 2 3 4 5 6 7 8 账面价值(元) 22.44 20.89 22.09 14.48 20.73 19.25 20.37 26.43 红利(元) 2.4 2.98 2.06 1.09 1.96 1.55 2.16 1.60 公司序号 9 10 11 12 13 14 15 16 账面价值(元) 12.14 23.31 16.23 0.56 0.84 18.05 12.45 11.33 红利(元) 0.80 1.94 3.00 0.28 0.84 1.80 1.21 1.07 根据上表资料:

(1)建立每股账面价值和当年红利的回归方程; (2)解释回归系数的经济意义;

(3)若序号为6的公司的股票每股账面价值增加1元,估计当年红利可能为多少? 解: (1)设当年红利为Y,每股帐面价值为X

则回归方程为 Yi12Xi,下面分别应用两种方法计算回归参数: 方法一:利用Excel进行表格运算计算公式元素: 账面价值公司序号 (元) x 1 2 3 4 5 6 7 8 9 10 11 12 13 14

22.44 20.89 22.09 14.48 20.73 19.25 20.37 26.43 12.14 23.31 16.23 0.56 0.84 18.05 红利(元) y 2.4 2.98 2.06 1.09 1.96 1.55 2.16 1.6 0.8 1.94 3 0.28 0.84 1.8 x2 503.5536 436.3921 487.9681 209.6704 429.7329 370.5625 414.9369 698.5449 147.3796 543.3561 263.4129 0.3136 0.7056 325.8025 xy 53.856 62.2522 45.5054 15.7832 40.6308 29.8375 43.9992 42.288 9.712 45.2214 48.69 0.1568 0.7056 32.49 31

15 16 12.45 11.33 1.21 1.07 155.0025 128.3689 15.0645 12.1231 合计 261.59 26.74 5115.703 498.3157 将计算结果代入回归系数计算公式,得:

回归系数 β2 nxyxynx2x)2

16498.3157261.5926.74 2165115.703(261.59)978.1346 = = 0.07287590

13421.9199 初始值 β1yβ2 =

yxβ x=

n2n26.74261.59=0.47977458 0.07287591616方法二:应用Excel函数计算直线回归方程的两个参数:

⑴应用统计函数“SLOPE”计算直线斜率: (slope,斜率)

①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右

边的“▼”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“SLOPE”,然后点击“确定”;

②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在Excel表中刷取y

列数据,再点击“Known_x’s”输入栏后,在Excel表中刷取x列数据,然后点击“确定”。 这时即在选定的单元格中出现直线斜率的计算结果20.072876

⑵应用统计函数“INTERCEPT”计算直线与y轴的截距——直线起点值:

(截距intercept )

①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右

边的“▼”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“INTERCEPT”,然后点击“确定”;

②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在Excel表中刷取y

列数据,再点击“Known_x’s”输入栏后,在Excel表中刷取x列数据,然后点击“确定”。 这时即在选定的单元格中出现直线斜率的计算结果1 0.479775

于是,回归方程为 Yi0.4797750.072876Xi

(2)参数的经济意义是:当每股帐面价值增加1元时,当年红利将平均增加0.072876元。

(3)序号6的公司每股帐面价值为19.25元,若增加1元后,每股帐面价值为X=20.25元,则当年红利估算为:

^^Yi0.4797750.07287620.251.955514(元)

32

●4.美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下: 航空公司名称 航班正点率(%) 投诉率(次/10万名乘客) 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 环球(TWA)航空公司 68.5 1.25 (1)画出这些数据的散点图; (2)根据散点图。表明二变量之间存在什么关系?

(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程; (4)对估计的回归方程的斜率作出解释;

(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少? 解:(1)利用EXCEL制作数据散点图:

将已知表格的后两列复制到Excel中,选择该表格后,点击:图表向导→XY 散点图→确定,即得散点图如下:

投诉率(次/10万名乘客)1.41.210.80.60.40.20657075航班正点率(%)8085

(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,说明航班整点率与投诉率两者之间,存在着一定的负相关关系。

[利用Excel的统计函数“CORREL”计算得到相关系数r= -0.88261,属于高度负相关]

(3)求投诉率依赖航班正点率的估计的回归方程

设投诉率为Y,航班正点率为X 建立回归方程 Yi12Xi 解法一:应用Excel函数计算:

应用统计函数“SLOPE”计算直线斜率为:2=-0.07041

应用统计函数“INTERCEPT”计算直线与y轴的截距为:1= 6.017832

解法二:应用Excel列表计算:

作出Excel运算表格如下:

33

航空公司名称 航班正点率投诉率(次(%) /10万名乘客) x y 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 7.18

81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5 667.2 x2 xy 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 环球(TWA)航空公司 合 计 得回归系数为: β26691.24 5867.56 5867.56 5730.49 5446.44 5212.84 5069.44 5012.64 4692.25 49590.46 17.178 44.428 65.11 51.476 54.612 67.146 51.264 86.376 85.625 523.215 nxyxynx2x)29523.215667.27.18 2949590.46(667.2)81.561 = = —0.0704144

1158.3  初始值 β1yβ2x= = 于是得回归方程为

Yi6.01780.07Xi

(4)参数的经济意义是:航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。

(5)航班按时到达的正点率为80%时,估计每10万名乘客投诉的次数可能为:

^yβx

n2n7.18667.2=6.01783 0.070414499ˆ6.01780.07800.4187(次/10万) Yi5. 表中是1992年亚洲各国人均寿命(y)、按购买力平价计算的人均GDP(x1)、成人识字率(x2)、一岁儿童疫苗接种率(x3)的数据 序国家和 平均寿命 人均GDP 号 地区 y(年) x1(100美元) 1 2 3 4

成人识字率一岁儿童疫苗接种率 x2(%) 99 90 97 92 x3(%) 99 79 83 90 34

日本 中国香港 韩国 新加坡 79 77 70 74 194 185 83 147

5 6 7 8 9 11 泰国 马来西亚 斯里兰卡 中国大陆 菲律宾 蒙古 69 70 71 70 65 71 63 62 63 57 58 50 60 52 50 53 48 43 53 74 27 29 24 18 23 27 13 7 20 18 12 12 13 11 6 7 94 80 89 80 90 95 95 84 89 81 36 55 50 37 38 27 41 32 86 90 88 94 92 96 85 92 90 74 81 36 90 69 37 73 85 35 10 朝鲜 12 印度尼西亚 13 越南 14 缅甸 15 巴基斯坦 16 老挝 17 印度 18 孟加拉国 19 柬埔寨 20 尼泊尔 21 不丹 22 阿富汗 资料来源:联合国发展规划署《人的发展报告》 (1)用多元回归的方法分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系;

(2)对所建立的回归模型进行检验。 解: 由Excel回归输出的结果可以看出: (1)回归结果为

Yi32.993090.071619X2i0.168727X3i0.179042X3i

^1,2,3,4 对应的 t 统计量分别为0.51206、(2)由Excel的计算结果已知:4.853871、

4.222811、3.663731 ,其绝对值均大于临界值t0.025(224)2.101 ,所以各个自变量都对Y有明显影响。

由F=58.20479, 大于临界值F0.05(41,224)3.16,说明模型在整体上是显著的。 6.表中给出y对x2和x3回归的结果:

离差来源 平方和(SS) 自由度(df) 平方和的均值(MSS) 来自回归(ESS) 65965 来自残差(RSS) 总离差(TSS) 66042 14

(1) 该回归分析中样本容量是多少? (2) 计算RSS;

35

(3) ESS和RSS的自由度是多少? (4) 计算可决系数和修正的可决系数;

(5) 怎样检验x2和x3对y是否有显著影响?根据以上信息能否确定x2和x3各自对

y的贡献为多少?

解:(1)该回归分析中样本容量是14+1=15

(2)计算RSS=66042-65965=77

ESS的自由度为k-1=2,RSS的自由度 n-k=15-3=12 (3)计算:可决系数 R65965/660420.9988 修正的可决系数 R122151(10.9988)153 99860.(4)检验X2和X3对Y是否有显著影响

FESS/(k1)65965/2329825140.11

RSS/(nk)77/126.4166 (5) F统计量远比F临界值大,说明X2和X3联合起来对Y有显著影响,但并不能确定X2和X3各自对Y的贡献为多少。

7. 在计算一元线性回归方程时,已得到以下结果:

试根据此结果,填写下表的空格:

来 源 来自回归 来自残差 总离差平方和 解:

平方和 99.11 2278.67 自由度 22 方差 2179.56 来 源 来自回归 来自残差 总离差平方和

平方和 2179.56 99.11 2278.67 自由度 1 22 23 方差 2179.56 4.505 8. 表中为某企业近年来的总成本和产量的数据:

36

年份 总成本y (万元) 产量x (件) 410 608 512 723 811 年份 总成本y (万元) 产量x (件) 906 1223 1107 1319 1424 1541 1991 1992 1993 1994 1995 329 524 424 629 741 1997 1998 1999 2000 2001 863 1390 1157 1548 1787 1996 1020 1009 2002 2931 (1) 用已知数据估计以下总成本函数的参数: yt12xt3xt24xt3ut (2) (3) (4) (5)

检验参数的显著性;

检验整个回归方程的显著性;

计算总成本对产量的非线性相关指数; 评价此回归分析存在什么不足。

23解: (1)用Excel输入Y和X数据,生成X和X的数据,用Y对X、X、X回归,估计参数结果为

Yi1726.737.879646874Xi0.00895X3.71249E06X

t=(-1.9213) (2.462897) (-2.55934) (3.118062) R0.973669 R0.963764

(2)检验参数的显著性:当取0.05时,查t分布表得t0.025(124)2.306,与t统计量对比,除了截距项外,各回归系数对应的t统计量的绝对值均大于临界值,表明在这样的显著性水平下,回归系数显著不为0。

(3)检验整个回归方程的显著性:模型的R0.973669,R0.963794,说明可决系数较高,对样本数据拟合较好。由于F=98.60668,而当取0.05时,查F分布表得F0.05(41,124)4.07,因为F=98.60668>4.07,应拒绝H0:2340,说明X、X、X联合起来对Y确有显著影响。

(4)计算总成本对产量的非线性相关系数:因为R0.973669因此总成本对产量的非线性相关系数为R0.973669或R=0.9867466

(5)评价:虽然经t检验各个系数均是显著的,但与临界值都十分接近,说明t检验只是勉强通过,其把握并不大。如果取0.01,则查t分布表得t0.005(124)3.3554,这时各个参数对应的t统计量的绝对值均小于临界值,则在0.01的显著性水平下都应接受H0:j0的原假设。

37

222222^232323

9. 研究青春发育与远视率(对数视力)的变化关系,测得结果如下表: 年龄(岁)x 6 7 8 9 10 11 12 13 14 15 16 17 18 远视率(%)63.64 61.06 38.84 13.75 14.50 8.07 4.41 2.27 2.09 1.02 2.51 3.12 2.98 y 对数视力Y=ln4.153 4.112 3.659 2.621 2.674 2.088 1.484 0.82 0.737 0.02 0.92 1.138 1.092 y ˆ 试建立曲线回归方程y解:利用Excel输入X、y和Y数据,用Y对X回归,估计参数结果为

ˆ5.730.314x Yii t值=(9.46)(-6.515) R0.794 R0.775

22ˆ307.9693e整理后得到:y0.314x

第9章 时间序列分析——练习题

●1. 某汽车制造厂2003年产量为30万辆。

(1)若规定2004—2006年年递增率不低于6%,其后年递增率不低于5%,2008年该厂汽车

产量将达到多少?

(2)若规定2013年汽车产量在2003年的基础上翻一番,而2004年的增长速度可望达到

7.8%,问以后9年应以怎样的速度增长才能达到预定目标?

(3)若规定2013年汽车产量在2003年的基础上翻一番,并要求每年保持7.4%的增长速度,问能提前多少时间达到预定目标?

解:设i年的环比发展水平为x i,则由已知得:x2003=30, (1)又知:

x2004x2005x2006xx32(16%)(15%),20072008,求x2008

x2003x2004x2005x2006x2007 38

由上得

x2008x2007x2008(16%)3(15%)2 x2003x2003x2007 即为

x20081.0631.052,从而2008年该厂汽车产量将达到 3032得 x2008≥30× 1.06×1.05= 30×1.3131 = 39.393(万辆) 从而按假定计算,2008年该厂汽车产量将达到39.393万辆以上。

9xx2013x2004=2,=1+7.8%,求2013 (2)规定

x2003x2003x2004由上得

99xx2013x2013=2004 x2004x2003x2003=921.078107.11%

可知,2004年以后9年应以7.11%的速度增长,才能达到2013年汽车产量在2003

年的基础上翻一番的目标。

(3)设:按每年7.4%的增长速度n年可翻一番, 则有 1.074na20132 a2003 所以 nlog1.0742log20.301039.70939(年)

log1.0740.031004可知,按每年保持7.4%的增长速度,约9.71年汽车产量可达到在2003年基础上翻一番的预定目标。

原规定翻一番的时间从2003年到2013年为10年,故按每年保持7.4%的增长速度,能提前0.29年即3个月另14天达到翻一番的预定目标。

●2. 某地区社会商品零售额1988—1992年期间(1987年为基期)每年平均增长10%,1993—1997年期间每年平均增长8.2%,1998—2003年期间每年平均增长6.8%。问2003年与1987年相比该地区社会商品零售额共增长多少?年平均增长速度是多少?若1997年社会商品零售额为30亿元,按此平均增长速度,2004年的社会商品零售额应为多少? 解:设i年的环比发展水平为x i,则已知的三段年均增长率表示为:

199219871988xxx1987xxxx1992xxxx1997x1989x198x8x199x319991990x19x89x19x941995xx59921110%,即为1992(110%)

x1987x9901991119911996

1997199219931994xx5997118.2%,即为1997(18.2%)

x1992x99519961xxx20022003616.8%,即为2003(16.8%)

x1997x000x2001200222001

200319971998x199x8x19x992000 于是得:

39

(1) 以1987年为基期,2003年与1987年相比,该地区社会商品零售额的发展速度

为:

x2003x1992x1997x2003= x1987x1987x1992x1997=(110%)(18.2%)(16.8%)

5563.5442736354.43%

(原解答案中,03~97为5年是错的,导致增长速度也是错的。下同) 从而得知,2003年与1987年相比,该地区社会商品零售额共增长254.43%。

(2)1987年至2003年之间,年平均发展速度为:

200319x82003716x1987=3.5442736=1.0822945=108.23% 可知,1987年至2003年之间,年平均增长速度为8.23%。 (3) 若x1997=30亿元,按平均增长速度8.23%计算x2004, 即由

200419x920047x199718.23%

7 得 x2004=30(10.0823)52.1867 (亿元)

可知,按照假定,2004年的社会商品零售额应为52.1867亿元

●3.某地区国内生产总值在1991—1993年平均每年递增12%,1994--1997年平均每年递增10%,1998--2000年平均每年递增8%。试计算:

(1)该地区国内生产总值在这10年间的发展总速度和平均增长速度;

(2)若2000年的国内生产总值为500亿元,以后平均每年增长6%,到2002年可达多少? (3)若2002年的国内生产总值的计划任务为570亿元,一季度的季节比率为105%,则2002年一季度的计划任务应为多少?

解:设i年的环比发展水平为x i,则已知的三段年均增长率表示为:

199319x901993x1990199719x931997112%,即

x19933 (112%)x1990

x1993200019x920007x19974110%,即 (110%)x199318%,即

x1997x20003 (108%)x1997(1) 该地区国内生产总值在这10年间的发展总速度为

40

x2000343=(112%)(110%)(18%)2.59117259.12% x1990则平均增长速度为:

102.5911711.0998919.989%

(2) 若x2000=500亿元,以后平均每年增长6%,

即由

20022000x200216% x20002得到 x2002=500(16%)561.80(亿元),

可知,若2000年的国内生产总值为500亿元,以后平均每年增长6%,到2002

年可达561.80亿元。

(3) 若2002年的国内生产总值的计划任务为570亿元,一季度的季节比率为105%,

则2002年各季度的平均计划任务是570÷4亿元, 于是,2002年一季度的计划任务为:

。 142.5105%149.625(亿元)

●4. 某公司近10年间股票的每股收益如下(单位:元):

0.64,0.73,0.94,1.14,1.33,1.53,1.67,1.68,2.10,2.50 (1)分别用移动平均法和趋势方程预测该公司下一年的收益;

(2)通过时间序列的数据和发展趋势判断,是否是该公司应选择的合适投资方向? 解: (1) *用移动平均法预测该公司下一年的收益:

在Excel中作出10年间股票的每股收益表,添加“五项平均”计算列,选定“五项平均”列中的第三行单元格,点击菜单栏中“∑”符号右边的小三角“▼”,选择点击:自动求和→平均值,用鼠标选定前五个数据(b2:b6),回车,即得到第一个五项平均值“0.96”。选择第一个五项平均“0.96”所在的单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列倒数第三行的单元格处放开,即得到用五项移动平均法计算的趋势值,如下表:

年序 每股收益 五项平均 1 0.64 — 2 3 4 5 6 7 8 9 10 0.73 — 0.94 1.14 1.33 1.53 1.67 1.68 0.96 1.13 1.32 1.47 1.66 1.90 2.10 — 2.50 — 再利用上表的计算结果预测第11年的每股收益:

选定上Excel表中的全部预测值,并将鼠标移动到该选定区域的右下方,当鼠标变成

41

黑“+”字时,压下左键并拉动鼠标到该列第11年对应的单元格处放开,即获得9~11年的预测值(见下表蓝色数字),即得第11年的每股收益额为“2.30”。如下表:

年序 每股收益 五项平均 1 0.64 — 2 3 4 5 6 7 8 9 10 0.73 — 0.94 1.14 1.33 1.53 1.67 1.68 2.10 2.50 0.96 1.13 1.32 1.47 1.66 1.90 1.99 2.09 2.30 *用趋势方程法预测该公司下一年的收益: 先求出10年间股票每股收益的趋势(回归)方程。 设时间为t,每股收益为y,趋势方程为 y=β1+β2 t 解法一:应用Excel统计函数进行计算:

⑴应用统计函数“SLOPE”计算直线斜率:

①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右

边的“▼”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“SLOPE”,然后点击“确定”;

②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在Excel表中刷取y

列数据,再点击“Known_x’s”输入栏后,在Excel表中刷取t列数据,然后点击“确定”。 这时即在选定的单元格中出现直线斜率的计算结果20.192848

⑵应用统计函数“INTERCEPT”计算直线与y轴的截距——直线起点值:

①在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“∑”右边的“▼”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“INTERCEPT”,然后点击“确定”;

②在“函数参数”窗口中,点击“Known_y’s”输入栏后,在Excel表中刷取y

列数据,再点击“Known_x’s”输入栏后,在Excel表中刷取x列数据,然后点击“确定”。 这时即在选定的单元格中出现直线斜率的计算结果1 0.365333 解法二:应用最小二乘法,用Excel列表计算趋势方程的公式元素:

年序 t 1 2 3 4 每股收益 y 0.64 0.73 0.94 1.14 t2 1 4 9 16 ty 0.64 1.46 2.82 4.56 42

合计 5 6 7 8 9 10 55 1.33 1.53 1.67 1.68 2.10 2.50 14.26 25 36 49 64 81 100 385

6.65 9.18 11.69 13.44 18.9 25 94.34 可得:回归系数 β2ntytyntt)22 1094.345514.26159.1=0.192848 210385(55)825 初始值 β1yβ2t=

=

yβt

n2n14.26550.192848=0.365336 1010 于是,得每股收益倚年份序号的趋势方程为:

Yt0.3650.193t

对趋势方程代入 t=11,可预测下一年(第11年)的每股收益为:

^ˆ0.3650.193112.488元 Y11(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193

元。是一个较为适合的投资方向。

●5.某县2000—2003年各季度鲜蛋销售量数据如下(单位:万公斤) 年份 一季度 二季度 三季度 四季度 2000 13.1 13.9 7.9 8.6 2001 10.8 11.5 9.7 11.0 2002 14.6 17.5 16.0 18.2 2003 18.4 20.0 16.9 18.0 (1)用移动平均法消除季节变动; (2)拟合线性模型测定长期趋势; (3)预测2004年各季度鲜蛋销售量。 解:(1)由于应用移动平均法修匀数据由于周期性或季节性引起的波动,必须以周期或季节的长度作为时距的长度,因此对上面的数据作四项移动平均。

先在Excel中将数据按年序和季度顺序排列成表,然后计算四项移动平均:选定“四项移动平均”列中的第三季度对应的单元格(实际位于第二、三季度之间,即上升半行的位置),点击:菜单栏中“∑”右边的“▼”后,选择“平均值”后,,在Excel表中刷取2000年的四个季度的销售量数据,回车,即获得第一个四项平均值。选定上Excel表中的第一个四项平均值,并将鼠标移动到该选定单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列倒数第三行(实际位于第二、三季度之间,即上升半行的位置) 的单元格处放开,即获得全部四项移动平均值。

43

再计算移正平均:选定“移正平均”列中的第三季度对应的单元格,点击:菜单栏中“∑”右边的“▼”后,选择“平均值”后,,在Excel表中刷取头两个四项平均值,回车,即获得第一个移正平均值。选定上Excel表中的第一个移正平均值,并将鼠标移动到该选定单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列倒数第三行的单元格处放开,即获得全部移正平均值。 可见,移正后的数据基本上呈上升状态,已经消除了原来鲜蛋销售量的季节波动影响,为作数据的长期趋势分析提供了有效支持。 数据如下表:

移动平均法消除季节变动计算表

年序 季序 鲜蛋销售量 四项移动平均值 移正平均值(Tˆ) 2000年 一季度 13.1 — — 二季度 13.9 — — 三季度 7.9 10.875 10.5875 四季度 8.6 10.3 10 2001年 一季度 10.8 9.7 9.925 二季度 11.5 10.15 10.45 三季度 9.7 10.75 11.225 四季度 11 11.7 12.45 2002年 一季度 14.6 13.2 13.9875 二季度 17.5 14.775 15.675 三季度 16 16.575 17.05 四季度 18.2 17.525 17.8375 2003年 一季度 18.4 18.15 18.2625 二季度 20 18.375 18.35 三季度 16.9 四季度 18 (2)设线性趋势方程为 y=β1+β2 t

解法一:应用Excel统计函数计算趋势方程的系数:

应用统计函数“SLOPE”计算直线斜率,得:β2=0.639853

应用统计函数“INTERCEPT”计算直线与y轴的截距,得:β1=8.6925 解法二:应用最小二乘法,用Excel列表计算趋势方程的公式元素:

年别 季别 时序 鲜蛋销售量 2t y t ty 2000 一 1 13.1 1 13.1 二 2 13.9 4 27.8 三 3 7.9 9 23.7 四 4 8.6 16 34.4 2001 一 5 10.8 25 54 二 6 11.5 36 69 三 7 9.7 49 67.9 四 8 11 64 88

44

2002 2003 一 二 三 四 一 二 三 四 9 10 11 12 13 14 15 16 136 初始值 β114.6 17.5 16 18.2 18.4 20 16.9 18 81 100 121 144 169 196 225 256 1496 131.4 175 176 218.4 239.2 280 253.5 288 2139.4

于是得:回归系数

β2ntytyntt)22

合计 226.1

162139.4136226.116149613623480.8=0.6398529

5440ytβ yβt=

2n2n =

226.1136=8.6925 0.63985291616 从而,鲜蛋销售量倚季度变化的趋势方程为:

y8.69250.63985t

(原答案中的两个系数均有误差。)

(3)趋势剔出法季节比例计算表(一) 年别 2000年 2001年 2002年 2003年 季别 一季度 二季度 三季度 四季度 一季度 二季度 三季度 四季度 一季度 二季度 三季度 四季度 一季度 二季度 三季度 四季度 时间序列号t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 鲜蛋销售量 13.1 13.9 7.9 8.6 10.8 11.5 9.7 11 14.6 17.5 16 18.2 18.4 20 16.9 18 预测 鲜蛋销售量 9.332352941 9.972205882 10.61205882 11.25191176 11.89176471 12.53161765 13.17147059 13.81132353 14.45117647 15.09102941 15.73088235 16.37073529 17.01058824 17.65044118 18.29029412 18.93014706 趋势剔除值 1.403718878 1.39387415 0.74443613 0.764314561 0.908191531 0.917678812 0.736440167 0.796447927 1.010298368 1.159629308 1.0171076 1.111739923 1.081679231 1.133116153 0.923987329 0.950864245 ˆ8.96250.63995t。 上表中,其趋势拟合为直线方程Tt趋势剔出法季节比例计算表(二)

季度 年度 2000年 一季度 1.403719 二季度 1.393874 三季度 0.744436 四季度 0.764315 — 45

2001年 2002年 2003年 平 均 季节比率% 0.908192 1.010298 1.081679 1.100972 1.097301 0.917679 1.159629 1.133116 1.151075 1.147237 0.73644 1.017108 0.923987 0.855493 0.852641 0.796448 1.11174 0.950864 0.905842 0.902822 — — — 4.013381 4.00000 ˆˆTˆS根据上表计算的季节比率,按照公式YtttKL计算可得:

2004年第一季度预测值:

ˆ(8.96250.6399517)1.09730121.7723 ˆTˆSY171712004年第二季度预测值:

ˆ(8.96250.6399518)1.14723723.49725 ˆTˆSY181822004年第三季度预测值:

ˆ(8.96250.6399519)0.85264118.009 ˆTˆSY191932004年第四季度预测值:

ˆ(8.96250.6399520)0.90282219.6468 ˆTˆSY202046.某地区2000—2003年各月度工业增加值的数据如下(单位:亿元) 年份 2000 2001 2002 2003 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 4.78 3.97 5.07 5.12 5.27 5.45 4.95 5.03 5.37 5.34 5.54 5.44 5.18 4.61 5.69 5.71 5.90 6.05 5.65 5.76 6.14 6.14 6.47 6.55 6.46 5.62 6.96 7.12 7.23 7.43 6.78 6.76 7.03 6.85 7.03 7.22 6.82 5.68 7.38 7.40 7.60 7.95 7.19 7.35 7.76 7.83 8.17 8.47 (1)用原始资料平均法计算季节比率; (2)用移动平均法分析其长期趋势。 解:(1)用原始资料法计算的各月季节比率为: 月份 季节比率 月份 季节比率 1月 0.9195 7月 0.9722 2月 0.7868 8月 0.9851 3月 0.9931 9月 1.0407 4月 1.0029 10月 1.0350 5月 1.0288 11月 1.0765 6月 1.0637 12月 1.0958 平均法计算季节比率表:

年别 月份 1月 2月 3月 4月 5月 6月

2000年 4.78 3.97 5.07 5.12 5.27 5.45 2001年 5.18 4.61 5.69 5.71 5.90 6.05 2002年 6.46 5.62 6.96 7.12 7.23 7.43 2003年 6.82 5.68 7.38 7.40 7.60 7.95 平均 5.80875 4.97025 6.2735 6.33575 6.49925 6.7195 季节比率% 0.9195 0.7868 0.9931 1.0029 1.0288 1.0637 46

7月 4.95 5.65 6.78 7.19 6.1415 8月 5.03 5.76 6.76 7.35 6.223 9月 5.37 6.14 7.03 7.76 6.574 10月 5.34 6.14 6.85 7.83 6.53825 11月 5.54 6.47 7.03 8.17 6.80025 12月 5.44 6.55 7.22 8.47 6.9225 平均 6.317208 季节比率的图形如下:

季节比率1.201.000.800.600.400.200.00123456789101112季节比率

(2)用移动平均法分析其长期趋势 年月 序号 工业总产值(亿移动平均 移正平均 元) Jan-00 1 4.78 Feb-00 2 3.97 Mar-00 3 5.07 Apr-00 4 5.12 May-00 5 5.27 Jun-00 6 5.45 5.13 Jul-00 7 4.95 5.17 Aug-00 8 5.03 5.22 Sep-00 9 5.37 5.27 Oct-00 10 5.34 5.32 Nov-00 11 5.54 5.37 Dec-00 12 5.44 5.11 5.43 Jan-01 13 5.18 5.14 5.49 Feb-01 14 4.61 5.20 5.55 Mar-01 15 5.69 5.25 5.62 Apr-01 16 5.71 5.30 5.69 May-01 17 5.90 5.35 5.77 Jun-01 18 6.05 5.40 5.87 Jul-01 19 5.65 5.46 5.97 Aug-01 20 5.76 5.52 6.06 0.9722 0.9851 1.0407 1.0350 1.0765 1.0958 1.0000 47

Sep-01 Oct-01 Nov-01 Dec-01 Jan-02 Feb-02 Mar-02 Apr-02 May-02 Jun-02 Jul-02 Aug-02 Sep-02 Oct-02 Nov-02 Dec-02 Jan-03 Feb-03 Mar-03 Apr-03 May-03 Jun-03 Jul-03 Aug-03 Sep-03 Oct-03 Nov-03 Dec-03 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 6.14 6.14 6.47 6.55 6.46 5.62 6.96 7.12 7.23 7.43 6.78 6.76 7.03 6.85 7.03 7.22 6.82 5.68 7.38 7.40 7.60 7.95 7.19 7.35 7.76 7.83 8.17 8.47 5.58 5.65 5.73 5.82 5.93 6.01 6.12 6.23 6.35 6.46 6.55 6.64 6.71 6.77 6.82 6.88 6.91 6.91 6.94 6.97 7.00 7.04 7.08 7.12 7.19 7.27 7.36 7.46 6.18 6.29 6.40 6.51 6.60 6.68 6.74 6.80 6.85 6.89 6.91 6.93 6.96 6.98 7.02 7.06 7.10 7.15 7.23 7.31 7.41 原时间序列与移动平均的趋势如下图所示: 8.007.006.005.004.003.002.001.000.001013161922252831移动平均原时间序列34147

7.运用练习题9.7中国各月工业总产值的数据,作以下分析:

(1)分析其长期趋势;

(2)剔除长期趋势后分析其季节变动情况,并与练习题9.7的分析结果对比说明有何不

48

同、为什么?

(3)分析是否存在循环变动。

解:(1)采用线性趋势方程法:Tˆi460.06077.0065t 剔除其长期趋势。 趋势分析法剔除长期趋势表: 年月 序号 工业总产值(亿元) 长期趋势值 剔除长期趋势 Jan-83 1 477.9 467.0672 1.023193 Feb-83 2 397.2 474.0737 0.837844 Mar-83 3 507.3 481.0802 1.054502 Apr-83 4 512.2 488.0867 1.049404 May-83 5 527 495.0932 1.064446 Jun-83 6 545 502.0997 1.085442 Jul-83 7 494.7 509.1062 0.971703 Aug-83 8 502.5 516.1127 0.973625 Sep-83 9 536.5 523.1192 1.025579 Oct-83 10 533.5 530.1257 1.006365 Nov-83 11 553.6 537.1322 1.030659 Dec-83 12 543.9 544.1387 0.999561 Jan-84 13 518 551.1452 0.939861 Feb-84 14 460.9 558.1517 0.825761 Mar-84 15 568.7 565.1582 1.006267 Apr-84 16 570.5 572.1647 0.997091 May-84 17 590 579.1712 1.018697 Jun-84 18 604.8 586.1777 1.031769 Jul-84 19 564.9 593.1842 0.952318 Aug-84 20 575.9 600.1907 0.959528 Sep-84 21 613.9 607.1972 1.011039 Oct-84 22 614 614.2037 0.999668 Nov-84 23 646.7 621.2102 1.041032 Dec-84 24 655.3 628.2167 1.043111 Jan-85 25 645.7 635.2232 1.016493 Feb-85 26 562.4 642.2297 0.875699 Mar-85 27 695.7 649.2362 1.071567 Apr-85 28 712 656.2427 1.084964 May-85 29 723.1 663.2492 1.090239 Jun-85 30 743.2 670.2557 1.108831 Jul-85 31 678 677.2622 1.001089 Aug-85 32 676 684.2687 0.987916 Sep-85 33 703 691.2752 1.016961 Oct-85 34 685.3 698.2817 0.981409 Nov-85 35 703.3 705.2882 0.997181 Dec-85 36 722.4 712.2947 1.014187 Jan-86 37 681.9 719.3012 0.948003 49

Feb-86 Mar-86 Apr-86 May-86 Jun-86 Jul-86 Aug-86 Sep-86 Oct-86 Nov-86 Dec-86 38 39 40 41 42 43 44 45 46 47 48 567.6 737.7 739.6 759.6 794.8 719 734.8 776.2 782.5 816.5 847.4 726.3077 733.3142 740.3207 747.3272 754.3337 761.3402 768.3467 775.3532 782.3597 789.3662 796.3727 0.781487 1.005981 0.999027 1.016422 1.053645 0.944387 0.956339 1.001092 1.000179 1.034374 1.064075

剔除长期趋势后分析其季节变动情况表:

年份 月份 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 1983年 1.023193 0.837844 1.054502 1.049404 1.064446 1.085442 0.971703 0.973625 1.025579 1.006365 1.030659 0.999561 1984年 0.939861 0.825761 1.006267 0.997091 1.018697 1.031769 0.952318 0.959528 1.011039 0.999668 1.041032 1.043111 1985年 1.016493 0.875699 1.071567 1.084964 1.090239 1.108831 1.001089 0.987916 1.016961 0.981409 0.997181 1.014187 1986年 0.948003 0.781487 1.005981 0.999027 1.016422 1.053645 0.944387 0.956339 1.001092 1.000179 1.034374 1.064075 季节比率% 0.981888 0.830198 1.034579 1.032622 1.047451 1.069922 0.967374 0.969352 1.013668 0.996905 1.025812 1.030234

(3)运用分解法可得到循环因素如下图:

1.151.11.0510.950.90.850.8161116212631364146

50

第10章 统计指数——练习题

●1. 给出某市场上四种蔬菜的销售资料如下表:

销 售 量 ( 公 斤 ) 销 售 价 格 (元 / 公斤) 品 种 基 期 计 算 期 基 期 计 算 期 白 菜 550 560 1.60 1.80 黄 瓜 224 250 2.00 1.90 萝 卜 308 320 1.00 0.90 西红柿 168 170 2.40 3.00 合 计 1250 1300 ── ── ⑴ 用拉氏公式编制四种蔬菜的销售量总指数和价格总指数; ⑵ 再用帕氏公式编制四种蔬菜的销售量总指数和价格总指数; ⑶ 比较两种公式编制出来的销售量总指数和价格总指数的差异。

解:设销售量为q,价格为p,则价值量指标、数量指标、质量指标三者关系为: 销售额=销售量×价格 qp = q × p

于是,对已知表格标注符号,并利用Excel计算各综合指数的构成元素如下:

销售价格 销售量(公斤) (元/公斤) 品种 q0p0 q0p1 q1p0 q1p1 基期 计算期 基期 计算期 q0 q1 p0 p1 白菜 550 560 1.6 1.8 880 990 896 1008 黄瓜 224 250 2 1.9 448 425.6 500 475 萝卜 308 320 1 0.9 308 277.2 320 288 西红柿 168 170 2.4 3 403.2 504 408 510 合 计 1250 1300 ─ ─ 2039.2 2196.8 2124 2281 于是代入相应公式计算得: ⑴用拉氏公式编制总指数为: 四种蔬菜的销售量总指数 Lq1p0qqp2124002039.2104.16% ,

51

四种蔬菜的价格总指数 Lp ⑵ 用帕氏公式编制总指数:

qpqp00102196.8107.73%

2039.2四种蔬菜的销售量总指数为 Pqqpqp01112281103.83%

2196.82281107.39% 2124四种蔬菜的价格总指数为 Ppqpqp1110⑶ 比较两种公式编制出来的销售量总指数和价格总指数,可见:拉氏指数>帕氏指数 在经济意义上,拉氏指数将同度量因素固定在基期。销售量总指数说明消费者为保持与基期相同的消费价格,因调整增减的实际购买量而导致实际开支增减的百分比;价格总指数说明消费者为购买与基期相同数量的四种蔬菜,因价格的变化而导致实际开支增减的百分比。

帕氏指数将同度量因素固定在计算期。销售量总指数说明消费者在计算

期购买的四种蔬菜,因销售量的变化而导致实际开支增减的百分比;价格总指数说明消费者在计算期实际购买的四种蔬菜,因价格的变化而导致实际开支增减的百分比。

●2.依据上题的资料,试分别采用埃奇沃斯公式、理想公式和鲍莱公式编制销售量指数;然后,与拉氏指数和帕氏指数的结果进行比较,看看它们之间有什么关系。 解:采用埃奇沃斯公式编制销售量指数为:

Eqq(pq(p1000p1)p1)qpqpqpqp10000111

212422814405103.9896%2039.22196.84236采用理想公式编制销售量指数为:

Fqqpqpqpqp10000111LqPq

104.16%103.83%103.994869%采用鲍莱公式编制销售量指数为:

Bq1q1p0q1p11()(LqPq)2q0p0q0p12

104.16%103.83%104.00%2 与拉氏销售量指数和帕氏销售量指数的结果进行比较,它们之间的关系是: LqBqFqEqPq

52

即拉氏销售量指数最大,鲍莱销售量指数次大,理想销售量指数居中,埃奇沃斯销售量指数较小,帕氏销售量指数最小。

●3.某企业共生产三种不同的产品,有关的产量、成本和销售价格资料如下表所示:

计 算 期 产品 种类 A B C 计量 单位 件 台 吨 基期 单位 产量 270 32 190 产量 成本 340 35 150 50 800 330 价格 65 1000 400 销售 ⑴ 分别以单位产品成本和销售价格为同度量因素,编制该企业的帕氏产量指数;

⑵ 试比较说明:两种产量指数具有何种不同的经济分析意义?

解:设产量为q,单位成本为p,销售价格为r,则价值量指标、数量指标、质量指标三者关系为:

产值=产量×价格 , 总成本=产量×单位成本 qr = q × r , qp = q × p

⑴*以单位产品成本p为同度量因素,编制该企业的帕氏产量指数Pq:

选择已知表格中的单位产品成本和产量数据,标注符号,并利用Excel计算帕氏产量指数的构成元素如下:

产 量 产品 计量单位 A B C 合计 件 台 吨 — 基期 q0 270 32 190 — 计算期 q1 340 35 150 — 计算期单位成本 p1 50 800 330 — 13500 25600 62700 101800 17000 28000 49500 94500 q0p1 q1p1 于是,以单位产品成本为同度量因素,编制该企业的帕氏产量指数为

Pqqpqp01119450092.83%

101800*以销售价格r为同度量因素,编制该企业的帕氏产量指数Pq

再选择已知表格中的价格和产量数据,标注符号,并利用Excel计算帕氏产量指数的构成元素如下: 产品 计量单位

产 量 计算期销售价格 q0r1 q1r1 53

基期 q0 A B C 合计 件 台 吨 — 270 32 190 — 计算期 q1 340 35 150 — r1 65 1000 400 — 17550 32000 76000 125550 22100 35000 60000 117100 于是,以价格为同度量因素,编制该企业的帕氏产量指数为 Pqqrqr110111710093.27%

125550⑵ 比较说明两种产量指数不同的经济分析意义:

以单位产品成本为同度量因素编制的该企业的帕氏产量指数说明,按计算期计算的

三种产品,因产量的变化而导致总成本增减的百分比。

以销售价格为同度量因素编制的该企业的帕氏产量指数说明,按计算期计算的三种产品,因产量的变化而导致总产值增减的百分比。 ●4.给出某市场上四种蔬菜的销售资料如下表:

销 售 额 ( 元 ) 品 种 基 期 白 菜 黄 瓜 萝 卜 西红柿 合 计 880.0 448.0 308.0 403.2 2039.2 计 算 期 1008 475 288 510 2281 指数(%) 112.50 95.00 90.00 125.00 ─ 个体价格 ⑴ 用基期加权的算术平均指数公式编制四种蔬菜的价格总指数; ⑵ 用计算期加权的调和平均指数公式编制四种蔬菜的价格总指数; ⑶ 再用基期加权的几何平均指数公式编制四种蔬菜的价格总指数; ⑷ 比较三种公式编制出来的销售价格总指数的差异。

解:设销售量为q,价格为p,则个体价格指数为ip,销售额指标、销售量指标、价格指标三者关系为:

销售额=销售量×价格 qp = q × p

⑴ 求用基期加权的算术平均指数公式编制四种蔬菜的价格总指数:

54

用基期加权的算术平均价格指数为 Ap 作Excel表格计算公式元素:

品 种 白 菜 黄 瓜 萝 卜 西红柿 合 计 基期销售额(元) 个体价格指数(%) ipqpqp0000

ipq0p0 990 425.6 277.2 504 2196.8 q0p0 880 448 308 403.2 2039.2 ip 112.5 95 90 125 ─ 用基期加权的算术平均价格指数为:

Apipqpqp00002196.8107.73%;

2039.2⑵ 用计算期加权的调和平均指数公式编制四种蔬菜的价格总指数 用计算期加权的调和平均价格指数公式为 Hppqpqip1111

作Excel表格计算公式元素:

品 种 白 菜 黄 瓜 萝 卜 西红柿 合 计 计算期销个体价格售额(元) 指数(%) q1p1/ip 896 500 320 408 2124 q1p1 1008 475 288 510 2281 ip 112.5 95 90 125 ─ 即得用计算期加权的调和平均价格指数为: Hp1q12281107.39%

pp1q12124ip⑶ 用基期加权的几何平均指数公式编制四种蔬菜的价格总指数(课本无此内容)

p0q0Gpp0q0ip107.01%

●5.利用第4题的资料和计算结果,试建立适

当的指数体系,并就蔬菜销售额的变动进行因素分析。

55

VLqPp解:对总量的变动进行因素分析的方案为 ,

LPVqp物值指数=物量拉氏指数物价帕氏指数按拉氏指数计算按帕氏指数计算亦即,物 值的因物价变化引 =的因物量变化引总增量起的物值增量起的物值增量q1p1q1p0q1p1或者为:q0p0q0p0q1p0

(qpqp)(qpqp)(qpqp)100011101100根据第4题的资料和计算结果得:

qpqpqpqp10001110104.16%107.39%111.86%qpqp0110

(q1p0q0p0)(q1p1q1p0)84.8157241.8(q1p1q0p0)

上述关系说明:四种蔬菜的销售量增长4.16%,使销售额增加84.8元;价格上涨7.39%,使销售额增加157元。两因素共同作用的影响,使销售额增长11.86%,增加总额为241.8元。

●6.已知某地区1997年的农副产品收购总额为360亿元,1998年比上年的收购总额增长12%,农副产品收购价格总指数为105% 。试考虑,1998年与1997年对比:

⑴ 农民因交售农副产品共增加多少收入?

⑵ 农副产品收购量增加了百分之几?农民因此增加了多少收入? ⑶ 由于农副产品收购价格提高5%,农民又增加了多少收入? ⑷ 验证以上三方面的分析结论能否保持协调一致。

VLqPp解:这是因素分析题型,应该应用指数体系,

LPVqp题中,农副产品收购总额、收购量与收购价格的关系为: 收购总额=收购量×收购价格 qp = q × p 则已知

qp0110360,V=1+12%,Pp105%,

⑴求1998年与1997年对比农民因交售农副产品共增加的收入额,亦即收购总额的增量Vqpqp00:

56

由已知得 Vq1p1q0p036012%4 3. (亿元2) ⑵农副产品收购量增加百分比为Lq: 由指数体系得 LVP112%q106.67,% p105%农民因此增加的收入,亦即为农副产品收购量增加导致收购总额增加量L: q由于 L0qq1pq,得到

q1p0Lqq0p0

0p0于是, Lqq1p0q0p0Lqqp00qp0 q0p0(Lq1)3606.67%24.0 (亿元)

⑶由于农副产品收购价格提高5%,亦即Pp105%,农民增加的收入P, p 由于 Pq1p1qpp10Vqp00Lqqp0

LqPpq0p0Lqq0p0

Lq(Pp1)q0p0

360106.67%5%19.2 (亿元)

⑷验证以上三方面的分析结论: 由于 LqPp106.67%105%11 2 而 V112% , 对比得 VLqPp 又由于 LqPp24.019.24 3 而 V43.2, 对比得 LqPpV

可见,指数体系VLqPpV成立,

LqPp 说明,以上三方面的分析结论能保持协调一致。 7.给出某城市三个市场上有关同一种商品的销售资料如下表:

57

销 售 价 格 (元 / 公斤) 市 场 基 期 A市场 B市场 C市场 合 计 2.50 2.40 2.20 ─ 计 算 期 3.00 2.80 2.40 ─ 销 售 量 ( 公 斤 ) 基 期 740 670 550 1960 计 算 期 560 710 820 2090 ⑴ 分别编制该商品总平均价格的可变构成指数、固定构成指数和结构变动影响指数;

⑵ 建立指数体系,从相对数的角度进行总平均价格变动的因素分析;

⑶ 进一步地,综合分析销售总量变动和平均价格变动对该种商品销售总额的影

响。

解:⑴x046682.3816 , x156362.6967 , x假定49082.3483 196020902090 ⑵2.34832.69672.6967,98.60%114.84%113.23% 2.38162.34832.3816 ⑶563620902.6967

466819602.3816 120.74%106.63%113.23% , 968309.6658.6 8.下表是某工业管理局所属五个企业的各项经济效益指标资料:

参评指标 产品销售率 资金利税率 成本利润率 增加值率 单位 标准值 A企业 B企业 C企业 D企业 E企业 权数 % % % % 97.48 75.40 90.00 95.50 90.40 85.40 13.55 12.20 14.10 13.50 11.50 14.00 8.41 7.60 9.50 8.40 8.50 6.90 29.00 25.30 29.00 28.50 25.40 26.70 5800 6320 7250 6800 5400 15 30 15 10 10 20 劳动生产率 元/人 6205 资金周转率 次/年 1.83 1.60 1.85 2.10 1.90 1.80 试运用“标准比值法”计算各企业的工业经济效益综合指数,并按综合效益的好坏对其进行排序。

解:依据有关公式列表计算各企业的工业经济效益综合指数如下:

各企业经济效益综合指数一览表(标准比值法)

标准比值或个体指数(%) 参评指标 A企业 B企业 C企业 D企业 E企业

58

权 数

产品销售率 资金利税率 成本利润率 77.35 92.33 97.97 92.74 87.61 15 30 15 10 10 20 ─ ─ 90.04 104.06 99.63 84.87 103.32 90.37 112.96 99.88 101.07 82.05 87.59 92.07 增加值率 87.24 100.00 98.28 劳动生产率 资金周转率 综合指数 排 名

93.47 101.85 116.84 109.59 87.03 87.43 101.09 114.75 103.83 98.36 87.73 102.41 104.03 95.01 5 2 1 3 94.03 4 9.依据上题的有关资料,试运用“改进的功效系数法”计算各企业的工业经济效益综合指数,并按综合效益的好坏对其进行排序。比较上面两种方法给出的综合评价结果的差异,并就产生这种差异的原因进行深入分析,借以加深对有关综合评价方法的认识。 解:依据有关公式列表计算各企业的工业经济效益综合指数如下表:

各企业经济效益综合指数一览表(改进的功效系数法)

阈 值 参评指不允许标 产品销售95.50 74.50 60.00 89.52 100.00 率 资金利税14.10 11.50 70.77 100.00 90.77 率 成本利润 9.50 6.90 70.77 100.00 83.08 率 增加值29.00 25.30 60.00 100.00 94.59 率 劳动生产7250 率 资金周转 2.10 1.60 60.00 80.00 100.00 率 84.00 76.00 20 5400 68.65 79.89 100.00 90.27 60.00 10 61.08 75.14 10 84.62 60.00 15 60.00 98.46 30 满意值 值 90.29 80.76 15 权数 D企业 A企业 B企业 C企业 E企业 改 进 的 功 效 系 数 59

综合指── 数 排 ── 名 ── 65.50 91.97 93.95 74.97 78.05 ── 4 ── 5 2 1 3 ── 上面两种方法给出的综合评价结果的差异表现在D、E两个企业的综合经济效益排名不同。原因在于两种方法的对比标准不同(以下具体说明)。

第11章 统计决策

11.1(1)根据最大的最大收益值准则,应该选择方案一。 (2)根据最大的最小收益值准则,应该选择方案三。 (3)方案一的最大后悔值为250,方案二的最大后悔值为200,方案三的最大后悔值为300,所以根据最小的最大后悔值准则,应选择方案二。

(4)当乐观系数为0.7时,可得:方案一的期望值为220,方案二的期望值为104,方案三的期望值为85。根据折中原则,应该选择方案一。

(5)假设各种状况出现的概率相同,则三个方案的期望值分别为:116.67、93.33、83.33 按等可能性准则,应选择方案一。 11.2 (1)略

(2)三个方案的期望值分别为:150万元、140万元和96万元。但方案一的变异系数为1.09,方案二的变异系数为0.80,根据期望值准则结合变异系数准则,应选择方案二。

(3)宜采用满意准则。选择方案二。 (4) 宜采用满意准则。选择方案三。 11.3 钥匙留在车内为 A,汽车被盗为E。

P(A/E)=(0.2*0.05)/ (0.02*0.05+0.8*0.01)= 55.56%。 11.4 (1)买到传动装置有问题的车的概率是30%。

(2)修理工判断车子有问题为B1,,车子真正有问题为A1, P(A1/B1)=(0.3*0.9)/(0.3*0.9+0.7*0.2)= 66%

(3)修理工判断车子没有问题为B2,车子真正有问题为A1 P(A1/B2)=(0.3*0.1)/(0.3*0.1 +0.7*0.8)= 5% 11.5 决策树图 略。

(1) 生产该品种的期望收益值为41.5万元大于不生产的期望值,根据现有信息可生产。 (2) 自行调查得出受欢迎结论的概率=0.65*0.7+0.35*0.30=0.56,

此时,市场真实欢迎的概率=0.65*0.7/(0.65*0.7+0.35*0.30)=0.8125

期望收益值=(77*0.8125 -33*0.1875)0.56+(-3*0.44) =30.25万元 (3) 委托调查得出受欢迎结论的概率=0.65*0.8 +0.35*0.20=0.59

此时,市场真实受欢迎的概率= 0.65*0.8/(0.65*0.8 +0.35*0.20)=0.8814 期望收益值=(75*0.8814 -35*0.1186)0.59+(-5*0.41)=34.50万元

根据以上分析结果。由于进一步调查的可靠性不高,并要花费相应的费用,所以没有必要进一步调查。

60

第12章 国民经济统计基础知识

12.1 生产法GDP=168760亿元; 分配法GDP=168755亿元 使用法GDP=154070亿元

国内生产净值=149755亿元(按生产法计算) 国民总收入=165575亿元(按收入法计算) 国民可支配总收入=167495亿元 国民可支配净收入=148490亿元

消费率=67.95%(按可支配总收入计算) 储蓄率=32.05%(按可支配总收入计算) 投资率=27.31%(按使用法GDP计算) 12.2 国民财富总额为:216765亿元

12.3生产法GDP增长速度为8.69%;紧缩价格指数为102.83%。使用法GDP增长速度为8.25%。紧缩价格指数为103.25%。

61

因篇幅问题不能全部显示,请点此查看更多更全内容