您的当前位置:首页正文

多元线性回归模型案例分析

2021-10-29 来源:步旅网
多元线性回归模型案例分析

——中国人口自然增长分析 一·研究目的要求

中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的降到1980年,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。

影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。

二·模型设定

为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1):

表1中国人口增长率及相关数据

人口自然增长率国民总收入

(%。) (亿元)

的1988 15037

1989 17001 线

1990 18718

性1991 21826

1992 26937 回

1993 35260

归1994 48108

1995 59811 模

1996 70142

型1997 78061

83024 为: 1998

1999 88479

三、2000 98000

2001 108068 估

2002 119096

2003 135174 2004 159587 参

2005 184089

2006 213132

利用EViews估计模型的参数,方法是: 定

年份

居民消费价格指数增长

率(CPI)%

18

人均GDP(元) 1366 1519 1644 1893 2311 2998 4044 5046 5846 6420 6796 7159 7858 8622 9398 10542 12336 14040 16024

1、建立工作文件:启动EViews,点击File\\New\\Workfile,在对话框“WorkfileRange”。

在“Workfilefrequency”中选择“Annual”(年度),并在“Startdate”中输入开始时间“1988”,在“enddate”中输入最后时间“2005”,点击“ok”,出现“WorkfileUNTITLED”工作框。其中已有变量:“c”—截距项“resid”—剩余项。在“Objects”菜单中点击“NewObjects”,在“NewObjects”对话框中选“Group”,并在“NameforObjects”上定义文件名,点击“OK”出现数据编辑窗口。

2、输入数据:点击“Quik”下拉菜单中的“EmptyGroup”,出现“Group”窗口数据编辑框,点第一列与“obs”对应的格,在命令栏输入“Y”,点下行键“↓”,即将该序列命名为Y,并依此输入Y的数据。用同样方法在对应的列命名X2、X3、X4,并输入相应的数据。或者在EViews命令框直接键入“dataYX2X3

X4…”,回车出现“Group”窗口数据编辑

框,在对应的Y、X2、X3、X4下输入响应的数据。

3、估计参数:点击“Procs“下拉菜单中的“MakeEquation”,在出现的对话框的“EquationSpecification”栏中键入“YCX2X3X4”,在“EstimationSettings”栏中选择“LeastSqares”(最小二乘法),点“ok”,即出现回归结果: 表

根据表中数据,模型估计的结果为:

t=

R20.930526R0.915638F=

2四、模型检验

1、经济意义检验

模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长1%,人口增长率增长%;在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低%。这与理论分析和经验判断相一致。

2、统计检验

0.915638R0.930526,(1)拟合优度:由表中数据可以得到:修正的可决系数为R,

22这说明模型对样本的拟合很好。

(2)F检验:针对H0:2340,给定显着性水平0.05,在F分布表中查出自由度为k-1=3和n-k=14的临界值F(3,14)3.34。由表中得到F=,由于F=>F(3,21)3.075,

应拒绝原假设H0:2340,说明回归方程显着,即“国民总收入”、“居民消费价格指数增长率”、“人均GDP”等变量联合起来确实对“人口自然增长率”有显着影响。 (3)t检验:分别针对H0:

j0(j1,2,3,4),给定显着性水平0.05,查t分布表得

自由度为n-k=14临界值t/2(nk)2.145。

由表中数据可得,与1、2、3、4对应的t统计量分别为、、、

0(j1,2,4)t(nk)2.145Hj/203除,其绝对值均大于,这说明分别都应当拒绝:,也

^^^^^就是说,当在其它解释变量不变的情况下,解释变量“国民总收入”、“人均GDP”分别对被解释变量“人口自然增长率”Y都有显着的影响。

3的绝对值小于t/2(nk)2.145,:这说明接受H0:30,X3系数对t检验不显

^着,这表明很可能存在多重共线性。

所以计算各解释变量的相关系数,选择X2、X3、X4数据,点”view/correlations”得相关系数矩

阵(如表):

由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 五、消除多重共线性

采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y对X2、X3、X4的一元回归,结果如表所示:

表 变量 参数估计值 t统计量 X2 X3 X4 2按R的大小排序为:X4、X2、X3

以X2为基础,顺次加入其他变量逐步回归。首先加入X2回归结果为:

t=R0.920622

2(nk)t(183)2.131t/20.0250.05当取时,,X2参数的t检验显着,加入X3回归得

t=

R20.930526R0.915638F=

2t(184)2.145,X3参数的t检验不显着,予以剔除

当取0.05时,/2ˆ即Y16.355400.000350X20.0005397X4,这是最后消除多重共线性的结果。

在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长%;在假定其它变量不变的情况下,在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低%。

因篇幅问题不能全部显示,请点此查看更多更全内容