【学习目标】
1.明确两个变量具有相关关系的意义;2.知道回归分析的意义;
3.知道回归直线、回归直线方程、线性回归分析的意义;4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线方程;
【要点梳理】
【高清课堂:变量的相关关系 400458 知识讲解1】要点一、变量之间的相关关系
变量与变量之间存在着两种关系:一种是函数关系,另一种是相关关系。1.函数关系
函数关系是一种确定性关系,如y=kx+b,变量x取的每一个值,y都有唯一确定的值和它相对应。2.相关关系
变量间确定存在关系,但又不具备函数关系所要求的确定性相关关系分为两种:正相关和负相关要点诠释:
对相关关系的理解应当注意以下几点:(1)相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.
(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.
(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.
3.散点图
将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图。通过散点图可初步判断两个变量之间是否具有相关关系,她反映了各数据的密切程度。
要点二、正相关、负相关
(1)正相关:在统计数据中的两个变量,一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关。如:家庭年收入越高,年饮食支出越高。反映在散点图上它们散布在从左下角到右上角的区域,按表中所列数据制作散点图如图
AB
0541.67
5602.66
10670.09
15704.99
20806.71
25908.59
30975.42
351034.75
1
(2)负相关:如果两个变量中,一个变量的值由小到大变化时,另一个变量的值由大到小变化,那么这种相关称为负相关。在散点图中,对应数据的位置为从左上角到右下角的区域。按表中所列数据制作的散点图如图。
CD
564
856
1650
1842
2837
3032
3521
(3)无相关关系:如果关于两个变量统计数据的散点图如下图所示,那么这两个变量之间不具有相关关系。例如,学生的身高与学生的学习成绩没有相关关系。
要点诠释:
利用散点图可以大致判断两个变量之间有无相关关系。【高清课堂:变量的相关关系 400458 知识讲解2】要点三、线性回归方程1.回归直线方程
(1)回归直线:观察散点图的特征,发现各个大致分布在通过散点图中心的一条直线附近。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。求出的回归直线方程简称回归方程。
2.回归直线方程的求法
ybxa,,其中a、b是待定系数.设与n个观测点(xi,yi)i1,2,,n最接近的直线方程为yibxia,(i1,2,,n) .于是得到各个偏差则2
yiyiyi(bxia),(i1,2,,n).
yi的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与显见,偏差yi相应直线在整体上的接近程度,故采用n个偏差的平方和.
Q(y1bx1a)2(y2bx2a)2(ynbxna)2表示n个点与相应直线在整体上的接近程度.记Qn(yibxia)2.i1上述式子展开后,是一个关于a、b的二次多项式,应用配方法,可求出使Q为最小值时的a、b的值.即
n(xix)(yiy)i1bn(xix)2i1aybxnxyii1ninxynx2xi12i1n1n, xxi,yyini1ni1相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析
上述求回归直线的方法是使得样本数据的点到回归直线的距离的平方和最小的方法,叫做最小二乘法。要点诠释:
1.对回归直线方程只要求会运用它进行具体计算a、b,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.
2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.
3.求回归直线方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.
4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.
【典型例题】
类型一:变量间的相关关系与函数关系
例1.下列两个变量之间的关系中,不是函数关系的是( )A.角度和它的余弦值 B.正方形的边长和面积C.正n边形的边数和其内角度数之和 D.人的年龄和身高【答案】D
【解析】 函数关系是一种确定的关系。而相关关系是非确定性关系。选项A、B、C都是函数关系,可以写出它们的函数表达式:f(x)cos,g(a)a,h(n)n2,选项D不是函数关系,在相同年龄的人群中,仍可以有不同身高的人,故选D.
【总结升华】 本题考查非数据型两个变量的相关性判断.要根据两个变量之间是否具有确定性关系及因素关系进行判断.
举一反三:
【变式1】下列图形中具有相关关系的两个变量是( )
3
2【答案】 C【解析】A、B中显然任给一个x都有唯一确定的y值和它对应,是函数关系;C中从散点图可看出所有点看上去都在某条直线附近波动,具有相关关系,因此变量间是不相关的。
【变式2】下列关系是相关关系的是________(填序号).
①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与其学号之间的关系. 【答案】①③④
例2.某小卖部为了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶杯数与当天气温的对比表。
气温x/℃杯数y
2620
1824
1334
1039
450
-164
请画出散点图,并判断它们是否有相关关系。【解析】 散点图如下图:
从图中发现气温与杯数之间具有相关关系,当气温的值由小到大变化时杯数值由大变小,所以气温和杯数成负相关。
【总结升华】画出散点图可帮助分析变量间是否具有相关关系,但不是唯一的判断途径。
举一反三:
【变式1】下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗?
年平均气温(℃)年降雨量(mm)
12.51748
12.74542
12.74507
13.69813
13.33574
12.84701
13.05432
【解析】 以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如下图所示。
因为图中各点并不在一条直线的附近,所以两者不具有相关关系,求回归直线方程是没有意义的。【总结升华】用回归直线进行拟合两变量关系的一般步骤为:
4
①作出散点图,判断各点是否散布在一条直线附近。
②如果各点散布在一条直线附近,那么可用公式求出线性回归方程;如果各点不在一条直线附近,那么求出的回归直线方程没有意义。
类型二:回归直线方程的求解例3.(2014秋 甘肃凉州区月考)某工厂对某产品的产量与成本的资料分析后有如下数据:
产量x(千件)2356成本y(元)
7
8
9
12
(1)画出散点图;
(2)求成本y与产量x之间的线性回归方程;
(3)当成本为15万元时,试估计产量为多少件?(保留两位小数)
nixiynxy(bi1n,aybx)x2inx2i1【思路点拨】(1)在坐标系中描出相应的点,即可得到所要的三点图
(2)求线性回归直线方程要先求出均值,再由公式求a、b的值,写出回归直线方程;(3)令y=15,求出x即可.【解析】(1)散点图如图
(2)x4,y9,b=1.10
aybx91.1044.60∴回归方程为y=1.10x+4.60;
(3)y=15时,y=1.10x+4.60=15,∴x≈9.45
举一反三:
【变式1】 某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)
49
26
39
54
根据上表可得回归方程yˆbxˆaˆ中的bˆ为9.4,据此模型预报广告费用为6万元时销售额为A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元【答案】选【解析】B
x423543.5,y49263954442aybx429.43.59.1,回归方程为y9.4x9.1,
5
当x6时,y9.469.1=65.5,故选B.
【变式2】 观察两相关变量得如下数据:
x-1-2-3-4-553421y
-9
-7
-5
-3
-1
1
5
3
7
9
求两变量间的回归方程.
【答案】yx【解析】列表:
i12345678910xi-1-2-3-4-553421yi-9-7-5-3-115379xiyi
9
14
15
12
5
5
15
12
14
9
计算得:x0,y0。
10x2i110,i110xiyi110。
i110xiyi10xy∴bi1110100102x2i10x1101001。
i1aybx0b00。∴所求回归直线方程为yx。类型三:利用回归直线对总体进行估计
【高清课堂:变量的相关关系 400458 例2】例4.给出了随机抽取的10位男性的收缩血压.
年龄x(岁)
收缩压y(毫米汞柱)
年龄x(岁)
收缩压y(毫米汞柱)
371105014635117491484112554150431306015442
138
65
160
(1)画出散点图;
(2)求出收缩压与年龄之间的回归直线;
(3)利用所求回归直线分别预测20岁、45岁的人的收缩压是多少?(4)就(3)所得预测结果,比较其预测的精确性。【解析】(1)散点图为:
6
年龄与收缩压??150?100?50?0010203040506070200年龄(2)收缩压与年龄之间的回归直线 列表:xy序号
x2136912251681184917642500240129163600422523530
xy4070409551255590579673007252810092401040066968
12345678910求和
37354143425049546065476
1101171251301381461481501541601378
ˆbxynxyiii1n2xinxi12n669681047.6137.81.5763235301047.647.6ˆ62.766ˆybxa所以y对x的回归直线方程为:
y62.7661.5763x(3)根据所求的回归直线方程可以预测20岁的收缩压为
ˆ62.7661.57632094.293yˆ62.7661.576345133.7毫米汞柱45岁的收缩压为:y(4)预测20岁的结果时,20是外推的,所以不是很精确;而45是内插值,所以精确性比20的预测结果
要好。
【总结升华】只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测
7
结果也是不可信的.
举一反三:
【变式1】(2015春 成都龙泉驿区期中)已知x,y的一组数据如下表
xy
23
34
46
58)
69
则由表中的数据算得的线性回归方程可能是( A.y=2x+2 【答案】D
【解析】由题意,xB.y=2x-1
C.y382x12 D.yx25511(23456)4,y(34689)6,55代入线性回归方程,可得D满足.
故选:D
【变式2】下表是某地搜集到的新房屋的销售价格y,(单位:万元)和房屋的面积x(单位:m。)的数据:
xy
11544.8
11041.6
8038.4
13549.2
10542
(1)画出散点图; (2)求回归方程;
(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.
【解析】据已知样本数据得到回归直线方程后,即得到两个变量之间相关关系的一个规律,因此可将给定的x值代入回归直线方程预测y值. (1)散点图如下图所示.
(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据,用计算器计算得x109,y43.2,
555xi12i60975,xiyi23852.
i1则bxy5xyiii15xi25xi1223852510943.23080.196,26097551091570ybx43.20.19610921.836.故所求回归方程为ay0.196x21.836.
(3)根据上面求得的回归方程,当房屋面积为1500时,销售价格的估计值为0.196×150+21.836=51.236
(万元).
8
因篇幅问题不能全部显示,请点此查看更多更全内容