高中数学必修2总结
1个回答

:线性回归

一、回归直线方程的推导

思考1:人体脂肪含量和年龄关系散点图中点的分布从整体上看有何特点?

思考2:如何描述这些特点?

(1)回归直线:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.

(2)回归方程:回归直线对应的方程叫做回归方程.

思考3:回归直线方程的推导:我们该怎样来求出这个回归方程?

设所求的直线方程为 =bx+a,其中a、b是待定系数.

则 i=bxi+a(i=1,2,…,n).于是得到各个偏差

yi- i =yi-(bxi+a)(i=1,2,…,n)

显见,偏差yi- i 的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和

Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2

表示n个点与相应直线在整体上的接近程度.

记Q=

这样,问题就归结为:当a、b取什么值时Q最小,a、b的值由下面的公式给出:

其中 = ,= ,a为回归方程的斜率,b为截距.

注:1、各点到该直线的距离的平方和最小,这一方法叫最小二乘法.

2、我们把由一个变量的变化去推测另一个变量的方法称为回归方法.

二、求线性回归方程

例2:观察两相关变量得如下表:

xx05-1x05-2x05-3x05-4x05-5x055x053x054x052x051

yx05-9x05-7x05-5x05-3x05-1x051x055x053x057x059

求两变量间的回归方程

i

1x052x053x054x055x056x057x058x059x0510

-1x05-2x05-3x05-4x05-5x055x053x054x052x051

x05-9x05-7x05-5x05-3x05-1x051x055x053x057x059

9x0514x0515x0512x055x055x0515x0512x0514x059

计算,得

∴所求回归直线方程为 y=x

小结:求线性回归直线方程的步骤:

第一步:画出散点图,判断是否具有相关关系

第二步:列表 ;

第三步:计算

第四步:代入公式计算b,a的值;

第五步:写出直线方程.

三、利用线性回归方程对总体进行估计

例:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:

温度x05-5x050x054x057x0512x0515x0519x0523x0527x0531x0536

杯数x05156x05150x05132x05128x05130x05116x05104x0589x0593x0576x0554

(1)画出散点图;

(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;

(3)求回归方程;

(4)如果某天的气温是 C,预测这天卖出的热饮杯数.

(1)散点图

(2)气温与热饮杯数成负相关,即气温越高,卖出去的热饮杯数越少.

(3)从散点图可以看出,这些点大致分布在一条直线附近.

通过列表 、计算 、代入公式计算b,a的值、写出直线方程.Y=-2.352x+147.767

(4)当x=2时,y=143.063,因此,这天大约可以卖出143杯热饮.

【课堂小结】

1、求样本数据的线性回归方程,可按下列步骤进行:

(1)计算平均数 ,;

(2)求a,b;

(3)写出回归直线方程.

2、回归方程被样本数据惟一确定,对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性..

3、对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作 散点图,在具有线性相关关系的前提下再求回归方程.