当前位置: 首页 > >

统计学第六章 相关与回归分析_图文

第六章

相关与回归分析

§1 相关与回归分析的基本概念

?

一、现象之间的数量关系,存在着两种不 同类型:P109
函数关系 (确定性关系)

函数关系: 相关关系:

相关关系(不确定性关系)

每一 x ? D?x ?

???? 唯一 y ? Y
法则—f

确定 x ?联系? y ? ? ?

一定范围 ?
? 一定分布

? 二、相关关系的种类: P109
分类标志 类 别

相关程度 完全相关
相关方向 正相关 相关形式 线性相关

不完全相关 不相关 负相关

非线性相关
复相关 偏相关

变量多少 单相关

?

三、相关分析的主要内容: P111

确定相关关系的存在. 2. 相关关系呈现的形态和方向. 3. 相关关系的密切程度. (主要方法是绘制相关图表,计算相 关系数)
1.

?

四、回归分析的主要内容: P112

一.确定相关的数学表达式。 二.对因变量进行预测。

三.确定因变量估计值误差程度。

?相关图和相关表

相关表的编制:对两个变量作相关分析,必须 取得一系列成对资料. 相关表: 简单相关表(资料未经分组P111表6-1) 分组相关表 (单变量分组相关表;双 变量分组相关表) 相关图:(散点图,散布图) 利用直角坐标系,x 轴表自变量,y轴表因变量.(见P111图 6-1)

?五、回归分析和相关分析的比较 P113
回归分析 相关分析
研究两变量之间的因果关系, 两变量是对等的. 必须通过定性分析确立自变 量 x ,因变量 y . 自变量 x 是可控制变量,因 两个变量都可以是随机变量. 变量 y 是随机变量.

回归分析的两变量之间一定 相关分析的两变量间不一定 存在相关关系. 存在回归关系. 回归分析要建立回归方程, 具有预测功能. 相关分析只计算相关系数, 仅能判断两变量相关的密切 程度和相关方向.没有预测 功能.

§2 简单线性相关分析

?相关系数的意义:P114 总体相关系数是反映两变 量之间线性相关密切程度的特 征值,是一个常数.
总体相关系数:

Cov( X , Y ) ?? Var( X ) ?Var(Y )

?一、样本相关系数计算: P114 r ?
_

? ? x? y
2 xy

?

2 xy

? ( x ? x )( y ? y) ? xy ? x ? y ?
n ( x ? x )2 ? n ( y ? y)2 ? n
_ _

_

? ?
2 x

? x ?x
2

2

? ?
2 y

? y ? y
2

2

P114

r?

? ( x ? x )( y ? y) ? ( x ? x ) ? ? ( y ? y)
2

2

r?

?n? x
Lxy ? Lxx Lyy

2

? ( ? x ) 2 ? n? y 2 ? ( ? y) 2

n? xy ? ? x ? y

??
2

?

? ( x ? x )( y ? y) ? ? ( x ? x) ? ? ( y ? y)
2

协方差意义的图释:
x y y x1 y1 x2 y2 ┅ xn ┅ yn
?

?

2 xy
?

? ( x ? x )( y ? y) ?
n
x2 ? x
y2 ? y
?

_

_

x

?

x1 ? x
y1 ? y
?

?

y

? ?

xn ? x

?

yn ? y

?

异号 ? ? ( x, y ) 同号

同号 异号

( x ? x )与( y ? y) 的符号如图示
x

当 ? ?0
2 xy

散点主要分布在新坐标系的 第一、三象限,表现为斜向上的趋 势,因而x 、y正相关.

当 ? ?0
2 xy

散点主要分布在新坐标系的 第二、四象限,表现为斜向下的趋 势,因而x 、y负相关.

当 ? ?0
2 xy

散点分布有如下三种可能情况: 1.散点分布在新坐标系的纵轴或横轴上.x、y 不相关. 2.散点均匀地分布在新坐位标系的四个象限, 表现为混乱的无序状态,因而x 、y不相关. 3.散点分布关于新坐标系的纵轴对称,表现为 一条曲线趋势.因而x 、y非线性相关.

结论
1. 2. 3.

? ?0
2 xy

x , y 正相关 x , y 负相关 x , y 不相关 )

? ?0
2 xy 2 xy

? ?0

(不排除存在非线性相关

?二、相关系数 r 的性质:P114↓12
1.r是无名数,且︱r︱≤1 2.当0<︱r︱<1时表示x与y存在着一定的线 性相关。

3.︱r︱=1

x,y完全线性相关。

4.r >0 x,y正相关;r<0 x,y负相关;r=0 x,y不相关(不排除存在非线性相关)。

?相关密切程度判断
︱r︱<0.3 微弱相关 0.3 ≤ ︱r︱< 0.5 低度相关 0.5 ≤ ︱r︱< 0.8 显著相关 0.8 ≤ ︱r︱< 1 高度相关

【例6-2】P114
家庭编号

某地区10户家庭有关人均消费 支出与人均可支配收入资料如下:计算相关系数
可支配收入(百元) x 人均消费(百元) y

1 2 3 4 5 6 7 8 9 10

18 25 45 60 62 75 88 92 99 98

15 20 30 40 42 53 60 65 70 78

解:

n y ? 47.3

? x ? 66.2 x?
2 y

?

2 x

? ( x ? x) ?
n
2 xy

2

? 783.16

? ? 413.41 ? ? xy ? x ? y ? 562.04

? xy ? 3693.3 xy ?
n
2 ? xy

562.04 r? ? ? 0.98776 2 2 783.16 ? 413.41 ? x ?? y

人均消费支出与人均可支配收入高度 正相关

【例】 :10家百货商店,每人月平均销售额x(千
元)和利润率y(%)资料如下表:计算 r
x 6 5 8 1
3

4
8.1

7

6

3
6.2

3
6.6

7
16.8

y 12.6 10.4 18.5
解:

16.3 12.3

?x ?5 x?
n

?x ?

( x ? x )2 ? n

? 2.098

y ? 11 .08 ? y ? 4.872
2

? xy ? 65.49 xy ?
? 2 xy

n ? xy ? x ? y ? 10.09

? xy r? ? 0.987 ? x? y

月平均销售额与利润率高度正相关

三、单相关系数的检验 P116
1.建 立 原 假 设 : 2.检 验 水 平 3.令t ? r H0 : ? ? 0 H1 : ? ? 0

?
~ t ( n ? 2)

1 ? r2 n?2 4.由P ( t ? ? ) ? ?

查表确定 值 ?

5.若 t ? ? , 接 受 原 假 设表 明 相 关 不 显 著 之 否 定 原 假 设 , .反 .

?单相关系数的检验
P116 【例6-3】
解 : H0 : ? ? 0 H1 : ? ? 0
拒绝 H0
0.025
2

? ? 0.05
1 ? 0.98776 10 ? 2 由P ( t ? ? ) ? 5% t? 0.98776 ? 17.9

拒绝 H0
0.025

-2.306

0

2.306

z

? ? ? 2.306

t ? 17.9 ? ? ? 2.306 拒 绝H 0 , 相 关 显 著 .

§3

一元线性回归分析

案例1:凯恩斯消费函数

C ? ? ? ?D ? u C: 消费支出 D: u: 个人可支配收入 扰动项 ( 误差项 )

案例2:线性需求函数(需求Q与价格P之间的关系)

Q ? ? ? ?P ? u

一.一元线性回归模型的建立
(一)总体回归函数 : Yt ? ?1 ? ? 2 X t ? ut Yt ~ N ( ?1 ? ? 2 X t , ? 2 ) ut : 随机误差项 .

?1 , ? 2未知参数 , 也称为回归系数 .

E(Yt ) ? ?1 ? ?2 X t

ut ? Yt ? E(Yt )

Population Regression Function ?上式表明:在X值给定的条件下,Y的期望值 (平均值)是X的严格线性函数.这条直线称为 总体回归直线,总体回归直线是未知的,需要 用样本信息对其作出模拟.

二.一元线性回归模型的参数估计

( 二 ) 样 本 回 归 函 数 yt ? ?1 ? ? 2 xt : ( ?表 示 相 应 量 的 估 计 也 称 为 理 论 值 ,y )
?

?

?

?

Sample Regression Function

yt ? ? 1 ? ? 2 xt ? et et ? yt ? yt yt为实测值
?

?

?

称为残差 t ? 1, 2, 3, ?, n

高斯(Gauss)假设
误差项的标准假定 : (I ) ( II ) ( III ) ( IV ) (V ) E ( ut ) ? 0 D( ut ) ? Var( ut ) ? E ( u ) ? ? (常 数)
2 t 2

Cov( ut , us ) ? 0 即Cov( ut , X t ) ? 0 ut ~ N ( 0, ? )
2

( t ? s)

自 变 量 t 是 可 控 制 变 量 ut 不 相 关 X ,与 .

一元线性回归模型的参数估计(OLS) (Ordinary Least Squares)
残 差 平 方 和 Q ( ? 1 , ? 2 ) ? ? e ? ? ( yt ? ? 1 ? ? 2 xt ) :
2 t ? ? ? ? 2

? ?Q ? ? ?0 ? ? ?1 令? ?Q ? ? ?0 ?? ? ? 2

? ? Cov( x , y ) 2 ?? 2 ? ?x ?? ? ? ? ? ? y?? x ? 1 2

2 ?Cov( x , y) ? x ? y ? x ? y ? ? xy ? 其 中? 2 2 2 ?? x ? x ? x ?

?样本一元线性回归方程
?

y ? ? 1 ? ?2 x
? 2 xy 2 x

?

?

? ?2 ? ?
?

?y ? r ?x
?
? 2

?求线性回归方程一般首先求 ?

? 1 ? y ? ?2 x

【例6-4】P118
家庭编号

某地区10户家庭有关人均消费 支出与人均可支配收入资料如下:试建立回归方程
可支配收入(百元) x 人均消费(百元) y

1 2 3 4 5 6 7 8 9 10

18 25 45 60 62 75 88 92 99 98

15 20 30 40 42 53 60 65 70 78

解:

n y ? 47.3 n

x?

?x

? 66.2

2 ?x ?

( x ? x )2 ? n

? 783.16

? xy ? 3693.3 xy ?
? 2 xy 2 x

2 ? xy ? xy ? x ? y ? 562.04

? 562.04 ?2 ? ? ? 0.7177 ? 783.16 ? 1 ? y ? ? 2 x ? 47.3 ? 0.7177? 66.2 ? ?0.2117
回归方程为 :
? ? ?

y ? ?0.2117? 0.7177x

?讨论
? 1.回归系数 ? 2

的意义 :自变量每增加一个 单位,因变量平均变化的值.本例中人均可支 配收入每增加一百元, 家庭消费支出平均增 加0.7177百元. ? 2. ? 是回归直线的起点值,是回归直线在y 轴上的截距. ? 3.回归系数 ? 与相关系数 r 的关系:
? 1 ? 2

?

2 2 ? xy ? xy ? y ?y ?2 ? 2 ? ? ?r ? x ? x? y ? x ?x ?

【例】15户家庭收入与食品支出资 料如下表 (单位:元):试建立线性回归 方程
编号 1 X 1020 Y 270 编号 6 X 1580 Y 360 编号 11 X 1290 Y 340

2
3

960
970

260
250

7
8

540
830

190
260

12
13

1380
810

380
270

4
5

1020
910

280
270

9
10

1230
1060

310
310

14
15

920
640

280
200

解: y ? 282
? 2 xy 2 x

x ? 1010 67 .
?

? ? 6957956 .
2 x

x ? y ? 29754667 .
?

? ? 1253773 .
2 xy

? ?2 ? ? 0.1802 ?
样本回归方程 :
?

?1 ? y ? ? 2 x ? 99.88
y ? 99.88 ? 0.1802x

三.一元线性回归拟合优度的评价
y
y
A ( x, y)
B
C

yt ? ? 1 ? ? 2 xt

?

?

?

x P120 图 6-5 总离差的分解
AC ? AB ? BC yt ? y ? ( yt ? y t ) ? ( y t ? y) 总 离 差? 估 计 误 差残 差) ? 回 归 误 差 (
? ?

( yt ? y) ? ? [( yt ? y) ? ( yt ? yt )]2 ?
2

?

?

? ? ( yt ? y) ? ? ( yt ? yt ) ? 2? ( yt ? y)( yt ? yt )
2 2

?

?

?

?

?

?(y
? ?

t

? y )( y ? y ) ? ? ( yt ? y )(? 1 ? ? 2 xt ? y )
? ? ? ?

?

?

?

?

?

? ( ? 1 ? y )? ( yt ? y ) ? ? 2 ? ( yt ? y ) xt ? ( ? 1 ? y ) ? e t ? ? 2 ? e t xt

又 残 差 平 方 和Q ( ? 1 , ? 2 ) ? ? e ? ? ( yt ? ? 1 ? ? 2 xt ) 2 :
2 t

?

?

?

?



?Q ? ?1
?

?0

?Q ? ?2
?

?0

? ? et ? 0
?

?e x
t

t

?0

? ? ( yt ? y)2 ? ? ( yt ? y)2 ? ? ( yt ? yt )2

?

( yt ? y) ? ? ( yt ? y) ? ? ( yt ? yt )2 ?
2 2

?

?

总离差平方和 回归平方和 残差平方和 ? ? SST ? SSR ? SSE Lyy ? U ? Q
SSR SSE ? ?1 SST SST 决 定 系 数: SSR SSE r ? ? 1? SST SST
2

决定系数 :

SSR SSE r ? ? 1? SST SST
2

?r2 的统计意义:可决系数是对回归 模型拟合程度的综合度量. r2越大,模 型拟合程度越高,方程的代表性越好, 用方程来预测的结果越可靠.(P121) 性质 : 0
2 ≤1. ≤r

(P122)

说明:有些教材残差平方和表示为 SSR,回归平方和 表示为 SSE

拟合优度的价

r ? 0.5
2 2 2

拟合优度低 拟合优度较高 拟合优度高

0.5 ? r ? 0.8 0.8 ? r ? 1

【例6-5】P121
家庭编号

某地区10户家庭有关人均消费支出 与人均可支配收入资料如下:试计算可决系数r2.
可支配收入(百元) x 人均消费(百元) y

1 2 3 4 5 6 7 8 9 10

18 25 45 60 62 75 88 92 99 98

15 20 30 40 42 53 60 65 70 78

解:

n y ? 47.3

? x ? 66.2 x?
2 y

?

2 x

? ( x ? x) ?
n
2 xy

2

? 783.16

? ? 413.41 ? ? xy ? x ? y ? 562.04

? xy ? 3693.3 xy ?
n
2 ? xy

562.04 r? ? ? 0.98776 2 2 783.16 ? 413.41 ? x ?? y
2 可决系数 : r 2 ? 0.98776 ? 0.97567 方程拟合优度高

四.回归估计标准误差
回归估计标准误差其实质 是残差的标准差.P122

Se ?

?( y ? y )
t t

?

2

n?2

Q ? n?2

Lyy ? ? ( yt ? y) ? n( y ? y ) ? n?
2 2 2

2 y

2 Lxy ? ? ( xt ? x )( yt ? y) ? n( x ? y ? x ? y ) ? n? xy

Lxx ? ? ( xt ? x ) ? n( x ? x ) ? n?
2 2 2

2 x

残差计算公式: P122
Q ? ? ( yt ? yt ) 2 Lyy ? Q ? U
?

U ? ? ( yt ? y ) 2 U ? ? 2 ? Lxy
? ? ?

?

Q ? Lyy ? U ? ? y ? ? 1 ? y ? ? 2 ? xy
2

Q ? (1 ? r 2 ) Lyy

【例6-6】P122
家庭编号

某地区10户家庭有关人均消费支出 与人均可支配收入资料如下:试计算回归标准误差Se.
可支配收入(百元) x 人均消费(百元) y

1 2 3 4 5 6 7 8 9 10

18 25 45 60 62 75 88 92 99 98

15 20 30 40 42 53 60 65 70 78

解:

n y ? 47.3 n

x?

?x

? 66.2
2 y

? ?
2 x

( x ? x )2 ? n

? 783.16

? ? 413.41 ? ? xy ? x ? y ? 562.04
2 xy

? xy ? 3693.3 xy ?
2 ? xy

562.04 r? ? ? 0.98776 2 2 783.16 ? 413.41 ? x ?? y
2 Q ? (1 ? r 2 ) Lyy ? (1 ? r 2 ) n? y 2 ? (1 ? 0.98776 ) ? 10 ? 413.41 ? 100.58

Se ?

Q ? n?2

100.58 ? 3.5458 10 ? 2

( 百 元)

五. 一元线性回归模型的显著性检验
?回归模型的检验

包括理论意义的检验 一 级检验(统计学检验) 拟合优度检验 显著性检验 二级检验 (经济计量学检验)

回归分析中的显著性检验包括两方面内容:
1.
2.

回归系数的显著性检验。 回归方程的显著性检验。
2

若总体方差 已知, 则可使用 检验(正态检验 ? Z ).
由于

?1 ~ N (?1 , ? 2 ( ? ? 2 ~ N (? 2 ,
?

?

1 n

x )) 2 ? ( xt ? x )
2

2

?(x
?

?2
t

? x)

)

此时统计量

Z?

?i ? ?i
var(? i )
?

~ N (0,1)

( i ? 1, 2)

1 由 于? 1 ~ N ( ? 1 , ? ( ? n
2

?

x )) 2 ? ( xt ? x )
2

2

?2 ~ N (?2 ,

?

?(x

?2
t

? x)

2

)

t检 验 : 一 般 情 况 下总 体 方 差 未 知, 此 时 可 以 令 ? , ? t 则t ~ t ( n ? 2 )
? ?

?i ? ?i
S(?i )
?

?

S ( ? i )是 ? i 的 标 准 差 的 估 计 值 ? 1, 2) .(i

以? 2的 检 验 为 例 说 明 检 验 程 : 过 1. 3.
* H0 : ? 2 ? ? 2 * H1 : ? 2 ? ? 2 * ? 2 ? ?2 ?

2.

确定显著水平 ?

计 算t ( ? 2 ) ?

?

S(? 2 )

?

4.

由P ( t ? ? ) ? ?确 定 临 界 值 作 出 判 断 ? .

【例6-7】P123 试对【例6-4】P118 回归方程的 β2进行显著性检验.(?=0.05)
家庭编号 可支配收入(百元) x 人均消费(百元) y

1 2 3 4 5 6 7 8 9 10

18 25 45 60 62 75 88 92 99 98

15 20 30 40 42 53 60 65 70 78

【例6-7】P123
? 2

H0 : ? 2 ? 0

H1 : ? 2 ? 0
? 2 y ?

? ? 0.05
2 解 : Q ? ? ( yt ? yt ) ? l yy ? U ? l yy ? ? 2 l xy ? n? ? ? 2 n? xy

? 10 ? 413.41 ? 0.7177? 10 ? 562.04 ? 100.58
Q 100 .58 S ? ? ? 12.57 n ? 2 10 ? 2
2

拒绝 H0
0.025

拒绝 H0
0.025

由P( t ? ? ) ? 0.05 ? ? ? t0.05 (8) ? 2.306
S(?2 ) ?
t(?2 ) ?
? ?

?

S ? 2 ? ( x ? x)
?

2

-2.036

12.57 ? 0.04 10 ? 783.16

0

2.036

z

? 2? 0
S(? 2 )

?

0.7177 ? 17.9 ? ? ? 2.306 0.04

拒 绝H 0 , 即 人 均 可 支 配 收 入 对 费 支 出 影 响 显 著 消 .

六.一元线性回归模型预测

预测基本公式 y f ? ? 1 ? ? 2 x f :

?

?

?

?回归方程用来预测时, 只能以自变量预测因变 量,称为单向推算,不能 用因变量推算自变量。

设X f 给 定 时 的 真 值 为 Y : 相应的点预测值为 : 则预测残差 :
?

Y f ? ?1 ? ? 2 X f ? u f Y ? ?1 ? ? 2 X f
? ? ? ? ?

e f ? Y f ? Y f ? ( ?1 ? ? 1 ) ? ( ? 2 ? ? 2 ) X f ? u f e f ~ N ( 0, Var( e f ))

可以证明 :

E (e f ) ? 0 1 Var( e f ) ? ? (1 ? ? ) 2 n ?( Xt ? X )
2

( X f ? X )2

( 一)点 估 计: E (Y f ) ? Y f

?

即Y f ? Y

?

f

( 二 )区 间 预 测 :

t?

?

Yf ? Yf 1 S 1? ? n ( X t ? X )2 ? Q n?2 ( X f ? X )2

?



t ~ t ( n ? 2)

其 中S ?

对 于 给 定 的 置 信 度? ? 1 由P ( t ? ? ) ? 1 ? ? 置信区间 : [ Y f ? ?S 1 ?
?

查表得 ? ( X f ? X )2 l xx ( X f ? X )2 l xx

1 ? n

Y f ? ?S 1 ?

?

1 ? n

]

要确定两变量之间的因果关系 (回归),必须同时满足如下三个条件:
1.

2. 3.

两变量之间必须存在相关关系,相关关 系是因果关系的必要条件,但不是充分 条件. 必须确定自变量变化在前,因变量变化 在后,即单向推算关系. 必须有X,Y之间的关系式.

P141【题10】设销售收入X为自变量,销售成本Y为因
变量。现根据某百货公司 12个月的有关资料计算出以下 数据(单位万元) ( x ? x ) 2 ? 42505373 . x ? 647.88 ?
( y ? y ) 2 ? 26285525 . ? y ? 549.8 . ? ( y ? y)( x ? x ) ? 33422909

1. 拟合线性回归方程,解释回归系数的经济意义。

2. 计算可决系数和回归估计的标准误差。
3. 对β2进行显著水平为 5%的显著性检验。

4. 假定明年 1月销售收入为 800万元,利用回归方程预测 相应的销售成本,并给出置信度为 95%的预测区间。

解:
(1)
2 ? xy ?2 ? 2 ? ?x ?

? ( x ? x )( y ? y) ? ( x ? x)
2 ?

33422909 . ? ? 0.786322 42505373 .

? 1 ? y ? ? 2 x ? 40.3577

?

?

y ? 40.3577? 0.786322 x

销售收入每增加一万元,销售成本平均 增加0.786322万元

( 2)

2 ? xy r? ? ? x? y

? ( x ? x )( y ? y) ? ( x ? x ) ? ( y ? y)
2

2

? 0.999917 可决系数 r 2 ? 0.999834

l yy ? U ? Q

Q ?r ? ?1 l yy
2

Q ? (1 ? r 2 ) ? l yy ? 43.634 Q S ? ? 4.3634 n?2
2

S ? 2.089

( 3)

H0 : ? 2 ? 0

H1 : ? 2 ? 0

拒绝 H0
0.025

拒绝 H0
0.025

? ? 0.05
t?

?2
S(? 2 )
?

?

~ t (10)
?

? ? 2.228

-2.228

0

2.228

z

l yy ? ? 2 l xy Q S ? ? ? 4.35635 n?2 n?2
2

S(?2 ) ? t??

?

S2 ? 0.0032 l xx

t ? 245.6

否 定H 0 回 归 显 著 .

(4)

X f ? 800
2

Y f ? 669.4
2

?

(X f ? X) 1 Se f ? S (1 ? ? ) ? 2.226 2 n ?( Xt ? X ) ? ? Se f ? ? ? 4.96 估计区间 [664.44 674.36]元

x 【例1】 :若机床使用年限和维修费用有关,有

如下表资料:求相关系数r
使用年限 x 费用(元)y 2 40 2 54 3 53 4 64 5 60 5 80

解:

? x ? 3.5 x?
n ( x ? x )2 ? n ? 1.258

?x ?
xy ?
2 ? xy

y ? 58 .5 ? y ? 12 .162
2 ? xy r ? ? 0.812 ? x? y

n ? x y ? x ? y ? 1 2.4 2

? x y ? 2 1 7.1 6 7

【例2】 :某工厂某产品产量与单位成本有如下表
资料: 建立单位成本依产量变化的回归方程。产量为6仟 件单位成本估计是多少?
月份 1 2 3 4 5 6 合计 产量(千件)x 2 3 4 3 4 5 21 单位成本(元/件)y 73 72 71 73 69 68 426

解:

? x ? 21 ? 3.5 x?
? ?
2 x

? y ? 426 ? 71 y? ? xy ? 1481 ? 246.83 xy ?
n 6 n 6

n 6 ( x ? x )2 ? n

? 0.917

2 ? xy ? xy ? x ? y ? 246.83 ? 3.5 ? 71 ? ?1.667
2 ?y ?

( y ? y) 2 ? n

? 3.67

r?

2 ? xy 2 2 ? x? y

? ?0.91

产量与单位成本高度负

相关

?2
?

?

2 ? xy ? 1.667 ? ? ? ?1.82 2 ?x 0.917

? 1 ? y ? b x ? 71 ? ( ?1.82 ? 3.5) ? 77.37

回 归 方 程: y ? 77.37 ? 1.82x 当 x ? 6( 仟 件)
?

?

y ? 77.37 ? 1.82 ? 6 ? 66.45( 元 / 件 )

【例3】 :检查五位学生学习时间与学习成绩的关 系如下表:
学习时数(小时)x 4 6 7 10 13 学习成绩(分)y 40 60 50 70 90

(1)建立学习成绩依学习时间变化的直线回归 方程(2)计算相关系数

解:

x ?
_

_

?x ?y
n

40 ? ? 8 5

310 y ? ? ? 62 n 5 ? xy ? 2740 ? 548 xy ? n 5 x2 370 ? 2 x ? ? ? 74 n 5 y2 20700 ? 2 y ? ? ? 4140 n 5

? ? ?

2 x 2 y 2 xy

? x

2 2

? x

2

? 10 ? 296

? y ? y

2

? xy ? x ? y ? 52

?2
?

?

2 ? xy 52 ? ? ? 5 .2 2 ?x 10 ?

? 1 ? y ? ? 2 x ? 6 2 ? 5.2 ? 8 ? 2 0.4
回归方程 :
?

回归系数 ? 2 =5.2的意义:学习时数每增加1小时,学习 成绩平均增加 5.2分。

y ? ?2 0.4 ? 5.2 x

相关系数
_ _

2 ? xy xy ? x y 52 r? ? ? ? 0.956 2 2 ? x? y 2 2 10 ? 296 ( x ? x )( y ? y )

【例4】 :根据市场调查知道某商品的需求量 (y)与该商品价格(x)有关。有如下调查 资料:
价格x(元)
10 6 72 8 70 9 56 12 55 11 57 9 57 10 53 12 54 7 70 需求量y(吨) 60

要求:(1)计算价格与需求量之间的相关系 数
(2)建立需求量对价格的直线回归方 程并解释回归系数的实际含义

解:

? x ? 94 ? 9.4 x?
x
2

?x ?
n
2

n

10

2

920 ? ? 92 10
2 2

? ? x ? x ? 92 ? 9.4 ? 3.64 ? x ? 1.908
2 x

? y ? 604 ? 60.4 y?
y
2

?y ?
n
2

n

10

2

36968 ? ? 3.6968 10
2

? ? y ? y ? 3696 8 ? 60.4 2 ? 48.64 .
2
y

? y ? 6.974

? xy ? 5564 ? 556.4 xy ?
?
2 xy

n 10 ? xy ? x ? y ? 556.4 ? 9.4 ? 60.4 ? ?11.36

2 ? xy ? 11.36 r? ? ? ?0.854 ? x ?? y 6.974? 1.908
2 ? xy ? 11.36 ?2 ? 2 ? ? ?3.12 ?x 3.64 ? ? ?

?1 ? y ? ? 2 x ? 60.4 ? ( ?3.12) ? 9.4 ? 89.74
回 归 方 程 : 89.74 ? 3.12x y?
?

回归系数β2=-3.12的意义:价格每增加一元 需求将平均减少3.12吨

【例5】根据某地区历年来人均收入 x (元) 与商品销售额 y (万元)的资料,其有关数 据如下: n=9 ∑x2=34362 ∑x=546 ∑y=260 ∑xy=16918

1.建立商品销售额依人均收入变化的直线回 归方程,解释回归系数的含义. 2.若2006年人均收入为14000元,推算该年商 品销售额.

解:

?

2 xy

16918 546 260 ? xy ? x ? y ? ? ? 9 9 9
2

2 ? x ? x2 ? x ?

34362 ? 546? ?? ? 9 ? 9 ?

2

2 ? xy ? 2 ? 2 ? 0.925 ?x ?

?1 ? y ? ? 2 x ? ?27.2
回归方程:
?

?

?

y ? ?27.2 ? 0.925x

回归系数的含义:人均收入每增加1元,商品销售额平均增 加 0.925万元. 当x=14000元时,yc= -27.2+0.925×14000=12936.71(万 元)

本章小结
1.

相关系数的计算,及其性质.

2.

一元线性回归方程的建立,回归系数的经济意 义.

第8次作业 : P140 思考与练习 : 2 , 9(2)(3) , 10(1,2,3,4),11(更 正:x,y的单位:百元) (1(更正:回归系 数),2,3,4),12




友情链接: year2525网 工作范文网 QS-ISP 138资料网 528200 工作范文网 baothai 表格模版