计量经济学复习笔记要点达莫达尔版
1、什么是计量经济学?
计量经济学(Econometrics)
意为“经济测量”,它是利⽤经济理论、数学、统计推断等⼯具,对经济现象进⾏分析的⼀门社会科学。
区别与联系经济理论
计量经济学vs {数理经济学
统计学
2、计量经济学的传统⽅法论
Step1 理论或假说的陈述经典步骤
→分析经济问题的⼋个经典步骤
Step5 计量模型的参数估计
Step6 检验模型设定是否正确
Step7 假设检验(检验来⾃模型的假说)
Step8 预测或控制
◆关于数据
1、数据分类
(1)时间序列数据(Time Series Data):
对⼀个变量在不同时间取值的⼀组观测结果。如每年、每⽉、每季度等
(2)横截⾯数据(Cross Section Data):
对⼀个变量在同⼀个时间点上搜集的数据。如同⼀年的分国别、分省、分⼚家数据
(3)混合数据(Pooled Data):
时序和横截⾯的混合数据,既有分时,每⼀时点的观察对象⼜有不同(多个横截⾯单元) ⼴泛运⽤的⼀类特殊的混合数据——⾯板数据/综列数据/合成数据(Panel Data):
在时间轴上对相同的横截⾯单元跟踪调查得到的数据。如每年对各省GDP的报告。
2、研究结果永远不可能⽐数据的质量更好
观测误差、近似进位计量、⾼度加总、选择性偏误
3、数据来源:
⽹站、统计年鉴、商业数据库等
(1)统计局、央⾏、证券交易所、世⾏、IMF等官⽅⽹站
(2)图书馆(纸质、电⼦版年鉴)
(3)商业数据库
◆两个例⼦
例1:凯恩斯消费理论
①⼈们倾向于随他们收⼊的增加⽽增加消费,但消费的增加不如收⼊的增加那么多。
②C=a+bI →确定性关系
③Y=β1+β2X+µ→µ为扰动项,⾮确定性关系
④搜集80~91年美国消费及收⼊数据
⑤估计参数:
解释:平均⽽⾔,收⼊↑1美元,消费↑72美分
⑥检验模型设定的正确性:是否应当加⼊别的可能影响消费额的变量,如就业等。
⑦假设检验:H0 : β2 < 1 (边际消费倾向<1)
⑧预测:给定X,算Y
控制:给定Y,算X
例2:受挫⼯⼈假说(P2~8)
◆基本的统计学术语和概念
1、随机变量(r.v)
以⼀定的概率取到各种可能值的变量,取值由抽样或试验结果决定。若取这些数值的概率为p,则p属于[0, 1]。r.v.通常⽤⼤写字母X,Z…表⽰。
如:⼈的年龄、⾝⾼、体重、肺活量;猪⾁价格;
抛两枚硬币,正⾯朝上的个数
按其取值情况随机变量可分为两类:
离散型r.v:只可能取到有限或可列个结果
连续型r.v:可以取某⼀区间范围内的任意值
2、总体、个体、样本
variable怎么记总体(样本空间),它是所有可能结果的集合.通常情况下,它=研究对象。
例:⼴西男青年的⾝⾼、南宁市猪⾁价格、
东盟国家的出⼝额
个体,它是组成总体的基本单位,代表了样本空间中的某⼀种结果。
例:男青年甲的⾝⾼、某摊贩的猪⾁价格、越南出⼝额
总体具有同质性:同⼀总体中的每个个体具有
某些共同的特征,因⽽与其它总体相区别
抽样:通常情况下总体难以被穷举,因此难以直接观测其性质。需要通过抽取样本的⽅法来研究其性质。
样本性质总体性质
样本,是总体中抽出若⼲个个体(样本点)组成的集合。样本中包含的个体个数称为样本的容量,⼜称为样本的⼤⼩。
注意:抽样是按随机原则选取的,即总体中每个个体有同样的机会被选⼊样本。3、描述性统计量
期望值/均值:度量r.v.取值的集中趋势(Expected value/Mean)
⽅差、标准差:度量对均值的偏离程度(Variance、Standard Deviation / S.d.)
第⼆部分线性回归模型
Ch6、7 双变量模型
——线性回归的基本思想、实现步骤
Ch8 多变量模型
Ch9 其它函数形式的回归模型实际运⽤得最多
Ch10 包含虚拟变量的回归模型
§1. 回归分析概述
◆回归分析:⼀种统计技术在计量经济学中被⼤量使⽤
◆主要⽤意:分析⼀个叫做被解释变量的变量对另外⼀个(或多个)叫做解释变量
的变量的统计依赖性
术语和符号
1、被解释变量与解释变量的多种叫法
被解释变量Explained variable 解释变量Explanatory variable
应变量Dependent variable ⾃变量Independent variable
预测⼦ Predictand 预测元 Predictor
回归⼦ Regressand 回归元 Regressor
响应 Response 控制变量 Control variable
内⽣变量 Endogenous 外⽣变量 Exogenous variable
2、回归模型的分类和叫法
双变量回归、⼀元回归、简单回归
多变量回归、多元回归、复变量回归
3、符号约定
被解释变量—— Y
解释变量—— X
横截⾯数据——下标 i
时间序列数据——下标 t
§2. 双变量回归的基本概念
总体回归线
(Population Regression Line )
在⼏何意义上,总体回归线就是解释变量取给定值时,被解释变量的条件均值或期望值的轨迹。
(X 取遍所有可能值,然后把的点连起来)
2、总体回归函数(PRF )→它是总体回归线的数学表达式(Population Regression Function ) ——截距系数intercept Parameters
——斜率系数,两者都是回归系数/参数
Slope Regression coefficients
总体回归函数的随机设定
离差(Deviation),表述如下:
总体回归函数的随机表达
其中,ui 是⼀个可正可负的的随机变量,称为随机⼲扰项/扰动项/误差项(Stochastic disturbance/ Stochastic error )
随机⼲扰项的性质和意义
它是从模型中省略下来,但⼜集体地影响着Y 的全部变量的替代物。
3、样本回归线/样本回归函数(仍以为例)
由于总体往往不能直接观测,因⽽要在样本信息的基础上,⽤SRF 来估计PRF
样本回归函数(SRF )也有两种表述形式。 SRF 的均值形式
注:估计量,也称统计量,它是⼀种运算规则或⽅法,告诉⼈们怎样运⽤⼿中样本所提供的信息去估计总体参数。
SRF 的随机形式:样本残差/回归残差/剩余项(residual )ui 的估计量。
B 1 、B 2的估计量 12?Y X i i
b b =+的估计量)
X Y (i E 12E Y X i i B B X ()=+12E Y X i i B B X ()=+12X i i i
Y B B u =++?Y Y i i i e =+
它表⽰样本点与SRF 之间
的差距:
回归分析的⽬的是通过SRF 来估计PRF
思考:既然SRF 只不过是PRF 的⼀个近似,能不能设计⼀种规则或⽅法,使得这种近似尽可能地做得好⼀些或者说,尽管真实的B 值永远不得⽽知,怎样构造SRF 才能使B 的估计值尽可能地“接近”真实的B ?
回归分析的第⼀阶段:参数估计
补充:“线性”⼀词的含义(课本104页)
对变量线性:变量只以⼀次⽅的形式出现。⼏何上,回归函数线是⼀条直线。
对参数线性:参数只以⼀次⽅的形式出现。
约定:今后讨论的线性就是指对参数线性
§3. 参数估计:普通最⼩⼆乘法
由于样本是从总体中抽出来的,⼀定程度上代表了总体的形状,因此好的SRF 使之与PRF 最接近,⾸先要画出与样本拟合得好的样本回归线
怎么画?=》普通最⼩⼆乘法
1、普通最⼩⼆乘法(OLS )
普通最⼩⼆乘法(Method of Ordinary Least Squares),
由⾼斯提出。
(1)最⼩⼆乘原理
要使SRF 与样本的拟合效果最好,必须使实际的Y 值与估计的Y 的均值之间的差距最⼩:由于残差值有正有负,这⾥可能会出现抵消的问题(实际的Yi 离开SRF 很远,但残差的和却很⼩)。
如果采取最⼩⼆乘准则,使残差平⽅和最⼩,就能解决抵消的问题。
(2)B1、B2的估计
对于上式,给定⼀组X 、Y 的数据,b1、b2选得不同,残差平⽅和的值就不同。因此,
我们⽤微分法来解该问题。
对⽀出回归结果的解释
斜率系数0.0814表⽰:周可⽀配收⼊每增加⼀个单位(1美元),平均⽽⾔,周
⽀出增加0.0814个单位(8美分)
截距系数7.6182的含义:当样本取值包含0时,它表⽰X =0时Y 的均值当样本
取值不包含0时,它代表了回归模型中所有省略变量对Y 的平均影响
其它⼀些例⼦课本108~112页
例6-1 受教育年限与平均⼩时⼯资
例6-2 奥肯定律(产出增长律与失业率)
例6-3 股价与利率
例6-4 美国中等房价与利率
例6-5 古董钟与拍卖价格
通过例⼦进⼀步体会采⽤OLS 法得到SRF 的过程
回顾
总体回归线 / 函数样本回归线 / 函数 ?Y Y
i i i
e =-
PRL / PRF SRL / SRF
怎样构造 SRL / SRF ,使这个估计做得尽量好?
(b1 、 b2尽可能地接近B1、B2) OLS 法
2、OLS 估计量的性质 P127
⾼斯—马尔柯夫定理:
在满⾜古典线性回归模型( CLRM )假定的条件下,OLS 估计量是BLUE 。(Best Linear Unbiased Estimator )
三层含义:
⾸先,OLS 估计量是线性的。即是关于的线性组合。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。