您好,欢迎访问三七文档
名词解释1、因果效应:在理想化随机对照实验中得到的,某一给定的行为或处理对结果的影响2、实验数据:来源于为评价某种处理(某项政策)抑或某种因果效应而设计的实验3、观测数据:通过观察实验之外的实际行为而获得的数据4、截面数据:对不同个体如工人、消费者、公司或政府机关等在某一特定时间段内收集到的数据5、时间序列数据:对同一个体(个人、公司、国家等)在多个时期内收集到的数据6、面板数据:即纵向数据,是多个个体分别在两个或多个时期内观测到的数据7、离散型随机变量:一些随机变量是离散的连续型随机变量:一些随机变量是连续的8、期望值:随机变量经过多次重复实验出现的长期平均值,记作E(Y)9、期望:Y的长期平均值,记作Y10、方差:是Y距离其均值的偏差平方的期望值,记作var(Y)11、标准差:方差的平方根来表示偏差程度,记作Y12、独立性:两个随机变量X和Y中的一个变量无法提供另一个变量的相关信息13、标准正态分布:指那些均值102、方差的正态分布,记作N(0,1)14、简单随机抽样:n个对象从总体中抽取,且总体中的每一个个体都有相等的可能性被选入样本15、独立分布:两个随机变量X和Y中的一个变量无法提供另一个变量的相关信息,那么这两个变量X和Y独立分布16、偏差:设YYEYY-ˆˆ)(为的一个估计量,则偏差是;一致性:当样本容量增大时,ˆ落入真实值的微小领域区间内的概率接近于1,即与ˆ是一致的有效性:如果ˆ的方差比~更小,那么可以说~ˆ比更有效17、最小二乘估计量:21)(mini最小化误差m-i平方和的估计量m18、值:即显著性概率,指原假设为真的情况下,抽取到的统计量与原假设之间的差异程度至少等于样本计算值与原假设之间差异程度的概率19、第一类错误:拒绝了实际上为真的原假设20、一元线性回归模型:ii10i;1代表1变化一个单位所导致Y的变化量21、普通最小二乘(OLS)估:选择使得估计的回归线与观测数据尽可能接近的回归系数,其中近似程度用给定X时预测Y的误差的平方和来度量22、回归2R:可以由i解释(或预测)的i样本方差的比例,即TSSSSRTSSESSR1223、最小二乘假设:①给定i时误差项i的条件均值为零:0)(iiE;②从联合总体中抽取的,,,,),,(n...21iii满足独立同分布;③大异常值不存在:即ii和具有非零有限的四阶距24、1置信区间:以95%的概率包含1真值的区间,即在所有可能随机抽取的样本中有95%包含了1的真值25、同方差:若对于任意i=1,2,...,n,给定)(条件分布的方差时iiiivar为常数且不依赖于,则称误差项i是同方差26、异方差:若对于任意i=1,2,...,n,给定)(条件分布的方差时iiiivar为常数且依赖于,则称误差项i是异方差27、遗漏变量偏差:指OLS估计量中存在的偏差,它是在回归变量X与遗漏变量相关时产生的28、多元回归模型:n...1i...ikiki22i110i,,,;1代表在其他影响Y的因素2不变的前提下,1变化一个单位所导致Y的变化量29、调整2R(2R):是2R的一种修正形式,由于加入新变量后2R不一定增大,即22ˆ211-k-n1-n1YssTSSSSRR30、虚拟变量陷阱:如果有G个二元变量,且每个观测都只属于其中一类,又如果回归中包含截距项以及所有G个二元变量,则会因为完全多重共线性而无法进行回归31、控制变量:回归中保持某些因素不变的回归量32、二次回归模型:i2i2i10incomencomecoreestIIST33、非线性回归函数:ikii2i1i...f),,,(Y,i=1,...,n;其中f(kii2i1...,,,)为非线性回归函数34、多项式回归模型:irir2i2i10i...35、双对数模型:ii10ilnln)()(填空题1、计量经济学提供了利用观测数据(而非实验数据)或者来自现实世界不太完美的实验数据估计因果效应的方法2、截面数据是多个个体在同一时间点上收集到的数据;时间序列数据是一个个体在多个时间点上收集到的数据;面板数据是多个个体分别在多个时间点上收集到的数据3、随机变量Y的期望值(也可称为均值,Y)记作E(Y),是变量的概率加权平均值;Y的方差为2)(2YYE,Y的标准差是方差的平方根4、两个随机变量X和Y的联合概率由它们的联合概率分布所表示;给定X=下Y的条件概率分布是指给定X取值为的条件时,Y的概率分布5、正态分布随机变量具有钟形概率密度;若要计算有关正态随机变量的概率,首先需要对其标准化,然后再查阅附录表1的标准正态累积分布表6、简单随机抽样可以产生n个随机观测值1,...,n,它们是独立分布的7、样本均值n1...,,的估计量;当是总体均值为独立分布时,有:①的抽样分布均值为n22,方差为;②是无偏的;③根据大数定律,是一致的;④根据中心极限定理,当样本容量较大时,的抽样分布是近似正态的8、t统计量可以用来计算和原假设相关的p值;较小的p值意味着原假设是错误的9、的95%置信区间是指在95%全部可能样本中包含真值的区间10、样本相关系数是总体相关系数的估计量,它度量了两个变量之间的线性关系—它们的散点图究竟有多近似于一条直线11、总体回归线是10的函数,表示Y的均值:斜率1表示X变化一个单位时对应Y的预期变化;截距0决定了回归线的水平(或高低)12、利用样本观测数据(ii,),i=1,2,...,n使用普通最小二乘法可以估计总体回归线;回归截距和斜率的OLS估计量分别记为10ˆˆ和13、2R和回归标准误差(SER)度量了i与总体回归线的接近程度;其中2R的取值范围为0到1;2R取值较大表明i接近总体回归线;回归标准误差是回归误差的标准差的估计量14、线性回归模型中有三个重要假设:①给定i时误差项i的条件均值为零:0)(iiE;②从联合总体中抽取的,,,,),,(n...21iii满足独立同分布;③大异常值不存在:即ii和具有非零有限的四阶距;若这些假设成立,则OLS估计量10ˆˆ和是①无偏的②一致的③大样本时服从正态分布15、对回归系数的假设检验类似于对总体均值的假设检验,都是利用t统计量来计算p值,从而确定是接受还是拒绝原假设;类似于总体均值的置信区间,回归系数的95%置信区间为估计量±1.96标准误差16、如果三个最小二乘假设成立,回归误差同方差并且服从正态分布,则利用同方差适用标准误差计算的t统计量在原假设下服从学生t分布;当样本容量足够大时,学生t分布和正态分布之间的差异可忽略不计17、若遗漏变量(1)与回归中的回归变量相关;(2)是Y的决定因素之一,则会产生遗漏变量偏差(同时满足)18、多元回归模型是包含多个回归变量的线性回归模型,,,k21...,每个回归变量都对应一个回归系数,,,,k21...其中系数1表示在其他回归变量不变的情况下,1变化一个单位时Y的预期变化,其他回归系数的解释与之类似19、可通过OLS估计多元回归中的系数;当满足四个最小二乘假设时,OLS估计量是无偏一致估计量,并且在i大样本下服从正态分布①给定ikii2i1...时,,,的条件均值为零,即0...kii2i1i),,,(E;②从联合分布中抽取的iY),...ikii2i1,,,,(=1,...,n满足独立同分布;③不存在大异常值,即具有及,,ikii1...Y非零有限四阶距;④不存在完全多重共线性20、在多元回归中,当某个回归变量是其他回归变量的完全线性组合时就产生了完全多重共线性,通常是有选择回归变量时的错误引起的,因此处理完全多重共线性的方法是改变回归变量集21、回归标准误差、22RR及都表示多元回归模型的拟合优度22、当系数涉及多个约束时的假设称为联合假设,可利用F统计量进行检验23、在非线性回归中,总体回归函数的斜率依赖于一个或多个解释变量的取值24、两个变量的乘积项称为交互项,在回归中加入交互项可以使其中一个变量的回归斜率依赖于另一个变量的取值计算题P412.2使用表2-2中的概率密度计算E(Y)和E(X)Pr(X=0)=0.30Pr(X=1)=0.70Pr(Y=0)=0.20Pr(Y=1)=0.78E(X)=0*0.30+1*0.70=0.70E(Y)=0*0.22+1*0.78=0.782.6下面的表格给出了基于2008年美国适龄人口从业状况和接受大学教育的联合分布(1)E(Y)=0*0.046+1*0.954=0.954(2)失业率=Pr(Y=0)=0.046(3)E(Y丨X=1)=0*Pr(Y=0丨X=1)+1*Pr(Y=1丨X=1)=0.332/0.341=0.9736E(Y丨X=0)=0*Pr(Y=0丨X=0)+1*Pr(Y=1丨X=0)=0.622/0.659=0.94385(4)大学毕业生的失业率=1-E(Y丨X=1)=1-0.9736=0.0264非大学毕业生的失业率=1-E(Y丨X=0)=1-0.94385=0.5615(5)Pr(X=1丨Y=0)=0.009/0.046=0.196Pr(X=0丨Y=0)=0.037/0.046=0.804(6)P(X=Xi,Y=Yi)=P(X=Xi)*P(Y=Yi)独立反之不独立P713.8对1000个随机抽取的高三学生安排一项新版的SAT测试。测试成绩的样本均值为1110,而样本标准差为123。构建高三学生测试成绩总体均值的95%置信区间。1110±1.96*123=1110±241.08=[868.92,1351.08]P974.1假设某研究所人员基于100组三年级的班级规模(CS)和平均测试成绩(testscore)数据估计的OLS回归为:(1)520.4-5.82*22=392.36(2)回归预测值:1=520.4-582*19=409.822=520.4-582*23=386.542-1=386.54-409.82=-23.28(3)CS均值=21.4=X的均值Yi=520.4-5.82Xi∑Yi=100*520.4-5.82XiY的均值=∑Yi/N=520.4-582X的均值=520.4-5.82*21.4=395.852P1225.1假设某研究所人员基于100组三年级的班级规模(CS)和平均测试成绩(testscore)数据估计的OLS回归为:(1)t=β1帽-β1/Sβ1帽=-5.82-β1/2.21即丨β1帽-β1/Sβ1帽丨≤1.96,丨-5.82-β1/2.21丨≤1.9695%置信区间对应的双边临界值1.96,-5.82±1.96*2.21[-10.1516,-1.4884](2)H0:β1=0,H1:β1≠0t=β1帽-β1/Sβ1帽=-5.82-0/2.21=-2.63对应双边检验的P值为0.0099。在5%水平和1%水平下都拒绝元假设。说明班级规模是影响测试成绩的显著变量。P1476.2根据表6-2中第(1)列的回归结果回答:(1)Wage帽=12.69+5.46X1Wage0帽=12.69+5.46*0=12.69Wage1帽=12.69+5.46*1=18.15所以具有大学学历的员工收入比具有高中学历的员工收入高每小时5.46美元(2)Wage帽=12.69-2.64X2Wage0帽=12.69-2.64*0=12.69Wage1帽=12.69-2.64*1=10.05所以男比女高2.64美元/每小时6.5数据来源于2003年某社区220个住房销售的样本数据。(1)价格预计增加23.4千美元(2)价格预计增加23.4*1+0.156*100=39千美元(3)损失48.8千美元6.6某
本文标题:计量经济学
链接地址:https://www.777doc.com/doc-6088247 .html