利用RECD.RAW中的数据,通过OLS(仅用552个未截取的持续期间)估计教材例17.4中的模型。一般性地评论这些估计值与教材表17-4中估计值的比较。
利用MRO2.RAW中的数据。
(i)利用在工作的428个妇女的数据,通过以exper、exper2、nwifeinc、age、kidsir6和kidsge6为解释变量的OLS来估计受教育的回报。报告educ的估计值及其标准误。
(ii)现在用赫克曼估计受教育的回报,其中所有外生变量都在第二阶段的回归中出现。换句话说,就是做log(wage)对educ、exper、ecper2、nwifeinc、age、kidslt6、kidsge6和入的回归。将估计的教育回报及其标准误与第(i)部分的结果相比较。
(iii)只用428个工作妇女的观测,将1对educ、exper、ecper2、nwifeinc、age、kidslt6、kidsge6回归。R2为多大?这如何有助于解释你在第(ii)部分得到的结果?(提示:考虑多重共线性。)
利用401KSUBS.RAW中的数据,只使用未婚人士的数据(fsize=1)。我们关心的等式如下:
(i)利用OLS估计这个方程,按照通常形式报告结果,并解释e401k的系数。
(ii)利用布罗施-帕甘检验,使用OLS残差检验异方差性。u看上去独立于解释变量吗?
(iii)用LAD估计这个方程,并以对OLS同样的方式报告结果。解释e401k的系数。
(iv)调和第(i)部分和第(iii)部分的结论。
本题利用INVEN.RAW中的数据;也可参见计算机习题C11.6。
(i)从加速数模型中求出OLS残差,并用回归来检验是否存在序列相关。p的估计值是多少?序列相关看起来是多大的问题?
(ii)用PW估计这个加速数模型,并将β1的估计值与OLS估计值进行比较。你为什么预期它们很相似?
本题利用MRO 2.RAW中的数据。
(i) 利用在工作的428个妇女的数据, 通过以exper、exper z、n wife inc、age、kids li 6和kids ge 6为解释变量的OLS来估计受教育的回报。报告educ的估计值及其标准误。
(ii)现在用赫克曼估计受教育的回报,其中所有外生变量都在第二阶段的回归中出现。换句话说,就是做log(wagc)对educ、exper、ecper2、m wife inc、age、kids lt6、kids ge 6和 的回归。将估计的教育回报及其标准误与第(i)部分的结果相比较。
(iii) 只用428个工作妇女的观测, 将对e chuc、exper、ec per2、mv if eic、age、kidslt6、kids ge 6回归。R2为多大?这如何有助于解释你在第(ii)部分得到的结果?(提示:考虑多重共线性。)
本题需要使用ELEM 94-95中的数据, 也可参见计算机习题C 4.10。
(i) 利用所有数据, 将lavg sal对bs, lenrol, Istaff和lunch进行回归。报告bs的系数及其常用标准误和异方差-稳健标准误。你对的经济显著性和统计显著性得到什么结论?
(ii)现在去掉四个bs>0.5的观测,即平均福利(假设)占平均薪水50%以上的观测。bs的系数又是多少?利用异方差-稳健标准误来判断,它在统计上显著吗?
(iii)验证bs>0.5的四个观测分别为68、1127、1508和1670。为它们各定义一个虚拟变量。(你可以称它们为d68、d1127、d 1508和d 1670.) 把它们添加到第(i) 部分的回归中, 验证其他变量的OLS系数及其标准
误与第(ii)部分中的结果相同。在5%的显著性水平上,这四个虚拟变量中哪个变量的t统计量在统计上显著不等于0?
(iv)在这个数据集中,验证第(iii)部分回归中具有最大学生化残差(该虚拟变量的t统计量最大)的数据点对OLS估计值具有很大的影响。(即利用除去具有最大学生化残差的数据点之外的所有观测进行OLS回归。)依次去掉bs>0.5的每个观测都具有重要影响吗?
(v) 即便在大样本中, 就OLS对单个观测的敏感性而言, 你有何结论?
(vi) 在第(iji) 部分, 验证LAD估计量对包含这些观测不是很敏感。
使用RDCHEM.RAW中的数据,通过OLS得到如下方程
(i)sales对rdintens的边际影响在什么时候开始变成负的?
(ii)你会在模型中保留二次项吗?请解释。
(iii)定义salesbil为以十亿美元计的销售额:salesbil=sales/1000。用salesbil和salesbil2作为自变量重写估计方程。务必报告标准误和R2。[提示:注意salesbil2=sals21(1000)2。]
(iv)为了报告结果,你更偏好哪个方程?
本题利用数据集401KSUBS.RAW。
(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。
(iv)在验证了第(i)部分的拟合值都介于0和1之间后,求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗?
利用DISCRIM.RAW中的数据回答本题。(也可参见第3章计算机练习C8。)
(i)利用OLS估计模型
以常用形式报告结果。在5%的显著性水平上,相对一个双侧备择假设,β统计显著异于零吗?在1%的显著性水平上呢?
(ii)log(income)和prppov的相关系数是多少?每个变量都是统计显著的吗?报告双侧P值。
(iii)在第(i)部分的回归中增加变量log(hseval)。解释其系数并报告的双侧p值。
(iv)在第(ii)部分的回归中,log(income)和prppov的个别统计显著性有何变化?这些变量联合显著吗?(计算一个p值。)你如何解释你的答案?
(v)给定前面的回归结果,在确定一个地区的种族构成是否影响当地快餐价格时,你会报告哪一个结果才最为可靠?
利用MEAP00 O1中的数据回答本题。
(i)使用OLS估计模型
并用通常的格式报告你的结论。在5%的显著性水平上,每个解释变量都是统计显著的吗?
(ii)求出第(i) 部分中回归的拟合值。拟合值的取值范围是多少?它与math4的实际数据取值范围相比如何?
(iii)求出第(i)部分中回归的残差。哪类学校具有最大的(正)残差?对这个残差给予解释。
(iv)在方程中增加所有解释变量的平方项,检验它们的联合显著性。你会把它们放到模型中吗?
(v)回到第(i)部分中的模型,将因变量和每个解释变量都除以各自的样本标准差,并重新进行回归。(除非你还将每个变量分别减去了各自的均值,否则还应该包括一个截距项。)以标准差为单位,哪个解释变量对数学考试通过率具有最大的影响?
其中,因为滞后支出变量,第一个可用年份(基年)是1993年。
(i)用混合OLS估计模型, 并报告通常的标准误。为使得ai的期望值可以非零, 你应该与年度虚拟变量一起包含一个截距项。支出变量的估计效应是什么?求OLS残差。
(ii)lunchit系数的符号在意料之中吗?解释系数的大小。你认为学区的贫穷率对考试通过率有很大的影响吗?
(iii)利用的回归计算AR(1)序列相关的一个检验。你应该在回归中使用1994~1998年的数据。验证存在很强的正序列相关,并讨论为什么。
(iv)现在用固定效应法估计方程。滞后的支出变量仍显著吗?
(v)你为什么认为在固定效应估计中,注册学生人数和午餐项目变量不是联合显著的?