本题利用INVEN.RAW中的数据;也可参见计算机习题C11.6。(i)从加速数模型中求出OLS残差,并用回归
本题利用INVEN.RAW中的数据;也可参见计算机习题C11.6。
(i)从加速数模型中求出OLS残差,并用回归来检验是否存在序列相关。p的估计值是多少?序列相关看起来是多大的问题?
(ii)用PW估计这个加速数模型,并将β1的估计值与OLS估计值进行比较。你为什么预期它们很相似?
本题利用INVEN.RAW中的数据;也可参见计算机习题C11.6。
(i)从加速数模型中求出OLS残差,并用回归来检验是否存在序列相关。p的估计值是多少?序列相关看起来是多大的问题?
(ii)用PW估计这个加速数模型,并将β1的估计值与OLS估计值进行比较。你为什么预期它们很相似?
利用DISCRIM.RAW中的数据回答本题。(也可参见第3章计算机习题c 3.8.)
(i)利用OLS估计模型
以常用形式报告结果。在5%的显著性水平上,相对一个双侧对立假设,β统计显著异于零吗?在1%的显著性水平上呢?
(ii)log(income)和prppov的相关系数是多少?每个变量都是统计显著的吗?报告双侧P值。
(iii)在第(i)部分的回归中增加变量log(hseval)。解释其系数并报告H0:βlog(hseval)=0的双侧p值。
(iv) 在第(ii) 部分的回归中, log(income) 和prppov的个别统计显著性有何变化?这些变量联合显著吗?(计算一个p值。)你如何解释你的答案?
(v)给定前面的回归结果,在确定一个邮区的种族构成是否影响当地快餐价格时,你会报告哪一个结果才最为可靠?
本题需要使用ELEM 94-95中的数据, 也可参见计算机习题C 4.10。
(i) 利用所有数据, 将lavg sal对bs, lenrol, Istaff和lunch进行回归。报告bs的系数及其常用标准误和异方差-稳健标准误。你对的经济显著性和统计显著性得到什么结论?
(ii)现在去掉四个bs>0.5的观测,即平均福利(假设)占平均薪水50%以上的观测。bs的系数又是多少?利用异方差-稳健标准误来判断,它在统计上显著吗?
(iii)验证bs>0.5的四个观测分别为68、1127、1508和1670。为它们各定义一个虚拟变量。(你可以称它们为d68、d1127、d 1508和d 1670.) 把它们添加到第(i) 部分的回归中, 验证其他变量的OLS系数及其标准
误与第(ii)部分中的结果相同。在5%的显著性水平上,这四个虚拟变量中哪个变量的t统计量在统计上显著不等于0?
(iv)在这个数据集中,验证第(iii)部分回归中具有最大学生化残差(该虚拟变量的t统计量最大)的数据点对OLS估计值具有很大的影响。(即利用除去具有最大学生化残差的数据点之外的所有观测进行OLS回归。)依次去掉bs>0.5的每个观测都具有重要影响吗?
(v) 即便在大样本中, 就OLS对单个观测的敏感性而言, 你有何结论?
(vi) 在第(iji) 部分, 验证LAD估计量对包含这些观测不是很敏感。
本题利用TRAFFIC 2.RAW中的数据。前面的计算机习题C 10.11曾要求你分析这些数据。
(i)计算变量prc fat的一阶自相关系数。你认为prc fat包含单位根吗?失业率也一样吗?
(ii)估计一个将prc fal的一阶差分Aprcfat与计算机习题C10.11第(vi) 部分中同样变量相联系的多元回归模型,只是你还应该对失业率进行一阶差分。于是,模型中包含一个线性时间趋势、月度虚拟变量、周末变量和两个政策变量:不要将这些变量进行差分。你发现了什么有意思的结论吗?
(iii)评论如下命题:“在进行多元回归之前,我们总应该将怀疑具有单位根的时间序列进行一阶差分,因为这样做是一种安全策略,而且应该得到与使用水平值类似的结论。”[在回答这个问题时,最好先做(如果你还没有做过的话)计算机习题C10.11第(vi)部分中的回归。]
本题利用FERTIL 3.RAW中的数据。
(i)以时间为横轴,画出gfr的曲线。在整个样本期间,它包含了明显的向上或向下的趋势吗?
(ii)利用直至1979年的数据,估计gfr的立方时间趋势模型(即将gfr对t、t2、t3和截距项进行回归) 。评论这个回归的R2。
(iii)用第(ii)部分中的模型,计算从1980年到1984年的提前一期预报误差的MAE。
(iv)利用到1979年为止的数据, 做对一个常数的回归。这个常数统计显著异于0吗?如果我们假定gfri服从一个随机游走,同时也假定漂移项为0,这样做合理吗?
(v)用随机游走模型预报从1980年到1984年的gfr:gfni+1的预报值无非就是gfrit。求出MAE。它与第(iii)部分中得到的MAE有何区别?你更喜欢哪一种预报方法?
(vi)用直至1979年的数据估计gfr的AR(2)模型。第二个滞后项显著吗?
(vii)用AR(2) 模型求出1980~1984年的MAE。这个更一般的模型比随机游走模型的样本外预报效果更好吗?
本题利用INTQRT.RAW中的数据。
(iii)现在请你估计协整参数, 而不是把它设为1。再利用最后16个季度的数据求出样本外RMSE。它与第(i)部分和第(ii)部分中的结果有什么不同?
(iv)如果你想要预测的是r6而不是△r6,你的结论会有所变化吗?请解释。
本题利用数据集MEAO0_01.RAW中的数据。
(i)用OLS估计方程
(iv)求容许方差函数被误设的WLS标准误。它与通常的WLS标准误有很大的不同吗?
(v)为了估计支出对math 4的影响, OLS与WLS哪一个看起来更准确?
本题利用HPRICE1.RAW中的数据。
(i)估计模型
并以通常的OLS格式报告结论。
(ii)当lotsize=20000,scrft=2500和bdrms=4时,求出log(price) 的预测值。利用6.4节中的方法,在同样的解释变量值的情况下,求出price的预测值。
(iii)就解释price中的变异而言,决定你是偏好第(i)部分中的模型,还是偏好模型
本题利用PHILLIPS.RAW中的数据。现在你应该使用56年的数据。
(i)重新估计方程(11.19),并以通常格式报告结果。当你增加近几年的数据之后,截距和斜率估计值有明显变化吗?
(ii)求自然失业率的新估计值。将这个新估计值与例11.5中的估计值进行比较。
(iii)计算unem的一阶自相关系数。按照你的观点, 单位根接近于1吗?
(iv)利用A mem取代unem作为解释变量。哪个解释变量具有更高的R?
本题利用SLEEP75.RAW中的数据。我们要分析的方程为:
(i)分别针对男性和女性单独估计这个方程,并按照通常形式报告结论。这两个估计方程有什么明显差异吗?
(ii)对男性和女性睡眠方程中的参数是否相等计算邹至庄检验。使用增加male和交互项male totwrk,.male的检验形式,并使用全部观测。该检验相关的df等于多少?在5%的显著性水平上,你应该拒绝这个虚拟假设吗?
(iii)现在,容许男性与女性存在不同截距,判定所有涉及male的交互项是不是联合显著的?
(iV)给定第(ii)部分和第(iii)部分中的结论,你最后将使用什么样的模型?
本题利用NBASAL.RAW中的数据。
(i)估计一个线性回归模型,将单场得分与联赛中打球经历和位置(后卫、前锋或中锋)联系起来。包括打球经历的二次项形式,并将中锋作为基组。以通常的形式报告结果。
(ii)在第(i)部分中,你为什么不将所有三个位置虚拟变量包括进来?
(iii)保持经历不变,一个后卫的得分比一个中锋多吗?多多少?这个差异统计显著吗?
(iv)现在,将婚姻状况加入方程。保持位置和经历不变,已婚球员是否更高效(就单场得分来说)?
(v)加入婚姻状况和两个经历变量的交互项。在这个扩展的模型中,是否存在有力的证据表明婚姻状况影响单场得分?
(vi)使用单场助攻次数作为因变量估计(iv)中的模型。与(iv)的结果有明显的差异吗?请讨论。