CFAL2复习Day3:
今天的知识点是一元线性回归中的SEE,全称:Standard Error of Estimate。我把它记为估计的**误差,不知道对不对。考纲对这个知识点的要求是,要会计算并解释。
计算公式:
这是一个变量的SEE的计算公式,
分子是计算样本观测实际值与预测值之间的差异,称为回归残差(regression residual,ε),通常是指误差项error term.求平方后,可以叫做剩余平方和。
整个公式与计算**差的公式非常像,除了分母由n-1变为n-2之外,在计算SEE中,n-2是指自由度(degrees of freedom),因为一共有n个观察值,而两个估计的参数,b0的估计、b1的估计占了2个,因此整个公式只有n-2个自由度了。
怎么理解Standard Error of Estimate
对着公式看可能比较容易理解,回归残差的平方和,代表了实际值和预计值的偏差的平方和,很明显SEE越大,偏差越大。因此,一个比较小的SEE,反映了一个更好的预测结果。
这个知识点不能保证自己理解正确,知乎了一遍也没找到能看得懂的浅显易懂的回答。
按照教材的理解,SEE\决定系数都是“statistics that measure how well a given linear regression model captures the relationship between the dependent and independent variables. ”(衡量给定线性回归模型捕获因变量和自变量之间关系的统计数据。)
推荐一篇百度文库里面的文章“Excel回归**结果的详细阐释”,对在Excel中用回归**得出来的统计参量有非常细致的解释。包括了决定系数、**误差、回归系数、显著性水平、t检验、f检验等。