差异通胀因子(VIF)是回归分析中多共线性量的量度。多重共线性当多个回归模型中的多个自变量之间存在相关性时,存在。这可能会对回归结果。因此,差异通胀因子可以估计由于多重共线性,回归系数的方差被夸大了多少。
关键要点
- 差异通胀因子(VIF)提供了多元回归模型中自变量之间多共线性的度量。
- 检测多重共线性很重要,因为尽管多重共线性并不能降低模型的解释力,但它确实降低了自变量的统计意义。
- 自变量上的大型VIF表示与其他变量的高度共线关系,这些变量应在模型的结构中考虑或调整,并选择自变量。
了解差异通胀因子(VIF)
一种差异通胀因素是帮助识别多重共线性程度的工具。当一个人想要测试多个变量对特定结果的影响时,使用多元回归。因变量是独立变量(对模型的输入)所采取的结果。当一个或多个独立变量或输入之间存在线性关系或相关性时,存在多重共线性。
多重共线性的问题
多重共线性在多回归模型中引起了问题,因为输入都相互影响。因此,它们实际上并非独立,很难测试自变量的组合在回归模型中影响因变量或结果。
虽然多重共线性并不能降低模型的总体预测能力,但它可以产生对没有统计学意义的回归系数的估计。从某种意义上说,可以将其视为模型中的一种双重计数。
用统计术语,具有高度共线性的多元回归模型将使估计每个自变量和因变量之间的关系变得更加困难。换句话说,当两个或多个独立变量密切相关或几乎相同的事物时,它们测量的基本效果在整个变量上被解释了两次(或更多)。当自变量密切相关时,很难说哪个变量会影响因变量。
所使用的数据或模型方程结构中的小变化可能会在自变量上产生估计系数的较大且不稳定的变化。这是一个问题,因为许多人的目标计量经济学模型是要准确测试自变量与因变量之间的这种统计关系。
解决多重共线性的测试
为了确保正确指定模型并正确运行,可以进行多重共线性的测试。差异通胀因子就是这样的测量工具。使用差异通货膨胀因素有助于确定任何多重共线性问题的严重性,以便可以调整模型。方差通胀因子衡量自变量的行为(方差)受到与其他自变量的相互作用/相关性影响或膨胀的行为(方差)。
差异通货膨胀因素可以快速衡量变量有多少贡献标准错误在回归中。当存在重大的多重共线性问题时,对于所涉及的变量,差异通胀因素将非常大。确定这些变量后,可以使用几种方法来消除或组合共线变量,从而解决多重共线性问题。
VIF的公式和计算
VIF的公式是:
vif我=1- r我21在哪里:r我2=未经调整的确定系数回归ITH自变量其余的
VIF可以告诉您什么?
当r我2等于0,因此,当VIF或公差等于1时,ITh自变量与其余变量不相关,这意味着不存在多重共线性。
笼统,
- VIF等于1 =变量不相关
- vif 1至5 =变量中等相关
- VIF大于5 =变量高度相关
VIF越高,多共线性的可能性越高,需要进一步的研究。当VIF高于10时,需要纠正大量的多重共线性。
使用VIF的示例
例如,假设经济学家想测试失业率(自变量)与通货膨胀率(因变量)之间是否存在统计学意义的关系。包括与失业率,例如新的初始失业主张,可能会将多重共线性引入模型。
总体模型可能显示出强大的统计学上足够的解释能力,但无法确定效果是否主要是由于失业率或新的初始失业索赔所致。这就是VIF所检测到的,这可能建议将一个变量之一从模型中删除,或者根据研究人员对测试感兴趣的特定假设而巩固它们以巩固其关节效应的方法。
什么是良好的VIF价值?
根据经验,三个或以下的VIF并不是引起人们关注的原因。随着VIF的增加,您的回归结果的可靠性越小。
VIF的1是什么意思?
等于一种等于变量的VIF不相关,并且在回归模型中不存在多重共线性。
VIF是用什么?
VIF测量回归分析中自变量之间相关性的强度。该相关性称为多重共线性,这可能会引起回归模型的问题。
底线
尽管在回归模型中可以接受适量的多重共线性,但更高的多重共线性可能引起人们的关注。
可以采取两种措施来纠正高度共线性,首先,可以删除一个或多个高度相关变量,因为这些变量提供的信息是冗余的。第二种方法是使用主组件分析或部分最小平方回归,而不是OLS回归,该回归可以分别将变量分别降低到无相关性的较小集合,或者创建新的无关变量。这将提高模型的可预测性。