什么是多重共线性?
多重共线性是在多元回归模型中两个或多个自变量之间的高相关性。当研究人员或分析师试图确定如何最有效地使用每个自变量来预测或理解统计模型中的因变量时,多重共线性可能会导致偏斜或误导性结果。
通常,多重共线性可以导致更广泛的置信区间,从而在模型中自变量的影响而产生较不可靠的概率。
在技术分析中,多重共线性可能导致对投资的错误假设。它通常发生是因为使用了同一类型的多种指标来分析股票。
关键要点
- 多重共线性是一个统计概念,其中模型中的几个自变量相关。
- 如果两个变量的相关系数为+/- 1.0,则将两个变量视为完全共线。
- 独立变量之间的多重共线性将导致可靠的统计推断。
- 当您分析投资时,最好使用不同类型的指标,而不是相同类型的多种指标来避免多重共线性。
- 多重共线性可能会导致可靠的结果,因为您要比较的结果通常相同。
了解多重共线性
统计分析师使用多元回归模型根据两个或多个自变量的值预测指定因变量的值。因变量有时称为结果,目标或标准变量。
一个例子是多元回归模型试图根据指标(例如价格比率(P/E比),市值或其他数据。股票回报是因变量(结果),并且财务数据的各个位是自变量。
多重共线性在多元回归模型中表明共线自变量并非真正独立。例如,过去的性能可能与市值。表现良好的企业股票经历了投资者的信心,增加了对该公司股票的需求,从而提高了其市场价值。
多重共线性的影响
尽管多重共线性不会影响回归估计,但它使它们模糊,不精确和不可靠。因此,很难确定自变量如何单独影响因变量。这充气 某些回归系数的标准误差。
检测多重共线性
一种统计技术称为方差通货膨胀因素(VIF)可以在多回归模型中检测和测量共线性的量。 VIF测量估计回归系数的方差与预测变量无线性相关时的差异。 1的VIF将意味着变量不相关; 1到5之间的VIF表明变量中等相关,而VIF在5到10之间将意味着变量高度相关。
分析库存时,您可以通过注意指标是否相同来检测多重共线性。例如,在交易图表上选择两个动量指标通常会创建趋势线,以表明相同的势头。
多重共线性的原因
当两个自变量高度相关时,可以存在多重共线性。如果从数据集中的其他变量计算出一个自变量,或者两个自变量提供了相似且重复的结果,也可能发生这种情况。
同样,如果您使用相同的数据来创建两个相同类型的交易指标的两种或三个,则结果将是多共线的,因为数据及其操纵以创建指标非常相似。
重要的
来自包含多重共线性的模型的统计推断可能无法可靠。
多重共线性的类型
完美的多重共线性
完美的多重共线性展示了多个自变量之间精确的线性关系。这通常在图表上可以看到数据点沿回归线落下的图表。在技术分析中,当您使用两个测量相同内容的指标(例如音量)时,可以看到。如果您在另一个顶部覆盖了一个,则它们之间将没有区别。
高度共线性
高度共线性表明了多个独立变量之间的相关性,但不如完美多重共线性紧密。并非所有数据点都属于回归线,但它仍然表示数据太紧密而无法使用。
在技术分析中,具有高度共线性的指标具有非常相似的结果。
结构多重共线性
当您使用数据创建新功能时,会发生结构多重共线性。例如,如果您收集了数据,然后将其用于执行其他计算并对结果进行回归,则结果将是相关的,因为它们彼此衍生。
这是在投资分析中看到的多重共线性的类型,因为相同的数据用于创建不同的指标。
基于数据的多重共线性
设计较差的实验或数据收集过程,例如使用观察数据,通常会导致基于数据的多重共线性,其中数据由于收集方式的性质而与数据相关。某些或全部变量是相关的。
用于创建指标的库存数据通常是从历史价格和交易量中收集的,因此由于收集方法不佳而导致的多共线的机会很小。
投资中的多重共线性
对于投资,多重共线性在执行时是一个普遍的考虑因素技术分析预测安全的未来价格变动,例如股票或商品未来。
市场分析师想要避免使用共线的技术指标,因为它们基于非常相似或相关的输入;这里提到的输入不是数据本身,而是如何操纵它以实现结果。
相反,该分析必须基于明显不同的指标,以确保从独立的分析观点分析市场。例如,动量和趋势指标共享相同的数据,但是它们不会完全是多重共线的,甚至表现出很高的多重共线性。根据数据的操纵方式,这两个指标具有不同的结果。
快速事实
大多数投资者不必担心指标计算背后的数据和技术,这足以了解多重共线性以及如何影响分析。
如何修复多重共线性
消除多重共线性问题的最常见方法之一是首先识别共线的独立预测因子,然后删除其中一个或多个。通常,在统计数据中,运行差异通胀因子计算以确定多重共线性的程度。修复多重共线性的另一种方法是在不同条件下收集更多数据。
在投资分析中
著名的技术分析师约翰·布林格(John Bollinger)布林乐队指标写道:“成功使用技术分析的基本规则需要在指标中避免多重共线性”。为了解决该问题,分析师避免使用相同类型的两个或多个技术指标。相反,他们使用一种类型的指标分析了安全性动量指示器,然后使用不同类型的指标(例如趋势指标)进行单独的分析。
TradingView
例如,随机性, 这相对强度指数(RSI)和Williams%R(WM%R)都是依赖相似输入并且可能产生相似结果的所有动量指标。在上图中,随机和wm%r是相同的,因此将它们一起使用并没有太多显示。在这种情况下,最好删除其中一个指示器,并使用不跟踪动量的指标。在下图中,随机显示了价格动力,而布林乐队的宽度则显示了价格在价格移动之前的价格合并。
TradingView
一个人如何处理多重共线性?
为了减少统计模型中发现的多重共线性量,可以删除确定为最划线的特定变量。您也可以尝试结合或转换有问题的变量以降低其相关性。如果那不起作用或无法实现,则有一些修改的回归模型可以更好地处理多重共线性,例如脊回归,主成分回归或部分最小二乘回归。在库存分析中,最好的方法是选择不同类型的指标。
回归中的多重共线性是什么?
多重共线性描述了变量之间的关系,使它们相关。具有多重共线性的数据为分析带来了问题,因为它们不是独立的。
您如何解释多重共线性结果?
当可变通胀因子超过五个时,数据将具有高度共线性。如果VIF在一到五之间,则变量适度相关,如果等于一个,则它们不相关。在技术分析中,指标通常相同。
什么是完美的多重共线性?
当模型中两个自变量之间存在精确的1:1对应关系时,存在完美的多重共线性。这可以是+1.0或-1.0的相关性。
为什么多重共线性是问题?
多重共线性是一个问题,因为它会产生不太可靠的回归模型结果。这是由于更广泛的置信区间(更大标准错误)可以降低统计意义回归系数。在股票分析中,它可能导致有关投资的错误印象或假设。
底线
每当一个自变量与多个回归方程中的一个或多个独立变量高度相关时,就存在多重共线性。多重共线性是一个问题,因为它将使统计推断降低。但是,方差通胀因子(VIF)可以提供有关哪些变量或变量冗余的信息,因此可以删除具有高VIF的变量。
当使用技术分析时,多重共线性成为问题,因为有许多指标以相同的方式呈现数据。为了防止这种情况,最好使用无法衡量同一趋势的指标。