什麼是相關係數?
相關係數是A的強度的統計度量線性關係在兩個變量之間。它的值範圍從-1到1。 -1的相關係數描述了一個完美消極的, 或者逆,相關性,一個系列中的價值作為另一個下降的值,反之亦然。係數為1顯示完美正相關,或直接關係。相關係數為0表示沒有線性關係。
相關係數用於科學和金融中,以評估兩個變量,因素或數據集之間的關聯程度。例如,由於高油價對原油生產商有利,因此人們可能會假設石油價格與石油股票遠期收益之間的相關性是很大的。計算相關性這些變量的係數基於市場數據,揭示了漫長時期的中等和不一致的相關性。
關鍵要點
- 相關係數用於評估數據變量之間關聯的強度。
- 最常見的稱為“皮爾遜相關係數”,測量了兩個變量之間線性關係的強度和方向。
- 值始終範圍從-1的 - 完全逆的或負的關係到1的正相關關係1。
- 值或接近零的值表示沒有線性關係或非常弱的相關性。
- 發出有意義關聯所需的係數值取決於應用程序。相關性的統計顯著性可以從相關係數和样本中的數據點數量(假設正常的人口分佈)中計算出來。
了解相關係數
不同類型的相關係數用於根據比較數據的特性來評估相關性。到目前為止,最常見的是皮爾遜係數,被稱為“皮爾森的R,,,,透明 它可以衡量兩個變量之間線性關係的強度和方向。
Pearson係數使用數學統計公式來測量組合兩個變量的數據點(一個數據序列的值在X軸上繪製的一個數據序列的值以及Y軸上其他系列的相應值)近似於最佳擬合線。最佳擬合線可以通過回歸分析確定。
重要的
Pearson係數是最常見的相關係數,無法評估變量之間的非線性關聯,或者或在依賴變量和自變量之間進行區分。
係數越遠,無論是正還是負數,擬合越好,相關性越大。 -1的值(對於負相關)和1(對於正相關)描述了完美的擬合,其中所有數據點都在直線上對齊,表明變量完全相關。
換句話說,這種關係是如此可預測,以至於一個變量的值可以從另一個變量的值確定。相關係數越接近零,相關性越弱,直到完全不存在線性關係為零。
基於相關係數值的相關強度的評估因應用而異。在物理和化學中,相關係數應低於-0.9或高於0.9,以使相關性被認為是有意義的,而在社會科學中,閾值可能高達-0.5且低至0.5。
用於從採樣,確定統計顯著性取決於p值,這是根據數據樣本的大小以及係數的值計算得出的。
相關係數的公式
要計算Pearson相關性,請先確定每個變量標準偏差以及協方差他們之間。相關係數是協方差除以兩個變量標準偏差的乘積。
rxy=一個x一個y這((x,,,,y)在哪裡:rxy=皮爾遜產品矩相關係數這((x,,,,y)=變量的協方差x和y一個x=標準偏差x一個y=標準偏差y
標準偏差是數據分散數據的量度。協方差表明兩個變量是否傾向於沿相同的方向移動,而相關係數則在歸一化量表上從-1到1衡量該關係的強度。
上面的公式可以詳細說明
r=((n×∑((x2)- ∑((x)2)×((n×∑((y2)- ∑((y)2)n×((∑((x,,,,y)- ((∑((x)×∑((y)))在哪裡:r=相關係數n=觀察數
相關統計和投資
相關係數在評估和管理投資風險。例如,現代投資組合理論建議多元化可以減少投資組合回報的波動,從而遏制風險。歷史回報之間的相關係數可以指示是否向投資組合增加投資將改善其多元化。
相關計算也是因素投資,一種基於與超額回報相關的因素來構建投資組合的策略。同時,定量交易者使用歷史相關性和相關係數預測證券價格的近期變化。
皮爾森相關係數的局限性
相關性並不意味著俗語的因果關係,而皮爾森係數無法確定相關變量之一是否取決於另一個。
相關係數也不顯示因變量中變異的比例歸因於自變量。這是由確定係數,也稱為“R平方,”僅僅是相關係數平方。
相關係數也沒有描述最佳擬合線的斜率;可以用最小二乘法在回歸分析中。
Pearson相關係數不能用於評估非線性關聯或由採樣數據引起的不受正態分佈的相關性。它也可能會被異常值扭曲 - 數據點遠遠超出了分佈的散點圖。
這些關係可以使用非參數方法進行分析,例如Spearman的相關係數,Kendall等級相關係數或多choric相關係數。
在Excel中找到相關係數
有幾種方法可以計算Excel中的相關性。最簡單的方法是在相鄰列中輸入兩個數據系列,並使用內置的相關公式:
如果要在一系列數據集中創建相關矩陣,Excel具有數據分析插件。要使用它,您必須首先啟用數據分析工具PAK。這可以通過單擊“文件”,然後是“選項”來完成,該選項應打開Excel選項對話框。在框中,單擊“加載程序”,然後在“管理”下拉列表中選擇“ Excel add-ins”,然後單擊“ GO”。這將導致附加框出現。檢查復選框以獲取“分析Takepak”,然後單擊“確定”。啟用過程現在應該完成。
要使用數據分析插件,請單擊“數據”功能區,然後選擇“數據分析”,該插件應打開一個框。在框中,單擊“相關”,然後單擊“確定”。現在,相關框將打開,您可以手動或選擇相關單元格輸入輸入範圍。
在這種情況下,我們的列是標題為“第一行”框“標籤”,因此Excel知道將其視為標題。然後,您可以選擇在同一張紙上或新紙上輸出。
擊打Enter將產生相關矩陣。您可以添加一些文本和條件格式以清理結果。
R和R2相同嗎?
分析係數時,否,R和R2不一樣。 R表示Pearson相關係數的值,該係數用於注意變量之間的強度和方向,而R2表示確定係數,該確定係數決定了模型的強度。
您如何計算相關係數?
相關係數是通過確定變量的協方差並將該數字除以這些變量標準偏差的乘積來計算的。
相關係數如何用於投資?
相關係數在投資組合風險評估和定量交易策略。例如,一些投資組合經理將監視其持有的相關係數,以限制投資組合的波動性和風險。
底線
相關係數描述了一個變量如何相對於另一個變量移動。正相關表明兩者沿相同方向移動,值為1表示完美的正相關。 -1的值顯示出完美的負相關或逆相關性,而0表示不存在線性相關。