什麼是四分位數?
四分位數是一個統計術語,它根據數據值以及它們與整個觀測值進行比較,將觀測值分為四個定義的間隔。四分位數分為下四分位數,中值四分位數和上四分位數。
當數據點以越來越多的順序排列時,數據將分為每個數據的25%的四個部分。
關鍵要點
- 四分位數將數據分為三個點(下四分位數,中值和上四分之一),以形成四個數據集組。
- 與數據集的最小值和最大值一起,四分位數將一組觀測值分為四個部分,每個觀測值代表25%的觀測值。
- 四分位數用於計算四分位間範圍,這是中位數周圍變異性的量度。
了解四分位數
要了解四分位數,重要的是要了解中位數作為中心趨勢的度量。統計中的中位數是一組數字的中間值。這是數據的一半恰好位於中心值以下和之上的點。
中位數是對位置的強大估計器,但沒有說明其價值兩側的數據如何傳播或分散。這就是四分位數的階段。四分位數通過將分佈分為四組來測量中值上方和下方的值的傳播。
它們分為25%數據的四個部分,第二組和第三組代表四分位間範圍。
就像中位數將數據劃分為一半,使得50%的測量位於中值下方,而50%的測量位於其上方一樣,四分位數將數據分解為四分之一,以使25%的測量值小於下四分位數,50%小於中位數,而75%的測量值小於上四分之一。
有三個四分位數值:下四分位數,中值和上四分位數 - 將數據設置分為四個範圍,每個範圍包含25%的數據點:
- 第一個四分位數:最小值和第一個四分位數之間的數據點集。
- 第二個四分之一:下四分之一之間的數據點集。
- 第三四分之一:中間四分位數之間的數據集。
- 第四四分之一:上四分位數與數據集的最大值之間的數據點集。
在電子表格中計算四分位數
假設您在19名學生中的數學分數分佈。您需要連續以升序順序輸入電子表格(您也可以使用列):
1 | 學生 | 一個 | b | c | d | e | f | g | h | 我 | j | k | l | m | n | o | p | 問 | r |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2 | 分數 | 59 | 60 | 65 | 65 | 68 | 69 | 70 | 72 | 75 | 75 | 76 | 77 | 81 | 82 | 84 | 87 | 90 | 95 |
使用中位功能獲得中位數:
- =中值(A2:R2)
然後,使用四分位數函數返回每個四分位數的值,其中該函數中的第二個變量是您正在計算的四分位數:
- =四分位數(A2:R2,1)
- =四分位數(A2:R2,2)
- =四分位數(A2:R2,3)
在此示例中,您應該最終以每個四分位數的值。無需計算第四四分位數,因為它是數據集中的最後一個值:
- 中值= 75
- Q1 = 68.25
- Q2 = 75
- Q3 = 81.75
您可以看到第一個四分位數包含59至68.5之間的得分,第二個四分位數分數在68.5和75之間。第三四分位數包含75至81.75之間的分數。它可以幫助您可視化:
手動計算四分位數
四分位數手動計算需要更多的努力,因為涉及公式。使用與電子表格中相同的值示例:
- 59、60、65、65、68、69、70、72、75、75、76、77、81、82、84、84、87、90、90、95、98
使用以下公式,您可以計算每個四分位數:
- 第一個四分位數(q1)=(n + 1)x 1/4
- 第二四分位數(Q2)或中位數=(n + 1)x 2/4
- 第三四分位數(q3)=(n + 1)x 3/4
在哪裡n是數據集中的整數數量,結果是序列數據集中的數字位置。所以:
- 第一個四分位數(Q1)= 20 x 1/4 = 5
- 第二四分位數(Q2)= 20 x 2/4 = 10
- 第三四分位數(Q3)= 20 x 3/4 = 15
在這裡,我們的Q1(第五)值為68,Q2(中位數和中位數)為75,Q3(第15)值為84。結果與電子表格結果略有不同,因為電子表格的計算方式不同。然後,您的圖形看起來像這樣:
四分位數還用於計算四分位間範圍,這是中位數周圍變異性的量度。四分位數僅是第一四分位數和第三四分位數之間的範圍。
在此示例中,您的四分位數範圍為68至84(數據集中的第十個值的第五值)。
特殊考慮
如果Q1的數據點離中位數遠遠超過Q3與中位數相比,您可以說數據集的較小值之間的分散體比較大的值之間的分散體更大。如果Q3距離Q2遠比Q1遠離中位數,則適用同樣的邏輯。這稱為四分位數偏度。
要考慮的另一個方面是是否存在偶數數據點。在這種情況下,您將使用中間兩個數字的平均值獲取中位數。在上面的示例中,如果您有20名學生而不是19歲,那麼他們的分數中位數將是算術平均值第十和第十一個數字。
您如何找到數據集的下四分位數?
最好的方法是使用電子表格和四分位數函數。例如,函數“ = Quartile(A1:A53,1)”返回數據集的第一個(下)四分位數。
您如何找到數據集的上四分位數?
電子表格和四分位數函數是找到上四分位數的最快方法。例如,函數“ = Quartile(A1:A53,3)”返回數據集的第三個(上)四分位數。
數據集的四分之一範圍是什麼?
四分位數範圍是數據集中測量值的中間50%,換句話說,上四分之一四分位數之間的數據范圍。這更多統計上有意義的是使用全部數據范圍,因為它省略了可能的異常值。
底線
四分位數是將數據集列表分為四分之一的值,從而導致較低,中和上四分位數。四分位數的目的是給分佈形狀,主要表明分佈是否是偏見,可以用來確定一個基金的表現。