什么是四分位数?
四分位数是一个统计术语,它根据数据值以及它们与整个观测值进行比较,将观测值分为四个定义的间隔。四分位数分为下四分位数,中值四分位数和上四分位数。
当数据点以越来越多的顺序排列时,数据将分为每个数据的25%的四个部分。
关键要点
- 四分位数将数据分为三个点(下四分位数,中值和上四分之一),以形成四个数据集组。
- 与数据集的最小值和最大值一起,四分位数将一组观测值分为四个部分,每个观测值代表25%的观测值。
- 四分位数用于计算四分位间范围,这是中位数周围变异性的量度。
了解四分位数
要了解四分位数,重要的是要了解中位数作为中心趋势的度量。统计中的中位数是一组数字的中间值。这是数据的一半恰好位于中心值以下和之上的点。
中位数是对位置的强大估计器,但没有说明其价值两侧的数据如何传播或分散。这就是四分位数的阶段。四分位数通过将分布分为四组来测量中值上方和下方的值的传播。
它们分为25%数据的四个部分,第二组和第三组代表四分位间范围。
就像中位数将数据划分为一半,使得50%的测量位于中值下方,而50%的测量位于其上方一样,四分位数将数据分解为四分之一,以使25%的测量值小于下四分位数,50%小于中位数,而75%的测量值小于上四分之一。
有三个四分位数值:下四分位数,中值和上四分位数 - 将数据设置分为四个范围,每个范围包含25%的数据点:
- 第一个四分位数:最小值和第一个四分位数之间的数据点集。
- 第二个四分之一:下四分之一之间的数据点集。
- 第三四分之一:中间四分位数之间的数据集。
- 第四四分之一:上四分位数与数据集的最大值之间的数据点集。
在电子表格中计算四分位数
假设您在19名学生中的数学分数分布。您需要连续以升序顺序输入电子表格(您也可以使用列):
1 | 学生 | 一个 | b | c | d | e | f | g | h | 我 | j | k | l | m | n | o | p | 问 | r |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2 | 分数 | 59 | 60 | 65 | 65 | 68 | 69 | 70 | 72 | 75 | 75 | 76 | 77 | 81 | 82 | 84 | 87 | 90 | 95 |
使用中位功能获得中位数:
- =中值(A2:R2)
然后,使用四分位数函数返回每个四分位数的值,其中该函数中的第二个变量是您正在计算的四分位数:
- =四分位数(A2:R2,1)
- =四分位数(A2:R2,2)
- =四分位数(A2:R2,3)
在此示例中,您应该最终以每个四分位数的值。无需计算第四四分位数,因为它是数据集中的最后一个值:
- 中值= 75
- Q1 = 68.25
- Q2 = 75
- Q3 = 81.75
您可以看到第一个四分位数包含59至68.5之间的得分,第二个四分位数分数在68.5和75之间。第三四分位数包含75至81.75之间的分数。它可以帮助您可视化:
手动计算四分位数
四分位数手动计算需要更多的努力,因为涉及公式。使用与电子表格中相同的值示例:
- 59、60、65、65、68、69、70、72、75、75、76、77、81、82、84、84、87、90、90、95、98
使用以下公式,您可以计算每个四分位数:
- 第一个四分位数(q1)=(n + 1)x 1/4
- 第二四分位数(Q2)或中位数=(n + 1)x 2/4
- 第三四分位数(q3)=(n + 1)x 3/4
在哪里n是数据集中的整数数量,结果是序列数据集中的数字位置。所以:
- 第一个四分位数(Q1)= 20 x 1/4 = 5
- 第二四分位数(Q2)= 20 x 2/4 = 10
- 第三四分位数(Q3)= 20 x 3/4 = 15
在这里,我们的Q1(第五)值为68,Q2(中位数和中位数)为75,Q3(第15)值为84。结果与电子表格结果略有不同,因为电子表格的计算方式不同。然后,您的图形看起来像这样:
四分位数还用于计算四分位间范围,这是中位数周围变异性的量度。四分位数仅是第一四分位数和第三四分位数之间的范围。
在此示例中,您的四分位数范围为68至84(数据集中的第十个值的第五值)。
特殊考虑
如果Q1的数据点离中位数远远超过Q3与中位数相比,您可以说数据集的较小值之间的分散体比较大的值之间的分散体更大。如果Q3距离Q2远比Q1远离中位数,则适用同样的逻辑。这称为四分位数偏度。
要考虑的另一个方面是是否存在偶数数据点。在这种情况下,您将使用中间两个数字的平均值获取中位数。在上面的示例中,如果您有20名学生而不是19岁,那么他们的分数中位数将是算术平均值第十和第十一个数字。
您如何找到数据集的下四分位数?
最好的方法是使用电子表格和四分位数函数。例如,函数“ = Quartile(A1:A53,1)”返回数据集的第一个(下)四分位数。
您如何找到数据集的上四分位数?
电子表格和四分位数函数是找到上四分位数的最快方法。例如,函数“ =四分位数(A1:A53,3)”返回数据集的第三个(上)四分位数。
数据集的四分之一范围是什么?
四分位数范围是数据集中测量值的中间50%,换句话说,上四分之一四分位数之间的数据范围。这更多统计上有意义的是使用全部数据范围,因为它省略了可能的异常值。
底线
四分位数是将数据集列表分为四分之一的值,从而导致较低,中和上四分位数。四分位数的目的是给分布形状,主要表明分布是否是偏见,可以用来确定一个基金的表现。