自由度是多少?
自由度是在数据样本中可能会有所不同的逻辑独立值的最大数量。自由度是通过从数据样本中的项目数量中减去一个来计算的。
关键要点
- 自由度是指在数据样本中可能会有所不同的逻辑独立值的最大数量。
- 自由度是通过从数据样本中的项目数量中减去一个来计算的。
- 1800年代初,数学家和天文学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)的作品在1800年代初期就提到了最早的自由度概念。
- 在统计数据(例如卡方)中,通常以各种形式的假设检验来讨论自由度。
- 自由程度可以描述管理层必须做出决定另一个变量结果的决定。
了解自由度
自由度是可以在统计分析中估算的自变量的数量,并告诉您在必须进行约束之前可以随机选择多少个项目。
在数据集中,可以随机选择一些初始数字。但是,如果数据集必须汇总到特定的总和或意思是,例如,数据集中的数字受到限制以评估数据集中所有其他值的值,然后满足集合要求。
自由度的例子
示例1: 考虑一个由五个正整数组成的数据样本。五个整数的值必须平均六个。如果数据集中的四个项目为{3、8、5和4},则第五个数字必须为10。由于可以随机选择前四个数字,因此自由度为四个。
示例2:考虑一个由五个正整数组成的数据样本。这些值可能是任何数字,它们之间没有已知的关系。换句话说,所选数字没有任何限制和局限性。因为可以随机选择所有五个数字,并且没有局限性,因此自由度为五。
示例3:考虑一个由一个整数组成的数据样本。该整数必须很奇怪。由于数据集中的单个项目有限制,因此自由度为零。
自由度公式
确定自由度的公式是:
df=n- 1在哪里:df=自由度n=样本量
例如,想象一下选择10名棒球运动员的任务,其平均击球平均为.250。构成我们数据集的玩家总数是样本量,因此n = 10。在此示例中,可以随机选择9(10-1)棒球运动员,第10棒球运动员的特定击球平均值可以遵守.250击球平均约束。
重要的
具有多个参数或关系的自由度的一些计算使用公式df = n -p,其中p是不同参数或关系的数量。例如,在2个样本t检验中,使用n-2,因为有两个参数要估计。
应用自由度
在统计中,自由度定义了使用的T分布形状t检验计算p值时。根据样本量,不同程度的自由度将显示不同的T分布。当理解卡方统计量的重要性和零假设的有效性时,计算自由度至关重要。
自由度在统计数据之外还具有概念应用。考虑一家决定购买原材料的公司制造业过程。该公司在此数据集中有两个项目:要获取的原材料数量和原材料的总成本。
该公司自由地决定了这两个项目之一,但他们的选择将决定另一个项目的结果。因为它只能自由选择两者之一,因此在这种情况下它具有一种自由度。如果公司决定原材料的数量,则无法决定所花费的总金额。通过设定总额,公司的金额可能有限原料它可以获取。
卡方测试
有两种不同的卡方测试:独立的考验,提出了一个关系问题,例如“性别和SAT分数之间有关系?”;和合适的测试,它询问了“如果硬币被扔100次,它会出现50次并尾巴50次吗?”
对于这些测试,利用自由度来确定是否a零假设可以根据实验中的变量和样本总数拒绝。例如,在考虑学生和课程选择时,样本量为30或40名学生可能不足以产生重要的数据。使用400或500名学生的样本量从研究中获得相同或相似的结果是更有效的。
t检验
执行一个t检验,您必须计算样品的t值,并将其与临界值进行比较。临界值将有所不同,您可以通过使用数据集的t分布来确定正确的临界值。
具有较低自由度的集合具有较高的极值可能性,并且较高的自由度(例如样本量至少为30)将更接近正态分布曲线。较小的样本量将与较小的自由度相对应,并导致fater t分布尾巴。
在上面的示例中,许多情况可以用作1个样本t检验。例如,“示例1”,其中选择了五个值,但必须加起来特定平均值,可以定义为1个样本t检验。这是因为在变量上只有一个约束。
自由度的历史
1800年代初期,最早,最基本的自由度概念在数学家和天文学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)的作品中交织在一起。英国统计学家威廉·西利·戈塞特(William Sealy Gosset)在1908年在Biometrika发表在Biometrika上的文章“可能的错误”中,首先在Biometrika上以笔名保留他的匿名性,首先是由英国统计学家威廉·西利·戈塞特(William Sealy Gosset)阐述的。
在他的著作中,戈塞特没有专门使用“自由度”一词。他确实解释了整个开发最终被称为“学生的”的概念T分布。“这个词直到1922年才流行。英国生物学家和统计学家罗纳德·费舍尔(Ronald Fisher)开始使用“自由度”一词,当时他发布了有关开发卡方的工作的报告和数据时。
您如何确定自由度?
在确定一组数据的平均值时,将计算自由度的计算,为设置减去的项目数量。这是因为该集合中的所有项目都可以随机选择,直到保留为止。该项目必须符合给定的平均值。
自由程度告诉您什么?
自由度告诉您,可以在没有约束的情况下选择一个集合中的几个单元,以仍然遵守给定的规则监督该集合。例如,考虑一组五个项目,这些项目的平均值为20。自由度,请告诉您可以随机选择多少个项目,然后才能进行约束。在此示例中,一旦选择了前四个项目,您将不再有自由可以随机选择一个数据点,因为您必须将“强制平衡”达到给定的平均值。
自由程度永远是1吗?
自由度始终是给定集合1中的单元数量。它总是减去一个单元,因为如果将参数放在数据集上,则最后一个数据项必须是特定的,因此所有其他点都符合该结果。
底线
一些统计分析过程可能需要指示在分析中可能会有所不同以满足约束要求的独立值的数量。该指示是自由度,样本量中的单位数量可以随机选择,然后才能选择特定值。