什么是拟合优度?
一词拟合优度是指统计检验,该测试决定了样本数据如何适合来自人群的分布正态分布。简而言之,它假设样本是偏斜还是代表您期望在实际人群中找到的数据。
拟合优度确定了观察到的值与在正态分布情况下模型的期望之间的差异。有多种方法可以确定拟合优度,包括卡方。
关键要点
- 拟合优度是一项统计测试,该测试试图确定一组观察到的值是否匹配适用模型下的预期值。
- 他们可以向您展示您的样本数据是否适合来自正态分布的人群的一组预期数据。
- 有多种类型的合适性测试,但最常见的是卡方检验。
- 卡方检验确定分类数据之间是否存在关系。
- Kolmogorov-Smirnov测试确定样本是否来自人口的特定分布。
了解拟合优度
拟合优点测试是对观察值进行推断的统计方法。例如,您可以确定样本组是否真正代表了整个人口。因此,他们确定实际值与模型中预测值的关系。当在决策中使用时,合适的测试使得更容易预测趋势和未来的模式。
如上所述,有几种类型的合适性测试。它们包括最常见的卡方检验以及Kolmogorov-Smirnov测试和Shapiro-Wilk测试。测试通常使用计算机软件进行。但是统计学家可以使用针对特定类型的测试的公式进行这些测试。
要进行测试,您需要一个特定变量,并假设其分布方式。您还需要一个具有清晰和明确值的数据集,例如:
- 观察到的值,这些值是从实际数据集得出的
- 预期值,这些值是从提出的假设中获取的
- 集合中的类别总数
重要的
拟合优点测试通常用于测试残差的正态性或确定是否从相同的分布中收集了两个样本。
建立alpha水平
为了解释合适的测试,统计学家建立一个alpha级别很重要,例如p值对于卡方检验。 p值是指使结果接近观察到的结果的极端的概率。这是假设零假设是正确的。零假设断言,变量之间没有关系,而替代假设假设存在关系。
相反,测量观测值的频率并随后与期望值和自由度计算卡方。如果结果低于α,则无效假设无效,表明变量之间存在关系。
合适的测试类型
卡方测试
x2=我=1∑k((o我- e我)2/e我
这卡方测试这也称为独立性的卡方检验,是一种推论统计方法,该方法测试了基于随机样本对人群提出的索赔的有效性。
仅用于分为类(bin)的数据,它需要足够的样本量来产生准确的结果。但这并不表示关系的类型或强度。例如,它无法得出结论,这种关系是正面还是负面。
要计算卡方拟合优度,请设置所需的α显着性水平。因此,如果您的置信度为95%(或0.95),则Alpha为0.05。接下来,确定要测试的分类变量,然后定义有关它们之间关系的假设陈述。
快速事实
为了获得独立性的卡方检验,变量必须相互排斥。 CHI拟合测试不应用于连续的数据。
Kolmogorov-Smirnov(KS)测试
d=1≤我≤n最大限度((f((y我)- n我- 1,,,,n我- f((y我))
Kolmogorov-Smirnov(KS)测试以俄罗斯数学家Andrey Kolmogorov和Nikolai Smirnov的名字命名,是一种统计方法,它确定样本是否来自人群中的特定分布。
该测试,建议大型样品(例如,2000年以上)是非参数。这意味着它不依赖任何分布有效。目的是证明零假设,即正态分布的样本。
像卡方一样,它使用了无效的替代假设和α显着性水平。无效表示数据遵循人群中的特定分布,替代表明数据未遵循人群中的特定分布。 α用于确定测试中使用的临界值。但是与卡方检验不同,Kolmogorov-Smirnov测试适用于连续分布。
计算出的测试统计量通常表示为D。它确定了零假设是接受还是拒绝。如果d大于临界值阿尔法,零假设被拒绝。如果d小于临界值,则接受零假设。
安德森 - 达林(AD)测试
s=∑我=1nn((2我- 1)[Lnf((y我)+Ln((1- f((yn+1- 我)]]
Anderson-Darling(AD)测试是KS测试的一种变化,但对分布的尾巴有更大的重量。 KS测试对可能发生的差异更敏感,而差异可能更接近分布的中心,而AD测试对在尾巴中观察到的变化更为敏感。由于尾巴风险和“脂肪尾巴”的想法在金融市场中很普遍,因此广告测试可以在财务分析中提供更多的权力。
与KS测试一样,广告测试产生统计量,表示为2,可以将其与零假设进行比较。
Shapiro-Wilk(SW)测试
w=∑我=1n((x我- xˉ)2((∑我=1n一个我((x((我))2,,,,
Shapiro-Wilk(SW)测试确定样品是否遵循正态分布。该测试仅在使用一个带有一个连续数据变量的样品时检查正态性,建议用于2000年的小样本量。
Shapiro-Wilk测试使用了一个称为QQ图的概率图,该图在Y轴上显示了从最小到最大的Y轴上显示两组分位数。如果每个分位数都来自相同的分布,则一系列图是线性的。
QQ图用于估计方差。使用QQ图方差以及人群的估计方差,可以确定样本是否属于正态分布。如果两个方差的商平等或接近1,则可以接受零假设。如果大大低于1,则可以拒绝。
就像上面提到的测试一样,该测试使用alpha并形成两个假设:无效和替代方案。零假设指出样本来自正态分布,而替代假设指出样品不是来自正态分布。
其他合适的测试
除了上面提到的更常见的测试类型外,分析师可以使用的其他许多拟合优点:
- 这贝叶斯信息标准(BIC)是用于在有限模型中选择模型选择的统计度量。 BIC是一个合适的测试,可以平衡模型的复杂性与数据符合数据的优点。
- 这Cramer-von Mises标准(CVM)是一种拟合优点测试,用于评估一组观察到的数据符合假设的概率分布的程度。它通常用于经济学,工程或金融,它基于观察到的数据的累积分布函数和假设的分布。
- 这Akaike信息标准(AIC)是衡量给定数据集统计模型的相对质量的衡量标准,它在模型的优点及其复杂性之间提供了权衡。它基于信息理论,并衡量模型用于近似数据的真实基础分布时丢失的信息量。
- 这Hosmer-Lemeshow测试将二元结果的预期频率与观察到的结果的频率在不同的组或间隔中进行了比较。这些组通常是通过将结果的预测概率分为十组或垃圾箱来形成的。
- Kuiper的测试类似于Kolmogorov-Smirnov检验,但对分布尾巴的差异更为敏感。
- 莫兰的我测试或者莫兰的索引是用于评估数据中空间自相关的统计测试。空间自相关是对变量相似或在空间上相似或不同的程度的度量。
提示
一个非常一般的经验法则是要求拟合优度测试中的每个组至少具有五个数据点。这样可以确保将足够的信息馈入测试以确定分布。
拟合优点测试的重要性
出于多种原因,拟合优点测试在统计学中很重要。首先,它们提供了一种评估的方法统计模型的合适程度一组观察到的数据。运行合适性测试的主要重要性是确定观察到的数据是否与假定的统计模型一致。通过扩展,拟合优点测试可能在不同模型之间选择可能更适合数据的不同模型可能很有用。
合适的测试还可以帮助识别异常值或市场异常这可能会影响模型的拟合度。离群值可能会对模型拟合产生很大的影响,并且可能需要单独删除或分别处理。有时,在将它们集成到分析模型中之前,离群值不容易识别。
合适的测试还可以提供有关数据的可变性和模型的估计参数的信息。该信息对于做出预测和理解所建模的系统的行为可能很有用。基于被馈入模型的数据,可能有必要完善针对正在测试的数据集,计算残差以及潜在极端数据的p值的模型。
合适的测试与独立测试
合适的测试和独立性测试都是用于评估变量之间关系的统计测试。因此,很容易混淆两者。但是,每个都旨在回答不同的问题。
拟合优点测试用于评估一组观察到的数据适合特定概率分布的程度。另一方面,使用独立测试来评估两个变量之间的关系。它用于测试两个变量之间是否存在任何关联。独立测试的主要目的是查看一个变量的变化是否与另一个变量的变化有关。
当研究问题集中在理解两个变量之间以及它们是相关还是独立的情况下,通常会使用独立测试。在许多情况下,独立测试指向两个特定变量(即吸烟会导致肺癌吗?)。另一方面,在整个观察到的数据集中使用拟合优度测试,以评估特定模型的适当性。
拟合的习惯
这是一个假设的例子,以说明拟合优度测试如何有效。
假设一个小型社区体育馆在假设出席人数最高的假设是星期一,星期二和星期六,周三和周四的平均出勤率以及星期五和周日的最低出勤率。根据这些假设,该健身房每天雇用一定数量的工作人员来检查会员,清洁设施,提供培训服务和教学课程。
但是体育馆的经济状况不佳,所有者想知道这些出勤假设和人员配备水平是否正确。所有者决定在六个星期内计算每天的健身参与者人数。然后,他们可以将体育馆的出勤率与观察到的出勤率进行比较,例如,使用卡方拟合测试。
现在他们有了新数据,他们可以确定如何最好地管理健身房并改善盈利能力。
拟合优度是什么意思?
拟合优度是一种统计假设检验,用于查看观察到的数据镜如何预期数据。拟合优点测试可以帮助确定样本是否遵循正态分布,分类变量是否相关,或者随机样本是否来自同一分布。
为什么拟合的善意很重要?
合适的测试有助于确定观察到的数据是否与预期的数据保持一致。可以根据进行假设检验的结果做出决定。例如,零售商想知道哪种产品可吸引年轻人。零售商对年轻人的随机样本进行了调查,以确定哪种产品是首选。他们使用卡方,他们以95%的信心确定产品A和年轻人之间存在关系。基于这些结果,可以确定该样本代表年轻人的人口。零售营销人员可以用它来改革他们的运动。
卡方测试中的合适性是什么?
卡方检验是否存在分类变量之间的关系以及样本是否代表整体。它估计观察到的数据如何反映了预期数据或它们的合适程度。
您如何进行合适的测试?
合适性测试由不同的测试方法组成。测试的目标将有助于确定要使用的方法。例如,如果目标是在相对较小的样本上测试正态性,则Shapiro-Wilk测试可能是合适的。如果要确定样品是否来自人群中的特定分布,将使用Kolmogorov-Smirnov测试。每个测试都使用自己的独特公式。但是,它们具有共同点,例如零假设和意义水平。
底线
合适的测试确定样本数据适合人群的期望程度。从样本数据中,通过差异度量收集观察到的值并将其与计算出的期望值进行了比较。根据您想要的结果,可用的合适性假设测试不同。
选择正确的合适性测试很大程度上取决于您想了解的样本以及样本的大小。例如,如果想知道分类数据的观察值是否与分类数据的预期值匹配,请使用卡方。如果想知道一个小样本是否遵循正态分布,则shapiro-wilk测试可能是有利的。有许多测试可确定合适性。