II型错误是在假设检验的上下文中使用的统计术语,该术语描述了当人们无法拒绝实际上是错误的零假设时发生的错误。 II型误差会产生假阴性,也称为遗漏的误差。
II型误差可以与I型误差进行对比,研究人员错误地拒绝了真实的空假设。
关键要点
- II型误差定义为错误地拒绝零假设的概率,而实际上它不适用于整个人群。
- II型错误本质上是假负。
- 通过创建更严格的标准来拒绝零假设,尽管这增加了假阳性的机会,否则II型误差的可能性就较小。
- 样本量,真实的人口大小和预设α水平会影响错误的风险大小。
- 分析师需要权衡I型错误与I型错误的可能性和影响。
了解II型错误
在检验统计假设时,有两种主要类型:无效假设和替代假设。零假设通常表明,任何正在评估的数据都没有群体或变量之间的关系之间的差异。替代假设将陈述研究人员的期望(他们的主张),例如他们期望在变量之间找到的东西。像其他所有人一样,研究人员可能会在假设中犯错。
II型错误,也称为第二类错误或Beta错误的错误,确认了应该拒绝的无效假设,例如,尽管它们是相关的,但声称两个变量没有相关。研究人员在这里不拒绝零假设,在此处犯了II型错误 - 在上一个示例中,不拒绝研究完成后两个变量无关的想法,并且被证明是错误的。
通过创建更严格的标准来拒绝零假设,可以减少产生II型错误的可能性(H0)。例如,如果分析师正在考虑任何属于95%的+/-边界的东西置信区间由于统计上的微不足道(负面结果),然后将其容忍度降低到+/- 90%,然后缩小界限,您将获得较少的负面结果,从而减少假阴性的机会。
但是,采取这些步骤倾向于增加遇到I型错误的机会,这是一个假阳性结果。进行假设检验时,应考虑制作I型错误或II型错误的概率或风险。
重要的
减少遇到II型错误的机会所采取的步骤往往会增加I型错误的概率。
类型I错误与II型错误
II型错误与I型I错误之间的差异是,I型错误在true时拒绝零假设(即,误报)。犯下I类错误的概率等于意义水平这是为假设检验设定的。因此,如果显着性水平为0.05,则可能发生I型错误的机会5%。
犯下II型误差的可能性等于一个减去测试的功率,也称为beta。可以通过增加测试的力量来提高样本大小,降低了犯下II型误差的风险。
快速事实
作为报告分析的一部分,一些统计文献将包括整体显着性水平和II型错误风险。例如,在治疗脊髓损伤的2021年外泌体的荟萃分析的总体显着性水平为0.05,II型误差风险为0.1。
II型错误的示例
假设一家生物技术公司想比较其两种药物用于治疗糖尿病的有效性。零假设(h0)指出,两种药物同样有效,是公司希望拒绝使用该药物的假设一尾测试。替代假设(h一个)指出,两种药物并不同等有效。替代假设是自然的状态,通过拒绝零假设来支持。
生物技术公司实施大型临床试验在3,000例糖尿病患者中比较治疗。该公司将3,000名患者随机分为两个同等大小的组,使一组治疗方法和另一组治疗。它选择了0.05的显着性水平,这表明它愿意接受5%的机会,它可能会拒绝零假设(I型错误)。
假设Beta计算为0.025,即2.5%。因此,犯下II型误差的概率为97.5%。如果两种药物不等,则应拒绝原假设。但是,如果生物技术公司在药物不同样有效时不会拒绝零假设,则会发生II型误差。
像我5岁那样解释
考虑以下问题:
眼睛的颜色确定人类在黑暗中的看法如何?
您将从这个问题中形成两个假设:
- h0(null):年龄不会影响人类在黑暗中的看法
- h一个(替代):年龄确实会影响人类在黑暗中的看法
然后,您将通过使用统计上大量的人类进行实验来着手回答这个问题。一旦您记录了人口的数据,就可以对其进行分类并分析,并得出有关它的结论。
相当普遍的知识是,年龄越大,由于许多因素,在黑暗中看到的难度越难,其中之一是眼睛的杆细胞随着年龄的增长而变得较弱。如果您从数据中得出结论,年龄不会影响人类在黑暗中的看法,那么您未能拒绝虚假的空假设 - II型错误。
如果出于某种原因,年龄实际上并不影响人类在黑暗中的看法,但是您的数据表明确实如此,您可能会拒绝真正的零假设 - I型I错误。
如何记住I型和II型错误之间的区别?
如果拒绝了人群实际上是正确的,则会发生I型错误。将这种错误视为假阳性。 II型错误,不拒绝虚假的空假设,可以视为假阴性。
您如何找到II型错误?
如果测试的统计能力太低,则通常会引起II型错误。统计功率越高,避免错误的机会就越大。通常建议在进行任何测试之前将统计功率设置为至少80%。
您如何控制II型错误?
您可以通过增加研究的样本量来降低II型误差的机会。随着真实种群效应大小的增加,II型误差的可能性也应减少。此外,研究设定的预设α水平会影响风险的幅度。随着Alpha水平集的降低,II型误差的风险增加。
底线
在统计数据中,II型错误正在接受应拒绝的零假设。如果在统计测试中没有足够的功率,可能会发生II型错误,通常是由于样本量太小而产生的。增加样本量可以帮助减少犯下II型误差的机会。