什么是统计意义?
统计显着性是一个结论,一组数据不是机会的结果,而可以归因于特定原因。统计意义对于任何依赖于数据分析(包括经济学,金融,投资,医学,物理学和生物学)的专业人员至关重要。
统计显着性可以被认为是强的或弱的。强大的统计意义支持了这样的结论,即结果是真实的,不是运气或机会引起的。
关键要点
- 统计显着性衡量通过测试或实验产生的数据结果可以归因于特定原因的可能性。
- 统计显着性可能很高或低。
- 高度的统计意义表明,观察到的关系不太可能是由于机会。
了解统计意义
研究人员通常与样品较大的人口,而不是整个人口。样本必须代表人口,以避免结果偏见。
在包括经济学在内的大多数科学中,如果它具有信心水平95%(有时99%)。
统计显着性的计算(称为显着性测试)会遇到一定程度的错误。即使数据似乎有牢固的关系,研究人员也必须考虑到由于随机机会或采样错误。
样本量是具有统计显着性的重要组成部分。较大的样品不太容易发生漏斗。只有随机选择,代表样品应用于显着性测试。
一个人可以接受事件的水平具有统计学意义被称为显着水平。
测量p值
研究人员使用称为p值或概率值,以确定统计显着性。
如果p值低于显着性水平,则结果在统计上是显着的。
p值是数据样本的均值和标准偏差的函数。它表明给定统计结果的概率是假设单独的机会是结果的原因。如果这种概率很小,研究人员可以得出结论,可能是对观察到的数据负责的。
显着性水平的相反,计算为1减去显着性水平,是置信度。它表明统计结果没有偶然或通过采样误差发生的信心程度。
习惯信心许多统计测试中的水平为95%,导致习惯显着性水平或P值为5%。
快速事实
“ P黑客”是详尽比较许多不同数据集以寻找具有统计学意义的结果的做法。这种做法之所以皱眉,是因为P-Hackers正在寻求支持他们偏爱结果的研究。
特殊考虑
统计意义并不总是表示实际意义,这意味着结果不一定应用于现实世界。
而且,结果在统计上具有重要意义的事实并不意味着它是不是机会的结果是,情况不太可能。
仅仅因为两个数据系列彼此之间存在很强的相关性并不意味着因果关系。例如,演员尼古拉斯·凯奇(Nicolas Cage)明星在给定年中的电影数量可能与游泳池中意外溺水的数量非常相关。相关性是虚假由于没有理论因果主张。
依靠过去
过去的数据(无论是否具有统计意义),是否无法可靠地预测未来的状况。
投资分析中的问题很明显。基于股票过去性能的定价模型可用于预测选定时间范围内的运动。面对以后的事件时,它可能会崩溃。
作为标准,统计意义可以帮助投资者选择一种资产定价模型,而不是其他资产定价模型。
统计显着性测试的类型
根据正在进行的研究,使用了几种显着性测试。例如,可以针对一个,两个或更多的数据示例用于平均,差异,比例,配对或未配对的数据或不同的数据分布的测试。
根据可用数据的类型,还有不同的方法进行显着测试。罗纳德·费舍尔(Ronald Fisher)以制定最灵活的方法之一而被认为是p<0.05。
由于大多数工作都可以在收集数据后完成,因此该方法在短期或临时研究项目中仍然很受欢迎。
为了以费舍尔的方式为基础,杰里·尼曼(Jerzy Neyman)和埃贡·皮尔森(Egon Pearson)最终开发了另一种方法。该方法需要在收集数据之前进行更多的工作,但是它允许研究人员以控制得出错误结论的可能性的方式设计其研究。
零假设检验
统计显着性用于零假设测试,研究人员试图通过拒绝其他解释来支持其理论。尽管该方法有时被误解,但它仍然是医学,心理学和其他领域中最流行的数据测试方法。
最常见的零假设是所讨论的参数等于零(通常表明变量对感兴趣的结果的影响为零)。
如果研究人员以95%或更高的信心拒绝零假设,他们可以声称观察到的关系具有统计学意义。零假设也可以测试两种或多个替代治疗的效果相等。
重要的
高水平的统计意义并不能证明假设是对还是错。统计显着性衡量观察到的结果可能发生的可能性,假设无效假设是正确的。
拒绝零假设,即使很高的统计显着性永远不会证明某些东西只能为现有假设增加支持。另一方面,未能拒绝零假设通常是驳斥假设的理由。
此外,效果在统计上可能很重要,但影响很小。例如,在浴室中使用两层厕纸的公司具有更高的生产力,但是每个工人的绝对生产力的提高可能是微不足道的。
您如何计算统计意义?
统计显着性是使用累积分布函数,这可以告诉您某些结果的概率,假设零假设是正确的。如果研究人员确定这种概率非常低,则可以消除零假设。
您如何在Excel中表现出统计学意义?
Microsoft Excel具有内置功能,可以执行统计显着性测试所需的一些计算。要执行卡方检验,请type = chisq.test(cuthrange,teedual range),其中参数为单元格。要测量p值,请使用函数= t.test。
统计意义如何衡量?
统计显着性用于评估基于观察数据之间两个变量之间存在关系的可能性。
与普遍的误解相反,这并不能衡量两个变量因因果关系相关的概率。相反,它衡量观察到的数据可能发生的概率不两个变量之间的关系。
尽管这还不足以建立因果关系,但具有高度统计意义的重复测试可以帮助研究人员消除其结果被随机蒙上的可能性。
底线
统计显着性用于评估观察到的关系可能是随机机会的结果的可能性。当一个观察结果显示两个变量之间存在弱关系或具有少数数据点时,据说它在统计上是微不足道的。但是,当有更多数据点显示出更一致的关系时,相关性被认为具有统计学意义。
研究人员使用统计意义来评估两个变量可能具有因果关系的可能性。