研究的 p 值是即使与您正在测试的变量没有关系,您的测量也可能发生的概率。
较小的 p 值表明您的观察结果很好地表明实验中测试和测量的变量密切相关。
较大的 p 值表明您的结果看起来或多或少类似于不存在关系时得到的结果,这意味着您无法确信毕竟存在联系。
等等,什么? 您能用更简单的术语解释一下 p 值吗?
科学实验通常会比较人、物体或事件的某些特征,以了解它们之间的关系。
是否吃油腻食物让你体重增加?可以用某种特定的药物吗减轻疾病症状? 多少咖啡因很好(还是不好) 为你? 我们可能会假设存在某种联系,一件事导致另一件事。
如果我们相信其中一件事会影响另一件事,我们就可以将这种关系的性质称为假设。 (例如,“脂肪食物使你体重增加”是一个假设。)
事实上,可能没有任何关系。 我们称其为原假设。 (“脂肪食物不会让你体重增加”是一个零假设。)
不可能知道宇宙中哪一个真正在起作用。 遗憾的是,没有答案大书你可以往里面看。 任何人能做的最好的事情就是测量每个变量并进行比较,看看一个变量的增加是否意味着另一个变量的增加(或减少); 我们所说的相关性。
p 值是一种统计测试可能相关性的方法。 它给你一个0到1之间的数字; 它越接近,你对自己的假设就越不自信。
大的 p 值并不意味着你的原假设更有可能为真; 只是你的假设可能无法解释你的观察结果。
出于同样的原因,如果原假设确实有效,数字越接近零,获得此类结果的可能性就越小。 它也不能让你的假设成立,但它确实使它成为一个更好的选择。
那么我们什么时候才能说我们的假设是正确的呢?
从技术上讲,没有一个数字可以区分哪种假设是绝对正确的。
但按照惯例,我们可以得出结论,任何高于 0.05 的 p 值都意味着原假设很可能被忽略。 低于 0.05,我们可以同意你的假设值得认真对待并再次检验。
每次它经过测试并存活下来,我们就更加确信自己走在正确的轨道上。
为什么 0.05 很重要?
0.05的意义更多的是历史的偶然而不是客观的数学里程碑。
一本有影响力的书叫研究人员的统计方法由英国统计学家 Ronald Aylmer (RA) Fisher 在 20 世纪早期撰写,总结了某些变量表及其以划分变量的方式计算出的 p 值。 Fisher 后来声称 0.05 的截止值很方便,“作为判断偏差是否应被视为显着的限制”。
正如费舍尔发现的那样方便,一些研究人员认为我们不应该如此懒惰地在所有科学事物上采用它。 有人说我们应该抛弃它并接受一定程度的不确定性。
有一种反对意见声称我们应该更加严格,减少价值到更小的数字 0.005,才能对假设充满信心。
其他的警惕如此仓促地改变它,意味着我们可以预期 0.05 的 p 值在未来一段时间内将成为科学界的一个重要数字。
所有解释者均由事实核查人员确定在发布时正确且相关。 作为编辑决定,文本和图像可能会被更改、删除或添加,以保持信息最新。