一段时间以来,科学家们一直在争论如何使用用于描述科学确定性的最著名的工具之一,即“统计显着性”的概念。一些人认为就这样就好了。 其他人想要让它变小,而另一些人则认为赞成放弃它共。
假设我们确实硬着头皮放弃了“概率值”的概念,我们需要用更好的想法来取代它。 最近这期的美国统计学家包含一些意见 - 事实上,其中多达 43 条。
转述一下温斯顿·丘吉尔的著名名言, 这p 值长期以来,这是区分科学中有用想法的最糟糕的方法……除了不时尝试的所有其他方法。
这真的不是p的错。 就其本身而言,该值只是告诉您在实验中支持错误的马的可能性有多大。
通常,如果该值低于 0.05,则意味着零假设(对观察结果的解释,但不属于您绝妙想法的一部分)是结果背后真正原因的可能性不到 5%。
为什么是百分之五?因为历史,真的。 这是比 10% 更好的赌博,但不像 1% 那样严格。 否则的话,它确实没有什么神奇的品质。
研究人员可以使用很多统计工具来计算这个显着性数字。 当我们试图将这种数学理想转化为我们头骨内的肉计算机实际上可以采取行动的东西时,问题就出现了。
我们的大脑不能很好地处理概率。 也许这与这样一个事实有关:当熊已经在咬我们的脸时,我们从未进化到担心被熊吃掉的可能性。
我们能够更好地区分真假陈述。 所以 ap 的模糊也许
“世界比这更加不确定,”佐治亚大学的统计学家 Nicole Lazar 告诉 NPR 作家 Richard Harris。
与美国统计协会执行董事 Ronald L. Wasserstein 和 Mathematica 政策研究退休副总裁 Allen Schirm 一起,拉扎尔撰写社论推出一本关于我们如何能比“p”做得更好的思考选集。
显然,概率图可以通过多种方式让我们受益,但前提是我们不用它做愚蠢的事情,比如假设它的作用不仅仅是告诉你你的聪明解释仍然是一个竞争者。
“知道不应该对 p 值做什么确实是必要的,但这还不够,”三人组写。
“这就好像统计学家要求统计数据的使用者拆掉支撑现代科学研究大厦的横梁和支柱,而不提供坚固的建筑材料来取代它们。”
对于这些建筑材料应该是什么样子,本期的文章并没有完全达成共识。 但许多人确实有一些共同的基本要素。
一些人认为,理想情况下,退休意义应该转化为数据列表和方法描述,提供更多的细微差别,谦虚地梳理各种可能性,同时仍然主张单一解释。
“我们必须学会拥抱不确定性”几位作者写道在他们的自然意见片。
“一种实用的方法是将置信区间重命名为‘兼容性区间’,并以避免过度自信的方式解释它们。”
这不仅仅是一个廉价的 p 值改造。 这将要求研究人员积极描述这些区间内价值观的实际影响。
最终目标是建立避免导致正确或错误思维的界限的实践,而是加强支撑科学方法的不确定性。
毕竟,科学的核心是一种对话。 政策制定者、技术人员和工程师是窃听者,他们将嗡嗡声提炼成具体决策,但对于追求下一步研究的科学家来说,p 值本身并没有多大用处。
不幸的是,它已成为知识竞赛的终点线,获胜者将获得调查资金和公众赞誉。
推翻这种根深蒂固的文化习俗需要的不仅仅是几篇社论和一些论证充分的科学论文。 p 值一直是科学界备受推崇的一部分大约一个世纪以来,所以它会存在一段时间。
但也许这种思维为我们提供了一些方便的垫脚石,让我们超越统计显着性,进入一个可以庆祝不确定性模糊界限的地方。