這是一件有趣的事情:研究人員使用尼斯湖水怪報告的數據庫來展示如何與科學家的普遍觀點相反,從軼事證據中挖掘出可用數據。從本質上講,對被親切地命名為尼斯湖水怪的軼事的統計分析可能並不能告訴我們太多關於這種神獸本身的信息,但它可以告訴我們很多關於尼斯湖水怪的報導。
本文的其餘部分位於付費牆後面。請登錄或訂閱以訪問完整內容。
軼事——關於個人經歷的故事——通常是科學研究的禍根,因為它們通常被認為可能不准確、有偏見,甚至不真實。因此,科學家(尤其是統計學家)盡可能避免使用軼事。但軼事證據是否總是無用的,或者可以轉化為數據嗎?
嗯,根據最近一篇論文的作者的說法,情況並非如此,該論文記錄了在大學課程中使用一個不尋常的軼事報告數據庫,讓學生思考可以對數據提出哪些問題以及“數據”的實際含義。他們表明,當人口和抽樣單位得到適當考慮時,即使是軼事證據也可以提供有價值的見解。
為了證明這一點,該團隊分析了與識別模式。該數據庫有 1,800 多份報告,正如該團隊所寫,這些報告“幾乎肯定對所經歷的現象存在偏見”。這是因為“想必更生動、更令人興奮的報告更有可能被保存下來。”
因此,分析後的報告樣本被認為相對於未記錄和未保存的報告群體可能存在偏差,但各個變量也是如此。例如,持續時間較長的明顯遭遇可能被更多地保存下來,以及與據稱目擊更大的尼斯湖水怪而不是所謂的小怪物有關的報告。
許多報告也不被認為是獨立的。關於尼斯湖水怪的報導可能涉及多名目擊者,或多次描述經歷的人,這可能會逐漸導致。目擊者之間也可能互相協商,因此同一事件的多個報告不能被視為獨立的——這樣做就是“偽複製”的一個例子。
然而,當研究人員篩選出報告數據中最有用的信息後,他們留下了自 1850 年以來收集的 1,433 份名義上獨立的第一手報告。那麼這些數據告訴我們什麼呢?
“我們無法從這些收集到的記錄中得出有關尼斯湖水怪的結論,但我們可以對更廣泛的尼斯湖水怪報告進行深入了解”,研究合著者、聖安德魯斯大學生態與環境建模研究中心的查爾斯·帕克斯頓博士在一份報告中解釋道。陳述。
該團隊與德拉姆納德羅希特尼斯湖項目的 Adrian Shine 和聖安德魯斯大學的 Valentin Popov 博士合作,揭示了有趣且有趣的趨勢。
帕克斯頓解釋說:“尼斯湖水怪主要出現在夏季,白天而不是夜間,午餐時間會出現少量的情況,而且天氣條件極佳。”
“相對於第一手報導,二手報導往往被誇大,怪物被報導得更近、更大。這些模式可能是由怪物本身產生的,但更可能反映了目擊者的可用性以及故事在重述時被扭曲的傾向。”
顯然,這項研究並沒有證明關於所謂的怪物本身的任何事情,但它確實展示瞭如何將統計思維應用於軼事數據並評估可以得出什麼類型的結論。
該論文發表於統計與數據科學教育雜誌。









