นี่คือความสนุก: นักวิจัยได้ใช้ฐานข้อมูลของ Loch Ness Monster รายงานเพื่อแสดงว่าหลักฐานเล็ก ๆ น้อย ๆ สามารถตรงกันข้ามกับมุมมองทั่วไปในหมู่นักวิทยาศาสตร์ได้รับการขุดสำหรับข้อมูลที่ใช้งานได้ ในสาระสำคัญการวิเคราะห์ทางสถิติของเกร็ดเล็กเกร็ดน้อยเกี่ยวกับ Nessie ที่มีชื่ออย่างรักใคร่อาจไม่ได้บอกเราเกี่ยวกับสัตว์ร้ายในตำนาน แต่มันสามารถบอกเราได้มากเกี่ยวกับรายงานของ Nessie
เกร็ดเล็กเกร็ดน้อย - เรื่องราวเกี่ยวกับประสบการณ์ส่วนตัว - มักจะเป็นความหายนะของการวิจัยทางวิทยาศาสตร์เนื่องจากพวกเขามักจะถือว่าไม่ถูกต้องอคติและไม่จริง ดังนั้นนักวิทยาศาสตร์ (และโดยเฉพาะอย่างยิ่งนักสถิติ) พยายามหลีกเลี่ยงการใช้เกร็ดเล็กเกร็ดน้อยที่เป็นไปได้ แต่หลักฐานเล็ก ๆ น้อย ๆ มักจะไร้ประโยชน์หรือสามารถแปลเป็นข้อมูลได้หรือไม่?
ไม่ใช่ตามผู้เขียนบทความล่าสุดบันทึกการใช้ฐานข้อมูลที่ผิดปกติของรายงานประวัติในบทเรียนมหาวิทยาลัยของพวกเขาเพื่อให้นักเรียนคิดเกี่ยวกับคำถามที่สามารถถามข้อมูลและ "ข้อมูล" จริง ๆ พวกเขาแสดงให้เห็นว่าเมื่อประชากรและหน่วยการสุ่มตัวอย่างได้รับการพิจารณาอย่างเหมาะสมแม้กระทั่งหลักฐานพอสมควรก็สามารถเสนอข้อมูลเชิงลึกที่มีค่า
เพื่อแสดงสิ่งนี้ทีมวิเคราะห์รายงานที่เกี่ยวข้องกับเพื่อระบุรูปแบบ ฐานข้อมูลมีรายงานมากกว่า 1,800 รายงานและในขณะที่ทีมเขียนสิ่งเหล่านี้“ เกือบจะลำเอียงอย่างแน่นอนเกี่ยวกับปรากฏการณ์ที่มีประสบการณ์” นี่เป็นเพราะ“ รายงานที่สดใสและน่าตื่นเต้นมากขึ้นมีแนวโน้มที่จะได้รับการเก็บรักษาไว้”
ดังนั้นตัวอย่างรายงานที่วิเคราะห์จึงถือว่ามีอคติเมื่อเทียบกับประชากรที่ไม่ได้บันทึกและไม่ได้รับการรายงาน แต่ก็เป็นตัวแปรแต่ละตัวเช่นกัน ตัวอย่างเช่นการเผชิญหน้าที่เห็นได้ชัดยาวนานอาจได้รับการเก็บรักษาไว้มากขึ้นรวมถึงรายงานที่เกี่ยวข้องกับการพบเห็นของ Nessie ที่มีขนาดใหญ่กว่าแทนที่จะเป็นสัตว์ประหลาดตัวน้อย
รายงานจำนวนมากก็ไม่ได้รับการพิจารณาว่าเป็นอิสระ รายงานเกี่ยวกับสัตว์ประหลาด Loch Ness อาจเกี่ยวข้องกับพยานหลายคนหรือมีคนอธิบายประสบการณ์หลายครั้งซึ่งอาจค่อยๆนำไปสู่- พยานอาจหารือกันในหมู่พวกเขาดังนั้นรายงานหลายครั้งจากเหตุการณ์เดียวกันไม่สามารถมองเห็นได้ว่าเป็นอิสระ - การทำเช่นนั้นจะเป็นตัวอย่างของ "การใช้ pseudoreplication"
อย่างไรก็ตามเมื่อนักวิจัยได้คัดกรองข้อมูลสำหรับรายงานสำหรับข้อมูลที่ใช้งานได้มากที่สุดพวกเขาก็ถูกทิ้งไว้กับรายงานมือแรกที่เป็นอิสระ 1,433 ฉบับที่รวบรวมมาตั้งแต่ปี 1850 ดังนั้นข้อมูลนี้จะบอกอะไรเราได้บ้าง?
"เราไม่สามารถบรรลุข้อสรุปเกี่ยวกับสัตว์ประหลาด Loch Ness จากบัญชีที่รวบรวมได้เหล่านี้ แต่เราสามารถดึงข้อมูลเชิงลึกเกี่ยวกับประชากรที่กว้างขึ้นของรายงาน Loch Ness Monster", ผู้เขียนร่วมเขียน Dr Charles Paxton จากศูนย์การวิจัยของมหาวิทยาลัยเซนต์แอนดรูสำหรับการสร้างแบบจำลองทางนิเวศวิทยาและสิ่งแวดล้อมคำแถลง-
การร่วมมือกับ Adrian Shine of the Loch Ness Project ใน Drumnadrochit และ Dr Valentin Popov ซึ่งเป็นมหาวิทยาลัยเซนต์แอนดรูทีมเปิดเผยแนวโน้มความบันเทิงและความน่าสนใจ
“ Nessies มีการรายงานเป็นหลักในช่วงฤดูร้อนในระหว่างวันที่ต่อต้านคืน - ด้วยการแช่ในเวลาอาหารกลางวัน - และภายใต้สภาพอากาศที่ยอดเยี่ยม” แพกซ์ตันอธิบาย
“ รายงานมือสองมีแนวโน้มที่จะพูดเกินจริงเมื่อเทียบกับรายงานมือแรกกับสัตว์ประหลาดรายงานว่าใกล้ชิดและใหญ่ขึ้น รูปแบบเหล่านี้อาจถูกสร้างขึ้นโดยสัตว์ประหลาดเอง แต่มีแนวโน้มที่จะสะท้อนถึงความพร้อมของพยานและแนวโน้มที่เรื่องราวจะบิดเบือนในการเล่าเรื่อง”
เห็นได้ชัดว่าการศึกษาไม่ได้พิสูจน์อะไรเกี่ยวกับสัตว์ประหลาดที่ควรจะเป็น แต่มันแสดงให้เห็นว่าการคิดเชิงสถิติสามารถนำไปใช้กับข้อมูลเกร็ดเล็กเกร็ดน้อยได้อย่างไรและเพื่อประเมินประเภทของข้อสรุปที่สามารถวาดได้
กระดาษถูกตีพิมพ์ในไฟล์วารสารสถิติและการศึกษาวิทยาศาสตร์ข้อมูล-