ปีที่แล้วการวัดเล็กน้อยเรียกว่าค่า p-valueเป็นจุดสนใจของการโต้เถียงครั้งใหญ่ในขณะที่นักวิทยาศาสตร์แย้งควรลดลงเพื่อช่วยแก้ไขปัญหาสำคัญในวิทยาศาสตร์สมัยใหม่
ตอนนี้เรามีการโต้แย้งอย่างเป็นทางการซึ่งสร้างขึ้นโดยนักวิทยาศาสตร์ 100 คนที่มีความหลงใหลใน P และเผยแพร่ออนไลน์เพื่อให้ทุกคนอ่าน- แต่อย่าคิดว่านี่จะเป็นคำสุดท้ายในเรื่องนี้
นักวิทยาศาสตร์ใด ๆ ที่มีค่าเกลือของพวกเขาคุ้นเคยกับค่า p-value การวัดทางสถิติที่กำหนดโดยฉันทามติที่กว้างที่ 0.05 นั่นคือ 'P' โดยวิธีการหมายถึงความน่าจะเป็น
ในแง่ตรงไปข้างหน้าตัวเลขกำหนดมาตรฐานของความมั่นใจที่นักวิจัยและเพื่อนของพวกเขาควรลงทุนในชุดของผลลัพธ์ที่กำหนด
แม่นยำยิ่งขึ้นค่า p เป็นตัวชี้วัดของผลลัพธ์ที่เหมือนกันหากการสร้าง hypothesis null-เคาน์เตอร์ของการทำนายที่ยอดเยี่ยมของคุณ-จริง ๆ แล้วเป็นจริง
สำหรับสิ่งต่าง ๆ ในด้านวิทยาศาสตร์เรารู้สึกสบายใจในระดับปานกลางกับความเสี่ยงที่ 0.05 (หรือโอกาส 5 เปอร์เซ็นต์) - หมายความว่ามีโอกาสที่ดีสมมติฐานของคุณเป็นภาพสะท้อนที่แท้จริงของโลก
หมายเลขนี้ได้รับการตัดสินมานานกว่าครึ่งศตวรรษเมื่อนักสถิติของอังกฤษRonald Fisher แนะนำ"เรามักจะไม่หลงทางถ้าเราวาดเส้นธรรมดาที่ 0.05"
กรอไปข้างหน้าถึงกลางปี 2560; นักวิทยาศาสตร์ที่โดดเด่นจำนวนหนึ่งไม่เชื่อว่าพวกเขาจะไม่หลงทางอีกต่อไปการประกาศปัญหาที่เกิดขึ้นใหม่ที่เรียกว่าวิกฤตการจำลองแบบสามารถปรับปรุงได้หากเราทำรูป 0.005 แทน
การเรียกร้องของพวกเขาไม่ใช่เรื่องใหม่ นักวิจัยแย้งก่อนหน้านี้ว่า 'ค่า p ไม่แน่นอน'สมควรที่จะใช้อย่างระมัดระวัง
ในหลาย ๆ สาขาจากจิตวิทยาถึงมะเร็งวิทยานักวิทยาศาสตร์ได้พยายามทำซ้ำผลลัพธ์ของการทดลองที่มีอิทธิพลกระตุ้นให้นักวิทยาศาสตร์ถามว่าเราผ่อนคลายมากเกินไปเกี่ยวกับสิ่งที่เราควรยอมรับว่าเป็นหลักฐานที่ชัดเจนหรือไม่
ในทางทฤษฎีการลดเกณฑ์มาตรฐาน P-value จะกำหนดให้นักวิจัยต้องปฏิบัติตามเงื่อนไขการทดลองที่เข้มงวดขึ้นเพื่อให้ทำงานของพวกเขามีนัยสำคัญทางสถิติ-
แต่นักจิตวิทยาชาวดัตช์คนหนึ่งคิดว่ามันมีจำนวนมาก "คำแนะนำที่ไม่ดีอย่างน่ากลัว-
เมื่อปีที่แล้วDaniël Lakens จาก Eindhoven University of Technology ได้เข้าร่วมกองกำลังกับนักวิทยาศาสตร์คนอื่น ๆ มากกว่า 100 คนและผู้สนับสนุนที่หลงใหลจากทั่วโลกเพื่อร่วมมือกันในการโต้แย้งว่าทำไมการเปลี่ยนค่า p จะเป็นความคิดที่ไม่ดี
ชุมชนทำงานตามระบอบประชาธิปไตยในไฟล์ Google เอกสารที่ใช้ร่วมกันซึ่งในที่สุดก็กลายเป็นพื้นฐานของบทความที่พวกเขาส่งมารีวิวเพียร์-
"มันเหลือเชื่อที่ได้เห็นว่าเอกสารวิวัฒนาการมาจากที่นั่น"Lakens บอก Jop de Vrieze ที่ศาสตร์-
"ผู้คนที่เพิ่มการลบและเพิ่มอีกครั้งการอภิปรายใหม่ที่ปรากฏในสนามมันทำงานได้เหมือนมีเสน่ห์"
กระดาษท้ายมีผู้เขียน 88 คนติดอยู่ ชื่อ "แสดงให้เห็นถึงอัลฟ่าของคุณ"เพิ่งได้รับการยอมรับจากการเผยแพร่โดยพฤติกรรมมนุษย์ธรรมชาติ-
Lakens และผู้เขียนเพื่อนของเขาเห็นด้วยว่าดูเหมือนว่าจะมีปัญหาเกี่ยวกับการจำลองแบบและมูลค่าสากลที่ 0.05 นั้นไม่เป็นที่พึงปรารถนา
อาร์กิวเมนต์ของพวกเขาต่อการตั้งค่าขีด จำกัด ใหม่ที่ 0.005 เดือดลงเหลือสามคะแนน:
- ไม่มีใครแสดงให้เห็นว่าปัญหาเกี่ยวกับการจำลองแบบเป็นผลมาจากค่า p สูง
- ข้อโต้แย้งในการลดค่า 0.05 p ไม่ได้หมายความว่ามันควรจะใช้ในทุกสาขาและสาขาวิชา;
- มีผลกระทบเชิงลบที่ควรพิจารณา
เช่นLakens วางไว้"ทำไมต้องสั่งจ่ายค่า p เดียวเมื่อวิทยาศาสตร์มีความหลากหลายมาก?"
การศึกษาเดิมพันสูงบางครั้งอาจต้องการความมั่นใจในระดับสูง
แต่การไม่รวมการศึกษาสำหรับความต้องการขนาดตัวอย่างที่เป็นไปไม่ได้ก็สามารถปิดพื้นที่การศึกษาที่อาจมีประสิทธิผลมากขึ้นตามกาลเวลา
ไม่มีสภาวิทยาศาสตร์ระดับสูงที่จะหันไปหาเรื่องเหล่านี้ดังนั้นจึงไม่น่าเป็นไปได้ที่การอภิปรายจะถูกตัดสินในไม่ช้า
บางทีมันอาจจะไม่ได้พักผ่อนอย่างเต็มที่โดยมีผู้สนับสนุนด้านใดด้านหนึ่งผลักดันและผลักจำนวนน้อยไปมาในอนาคต
เราสามารถหวังได้ว่ามันเป็นเรื่องจริง เป็นการอภิปรายประชาธิปไตยเช่นนี้ที่ทำให้วิทยาศาสตร์มีพลังอย่างไม่น่าเชื่อ