นัยสำคัญทางสถิติคืออะไร?
นัยสำคัญทางสถิติคือข้อสรุปว่าชุดข้อมูลไม่ได้เป็นผลมาจากโอกาส แต่สามารถนำมาประกอบกับสาเหตุที่เฉพาะเจาะจงแทน นัยสำคัญทางสถิติมีความสำคัญสำหรับมืออาชีพในสาขาใด ๆ ที่ต้องอาศัยการวิเคราะห์ข้อมูลรวมถึงเศรษฐศาสตร์การเงินการลงทุนการแพทย์ฟิสิกส์และชีววิทยา
นัยสำคัญทางสถิติถือได้ว่าแข็งแกร่งหรืออ่อนแอ นัยสำคัญทางสถิติที่แข็งแกร่งสนับสนุนข้อสรุปว่าผลลัพธ์เป็นจริงและไม่ได้เกิดจากโชคหรือโอกาส
ประเด็นสำคัญ
- นัยสำคัญทางสถิติวัดความเป็นไปได้ที่ผลลัพธ์ของข้อมูลที่เกิดขึ้นจากการทดสอบหรือการทดลองสามารถนำมาประกอบกับสาเหตุที่เฉพาะเจาะจง
- นัยสำคัญทางสถิติอาจสูงหรือต่ำ
- นัยสำคัญทางสถิติระดับสูงบ่งชี้ว่าความสัมพันธ์ที่สังเกตได้ไม่น่าจะเกิดจากโอกาส
ทำความเข้าใจนัยสำคัญทางสถิติ
นักวิจัยมักจะทำงานร่วมกับตัวอย่างของประชากรที่ใหญ่กว่าไม่ใช่ประชากรทั้งหมด ตัวอย่างจะต้องเป็นตัวแทนของประชากรเพื่อหลีกเลี่ยงอคติในผลลัพธ์
ในวิทยาศาสตร์ส่วนใหญ่รวมถึงเศรษฐศาสตร์ผลลัพธ์อาจได้รับการพิจารณาอย่างมีนัยสำคัญทางสถิติหากมีระดับความมั่นใจ95% (หรือบางครั้ง 99%)
การคำนวณนัยสำคัญทางสถิติที่เรียกว่าการทดสอบนัยสำคัญนั้นขึ้นอยู่กับข้อผิดพลาดในระดับหนึ่ง แม้ว่าข้อมูลจะมีความสัมพันธ์ที่แข็งแกร่งนักวิจัยจะต้องคำนึงถึงความเป็นไปได้ที่ความสัมพันธ์ที่ชัดเจนเกิดขึ้นเนื่องจากโอกาสแบบสุ่มหรือกข้อผิดพลาดในการสุ่มตัวอย่าง-
ขนาดตัวอย่างเป็นองค์ประกอบสำคัญของนัยสำคัญทางสถิติ ตัวอย่างที่ใหญ่กว่ามีแนวโน้มที่จะเกิด flukes น้อยกว่า เลือกแบบสุ่มเท่านั้นตัวอย่างตัวแทนควรใช้ในการทดสอบอย่างมีนัยสำคัญ
ระดับที่เราสามารถยอมรับได้ว่าเหตุการณ์นั้นเป็นมีนัยสำคัญทางสถิติเป็นที่รู้จักกันว่าระดับนัยสำคัญ
วัดค่า p
นักวิจัยใช้การวัดที่เรียกว่าค่า p-valueหรือค่าความน่าจะเป็นเพื่อกำหนดนัยสำคัญทางสถิติ
หากค่า p ต่ำกว่าระดับนัยสำคัญผลลัพธ์จะมีนัยสำคัญทางสถิติ
ค่า p เป็นฟังก์ชั่นของค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานของตัวอย่างข้อมูล มันบ่งบอกถึงความน่าจะเป็นภายใต้ผลลัพธ์ทางสถิติที่เกิดขึ้นโดยสมมติว่าโอกาสเพียงอย่างเดียวจะรับผิดชอบผลลัพธ์ หากความน่าจะเป็นนี้มีขนาดเล็กนักวิจัยสามารถสรุปได้ว่าปัจจัยอื่น ๆ อาจรับผิดชอบต่อข้อมูลที่สังเกตได้
ตรงกันข้ามกับระดับนัยสำคัญที่คำนวณเป็น 1 ลบระดับนัยสำคัญคือระดับความเชื่อมั่น มันบ่งบอกถึงระดับของความเชื่อมั่นว่าผลลัพธ์ทางสถิติไม่ได้เกิดขึ้นโดยบังเอิญหรือโดยการสุ่มตัวอย่างข้อผิดพลาด
จารีตประเพณีความมั่นใจระดับในการทดสอบทางสถิติจำนวนมากคือ 95%ซึ่งนำไปสู่ระดับนัยสำคัญตามปกติหรือค่า p 5%
ข้อเท็จจริง
“ P-Hacking” เป็นการฝึกฝนการเปรียบเทียบชุดข้อมูลที่แตกต่างกันมากมายในการค้นหาผลลัพธ์ที่มีนัยสำคัญทางสถิติ การปฏิบัตินั้นขมวดคิ้วเพราะ P-Hackers กำลังมองหาการศึกษาที่สนับสนุนผลลัพธ์ที่พวกเขาชอบ
ข้อพิจารณาพิเศษ
นัยสำคัญทางสถิติไม่ได้บ่งบอกถึงความสำคัญในทางปฏิบัติเสมอไปซึ่งหมายความว่าผลลัพธ์ไม่สามารถนำไปใช้กับโลกแห่งความจริงได้
ยิ่งกว่านั้นความจริงที่ว่าผลลัพธ์มีนัยสำคัญทางสถิติไม่ได้หมายความว่ามันเป็นไม่ผลของโอกาสเพียงแค่ว่านี่เป็นกรณีที่น้อยกว่า
เพียงเพราะชุดข้อมูลสองชุดมีความสัมพันธ์ที่แข็งแกร่งกับอีกชุดหนึ่งไม่ได้หมายความถึงสาเหตุ ตัวอย่างเช่นจำนวนภาพยนตร์ที่นักแสดง Nicolas Cage ดาวในปีที่กำหนดอาจมีความสัมพันธ์อย่างมากกับจำนวนการจมน้ำโดยไม่ตั้งใจในสระว่ายน้ำ ความสัมพันธ์คือปลอมเนื่องจากไม่มีการเรียกร้องสาเหตุเชิงทฤษฎี
พึ่งพาอดีต
ข้อมูลที่ผ่านมา - ไม่ว่าจะมีนัยสำคัญทางสถิติหรือไม่ - อาจไม่สามารถทำนายเงื่อนไขในอนาคตได้อย่างน่าเชื่อถือ
ปัญหามีความชัดเจนในการวิเคราะห์การลงทุน รูปแบบการกำหนดราคาตามประสิทธิภาพที่ผ่านมาของหุ้นอาจใช้ในการทำนายการเคลื่อนไหวภายในช่วงเวลาที่เลือก มันอาจพังลงเมื่อต้องเผชิญกับเหตุการณ์ในภายหลัง
ในฐานะที่เป็นมาตรฐานนัยสำคัญทางสถิติสามารถช่วยให้นักลงทุนเลือกรูปแบบการกำหนดราคาสินทรัพย์หนึ่งแบบมากกว่าผู้อื่น
ประเภทของการทดสอบนัยสำคัญทางสถิติ
มีการใช้การทดสอบอย่างมีนัยสำคัญหลายประเภทขึ้นอยู่กับการวิจัยที่ดำเนินการ ตัวอย่างเช่นการทดสอบสามารถใช้สำหรับตัวอย่างข้อมูลหนึ่งสองหรือมากกว่าขนาดต่าง ๆ สำหรับค่าเฉลี่ยความแปรปรวนสัดส่วนข้อมูลที่จับคู่หรือข้อมูลที่ไม่ได้จับคู่หรือการแจกแจงข้อมูลที่แตกต่างกัน
นอกจากนี้ยังมีวิธีการที่แตกต่างกันในการทดสอบอย่างมีนัยสำคัญขึ้นอยู่กับประเภทของข้อมูลที่มีอยู่ Ronald Fisher ได้รับการยกย่องด้วยการกำหนดวิธีการที่ยืดหยุ่นที่สุดอย่างหนึ่งรวมถึงการกำหนดบรรทัดฐานสำหรับความสำคัญที่P<0.05
เนื่องจากงานส่วนใหญ่สามารถทำได้หลังจากรวบรวมข้อมูลแล้ววิธีนี้ยังคงเป็นที่นิยมสำหรับโครงการวิจัยระยะสั้นหรือโฆษณา
เพื่อสร้างวิธีการของฟิชเชอร์ Jerzy Neyman และ Egon Pearson จบลงด้วยการพัฒนาวิธีการทางเลือก วิธีนี้ต้องใช้งานมากขึ้นก่อนที่จะรวบรวมข้อมูล แต่ช่วยให้นักวิจัยสามารถออกแบบการศึกษาของพวกเขาในลักษณะที่ควบคุมความน่าจะเป็นที่จะได้ข้อสรุปที่ผิดพลาด
การทดสอบสมมติฐานว่าง
มีการใช้นัยสำคัญทางสถิติในสมมติฐานว่างการทดสอบซึ่งนักวิจัยพยายามสนับสนุนทฤษฎีของพวกเขาโดยปฏิเสธคำอธิบายอื่น ๆ แม้ว่าบางครั้งวิธีนี้จะเข้าใจผิด แต่ก็ยังคงเป็นวิธีการทดสอบข้อมูลที่ได้รับความนิยมมากที่สุดในด้านการแพทย์จิตวิทยาและสาขาอื่น ๆ
สมมติฐานว่างที่พบบ่อยที่สุดคือพารามิเตอร์ที่เป็นปัญหาเท่ากับศูนย์ (โดยทั่วไประบุว่าตัวแปรมีผลเป็นศูนย์ต่อผลลัพธ์ที่น่าสนใจ)
หากนักวิจัยปฏิเสธสมมติฐานว่างด้วยความมั่นใจ 95% หรือดีกว่าพวกเขาสามารถอ้างว่าความสัมพันธ์ที่สังเกตได้มีนัยสำคัญทางสถิติ สมมติฐานว่างยังสามารถทดสอบความเท่าเทียมกันของผลสำหรับการรักษาทางเลือกสองทางขึ้นไป
สำคัญ
นัยสำคัญทางสถิติระดับสูงไม่ได้พิสูจน์ว่าสมมติฐานเป็นจริงหรือเท็จ มาตรการนัยสำคัญทางสถิติความเป็นไปได้ที่ผลลัพธ์ที่สังเกตได้จะเกิดขึ้นโดยสมมติว่าสมมติฐานว่างเป็นจริง
การปฏิเสธสมมติฐานว่างแม้ว่าระดับนัยสำคัญทางสถิติที่สูงมากจะไม่สามารถทำได้พิสูจน์บางสิ่งบางอย่างสามารถเพิ่มการสนับสนุนสมมติฐานที่มีอยู่เท่านั้น ในทางกลับกันความล้มเหลวในการปฏิเสธสมมติฐานว่างมักจะมีเหตุผลที่จะยกเลิกสมมติฐาน
นอกจากนี้เอฟเฟกต์อาจมีนัยสำคัญทางสถิติ แต่มีผลกระทบเพียงเล็กน้อยเท่านั้น ตัวอย่างเช่นอาจมีนัยสำคัญทางสถิติว่า บริษัท ที่ใช้กระดาษชำระสองชั้นในห้องน้ำของพวกเขามีพนักงานที่มีประสิทธิผลมากขึ้น แต่การปรับปรุงประสิทธิภาพการผลิตที่สมบูรณ์ของคนงานแต่ละคนมีแนวโน้มที่จะลดลง
คุณคำนวณนัยสำคัญทางสถิติได้อย่างไร?
นัยสำคัญทางสถิติคำนวณโดยใช้ไฟล์ฟังก์ชั่นการกระจายแบบสะสมซึ่งสามารถบอกคุณได้ถึงความน่าจะเป็นของผลลัพธ์บางอย่างโดยสมมติว่าสมมติฐานว่างเป็นจริง หากนักวิจัยระบุว่าความน่าจะเป็นนี้ต่ำมากพวกเขาสามารถกำจัดสมมติฐานว่างได้
คุณแสดงนัยสำคัญทางสถิติใน Excel ได้อย่างไร?
Microsoft Excel มีฟังก์ชั่นในตัวเพื่อทำการคำนวณบางอย่างที่จำเป็นสำหรับการทดสอบนัยสำคัญทางสถิติ ในการทำการทดสอบไคสแควร์ประเภท = chisq.test (realrange, postingRange) ซึ่งข้อโต้แย้งเป็นอาร์เรย์ของเซลล์ ในการวัดค่า p ให้ใช้ function = t.test
การวัดนัยสำคัญทางสถิติอะไร?
นัยสำคัญทางสถิติใช้ในการวัดความเป็นไปได้ที่ความสัมพันธ์มีอยู่ระหว่างตัวแปรสองตัวขึ้นอยู่กับข้อมูลเชิงสังเกตการณ์
ตรงกันข้ามกับความเข้าใจผิดที่เป็นที่นิยมสิ่งนี้ไม่ได้วัดความน่าจะเป็นที่ตัวแปรทั้งสองเกี่ยวข้องกับสาเหตุ ค่อนข้างจะวัดความน่าจะเป็นที่ข้อมูลที่สังเกตได้จะเกิดขึ้นเลขที่ความสัมพันธ์ระหว่างตัวแปรทั้งสอง
แม้ว่าสิ่งนี้จะไม่เพียงพอที่จะสร้างสาเหตุการทดสอบซ้ำ ๆ ที่มีนัยสำคัญทางสถิติในระดับสูงสามารถช่วยให้นักวิจัยกำจัดความเป็นไปได้ที่ผลลัพธ์ของพวกเขาจะถูกปกคลุมด้วยโอกาสแบบสุ่ม
บรรทัดล่าง
นัยสำคัญทางสถิติใช้เพื่อประเมินความเป็นไปได้ที่ความสัมพันธ์ที่สังเกตได้อาจเป็นผลมาจากโอกาสแบบสุ่ม เมื่อการสังเกตแสดงให้เห็นถึงความสัมพันธ์ที่อ่อนแอระหว่างตัวแปรสองตัวหรือมีจุดข้อมูลจำนวนน้อยก็มีการกล่าวกันว่าไม่มีนัยสำคัญทางสถิติ อย่างไรก็ตามเมื่อมีจุดข้อมูลมากขึ้นแสดงความสัมพันธ์ที่สอดคล้องกันมากขึ้นความสัมพันธ์นั้นจะกล่าวกันว่ามีนัยสำคัญทางสถิติ
นักวิจัยใช้นัยสำคัญทางสถิติเพื่อประเมินความเป็นไปได้ที่ตัวแปรสองตัวอาจแบ่งปันความสัมพันธ์เชิงสาเหตุ