ความดีของพอดีคืออะไร?
คำว่าความดีของพอดีหมายถึงการทดสอบทางสถิติที่กำหนดว่าตัวอย่างข้อมูลที่เหมาะสมกับการกระจายจากประชากรด้วยการกระจายปกติ- พูดง่ายๆคือมันตั้งสมมติฐานว่าตัวอย่างนั้นเบ้หรือแสดงถึงข้อมูลที่คุณคาดหวังว่าจะพบในประชากรจริง
ความดีของพอดีสร้างความแตกต่างระหว่างค่าที่สังเกตได้และค่าที่คาดหวังของแบบจำลองในกรณีการแจกแจงปกติ มีหลายวิธีในการกำหนดความดีของพอดีรวมถึงไคสแควร์
ประเด็นสำคัญ
- ความดีของพอดีคือการทดสอบทางสถิติที่พยายามตรวจสอบว่าชุดของค่าที่สังเกตได้นั้นตรงกับที่คาดหวังภายใต้โมเดลที่ใช้งานได้หรือไม่
- พวกเขาสามารถแสดงให้คุณเห็นว่าข้อมูลตัวอย่างของคุณเหมาะสมกับชุดข้อมูลที่คาดหวังจากประชากรที่มีการแจกแจงแบบปกติหรือไม่
- มีการทดสอบความดีของพอดีหลายประเภท แต่ที่พบบ่อยที่สุดคือการทดสอบไคสแควร์
- การทดสอบไคสแควร์กำหนดว่าความสัมพันธ์มีอยู่ระหว่างข้อมูลหมวดหมู่หรือไม่
- การทดสอบ Kolmogorov-Smirnov เป็นตัวกำหนดว่าตัวอย่างมาจากการกระจายเฉพาะของประชากรหรือไม่
ทำความเข้าใจกับความดีของพอดี
การทดสอบความดีของพอดีเป็นวิธีการทางสถิติที่ทำให้การอนุมานเกี่ยวกับค่าที่สังเกตได้ ตัวอย่างเช่นคุณสามารถพิจารณาได้ว่ากลุ่มตัวอย่างเป็นตัวแทนของทั้งหมดอย่างแท้จริงประชากร- ดังนั้นพวกเขาจะกำหนดว่าค่าจริงเกี่ยวข้องกับค่าที่คาดการณ์ไว้ในแบบจำลองอย่างไร เมื่อใช้ในการตัดสินใจการทดสอบความดีของพอดีจะทำให้ง่ายต่อการทำนายแนวโน้มและรูปแบบในอนาคต
ดังที่ระบุไว้ข้างต้นมีการทดสอบความดีของพอดีหลายประเภท พวกเขารวมถึงการทดสอบไคสแควร์ซึ่งเป็นเรื่องธรรมดาที่สุดเช่นเดียวกับการทดสอบ Kolmogorov-Smirnov และการทดสอบ Shapiro-Wilk การทดสอบมักจะดำเนินการโดยใช้ซอฟต์แวร์คอมพิวเตอร์ แต่นักสถิติสามารถทำการทดสอบเหล่านี้โดยใช้สูตรที่ปรับให้เหมาะกับการทดสอบประเภทเฉพาะ
ในการดำเนินการทดสอบคุณต้องมีตัวแปรบางอย่างพร้อมกับสมมติฐานว่ามีการแจกจ่ายอย่างไร คุณต้องมีชุดข้อมูลที่มีค่าที่ชัดเจนและชัดเจนเช่น:
- ค่าที่สังเกตได้ซึ่งได้มาจากชุดข้อมูลจริง
- ค่าที่คาดหวังซึ่งนำมาจากสมมติฐานที่ทำ
- จำนวนหมวดหมู่ทั้งหมดในชุด
สำคัญ
การทดสอบความดีของพอดีมักใช้เพื่อทดสอบค่าปกติของส่วนที่เหลือหรือเพื่อตรวจสอบว่ามีการรวบรวมตัวอย่างสองตัวอย่างจากการแจกแจงที่เหมือนกัน
สร้างระดับอัลฟ่า
ในการตีความการทดสอบความดีของพอดีมันเป็นสิ่งสำคัญสำหรับนักสถิติในการสร้างระดับอัลฟ่าเช่นค่า p-valueสำหรับการทดสอบไคสแควร์ ค่า p หมายถึงความน่าจะเป็นที่จะได้ผลลัพธ์ใกล้เคียงกับสุดขั้วของผลลัพธ์ที่สังเกตได้ นี่ถือว่าสมมติฐานว่างถูกต้อง สมมติฐานว่างอ้างว่าไม่มีความสัมพันธ์ที่มีอยู่ระหว่างตัวแปรและสมมติฐานทางเลือกถือว่ามีความสัมพันธ์อยู่
แต่ความถี่ของค่าที่สังเกตจะถูกวัดและใช้กับค่าที่คาดหวังและองศาอิสระเพื่อคำนวณไคสแควร์ หากผลลัพธ์ต่ำกว่าอัลฟ่าสมมติฐานว่างไม่ถูกต้องแสดงให้เห็นถึงความสัมพันธ์ระหว่างตัวแปร
ประเภทของการทดสอบความดีของพอดี
การทดสอบไคสแควร์
x2-ฉัน-1K-โอฉันอีฉัน-2-อีฉัน
ที่การทดสอบไคสแควร์ซึ่งเป็นที่รู้จักกันในชื่อการทดสอบไคสแควร์เพื่อความเป็นอิสระเป็นวิธีสถิติเชิงอนุมานที่ทดสอบความถูกต้องของการเรียกร้องที่ทำเกี่ยวกับประชากรตามตัวอย่างสุ่ม
ใช้สำหรับข้อมูลที่แยกออกเป็นคลาส (ถังขยะ) โดยเฉพาะนั้นต้องใช้ขนาดตัวอย่างที่เพียงพอในการให้ผลลัพธ์ที่แม่นยำ แต่มันไม่ได้ระบุประเภทหรือความเข้มของความสัมพันธ์ ตัวอย่างเช่นมันไม่ได้สรุปว่าความสัมพันธ์เป็นบวกหรือลบ
ในการคำนวณความดีของไคสแควร์ให้ตั้งค่าระดับอัลฟ่าที่ต้องการอย่างมีนัยสำคัญ ดังนั้นหากระดับความเชื่อมั่นของคุณคือ 95% (หรือ 0.95) อัลฟ่าคือ 0.05 ถัดไประบุตัวแปรหมวดหมู่เพื่อทดสอบจากนั้นกำหนดคำสั่งสมมติฐานเกี่ยวกับความสัมพันธ์ระหว่างพวกเขา
ข้อเท็จจริง
ตัวแปรจะต้องเป็นเอกสิทธิ์เฉพาะบุคคลเพื่อให้มีคุณสมบัติสำหรับการทดสอบไคสแควร์เพื่อความเป็นอิสระ และการทดสอบความดีของ Chi ไม่ควรใช้สำหรับข้อมูลที่ต่อเนื่อง
การทดสอบ Kolmogorov-Smirnov (KS)
d-1ฉันnสูงสุด-f-yฉัน-nฉัน1-nฉันf-yฉัน--
Andrey Kolmogorov ได้รับการตั้งชื่อตามนักคณิตศาสตร์ชาวรัสเซียและ Nikolai Smirnov การทดสอบ Kolmogorov-Smirnov (KS) เป็นวิธีการทางสถิติที่กำหนดว่าตัวอย่างมาจากการกระจายเฉพาะภายในประชากรหรือไม่
การทดสอบนี้ซึ่งแนะนำสำหรับขนาดใหญ่ตัวอย่าง(เช่นมากกว่า 2000) ไม่ใช่พารามิเตอร์ นั่นหมายความว่ามันไม่ได้พึ่งพาการแจกแจงใด ๆ ที่ถูกต้อง เป้าหมายคือการพิสูจน์สมมติฐานว่างซึ่งเป็นตัวอย่างของการแจกแจงแบบปกติ
เช่นเดียวกับไคสแควร์มันใช้สมมติฐานที่เป็นโมฆะและทางเลือกและระดับความสำคัญของอัลฟ่า NULL ระบุว่าข้อมูลเป็นไปตามการกระจายเฉพาะภายในประชากรและทางเลือกระบุว่าข้อมูลไม่ได้เป็นไปตามการกระจายเฉพาะภายในประชากร อัลฟาใช้เพื่อกำหนดค่าวิกฤตที่ใช้ในการทดสอบ แต่แตกต่างจากการทดสอบไคสแควร์การทดสอบ Kolmogorov-Smirnov ใช้กับการแจกแจงอย่างต่อเนื่อง
สถิติการทดสอบที่คำนวณได้มักจะแสดงว่า D. มันกำหนดว่าสมมติฐานว่างได้รับการยอมรับหรือปฏิเสธ ถ้า D มากกว่าค่าวิกฤตที่อัลฟ่าสมมติฐานว่างถูกปฏิเสธ หาก D น้อยกว่าค่าวิกฤตสมมติฐานว่างจะได้รับการยอมรับ
การทดสอบ Anderson-Darling (AD)
S-ฉัน-1nn-2ฉัน1--lnf-yฉัน--ln-1f-yn-1ฉัน-
การทดสอบ Anderson-Darling (AD) เป็นการเปลี่ยนแปลงในการทดสอบ KS แต่ให้น้ำหนักมากขึ้นกับหางของการกระจาย การทดสอบ KS นั้นมีความไวต่อความแตกต่างที่อาจเกิดขึ้นใกล้กับศูนย์กลางของการแจกแจงมากขึ้นในขณะที่การทดสอบโฆษณามีความไวต่อการเปลี่ยนแปลงที่สังเกตได้ในหางเนื่องจากความเสี่ยงด้านหางและความคิดของ "หางไขมัน" เป็นที่แพร่หลายในตลาดการเงินการทดสอบโฆษณาสามารถให้พลังงานมากขึ้นในการวิเคราะห์ทางการเงิน
เช่นเดียวกับการทดสอบ KS การทดสอบโฆษณาสร้างสถิติซึ่งแสดงว่าเป็นก2ซึ่งสามารถเปรียบเทียบกับสมมติฐานว่าง
การทดสอบ Shapiro-Wilk (SW)
W-ฉัน-1n-xฉันxˉ-2-ฉัน-1nอันฉัน-x-ฉัน--2-
การทดสอบ Shapiro-Wilk (SW) กำหนดว่าตัวอย่างจะติดตามการแจกแจงแบบปกติหรือไม่ การทดสอบจะตรวจสอบความเป็นปกติเมื่อใช้ตัวอย่างที่มีตัวแปรหนึ่งตัวของข้อมูลต่อเนื่องและแนะนำสำหรับตัวอย่างขนาดเล็กถึง 2,000
การทดสอบ Shapiro-Wilk ใช้พล็อตความน่าจะเป็นที่เรียกว่าพล็อต QQ ซึ่งแสดง Quantiles สองชุดบนแกน y ที่จัดจากเล็กที่สุดถึงใหญ่ที่สุดหากแต่ละควอนไทล์มาจากการกระจายเดียวกันชุดของแปลงเป็นเส้นตรง
พล็อต QQ ใช้เพื่อประเมินความแปรปรวน การใช้ความแปรปรวนของพล็อต QQ พร้อมกับความแปรปรวนโดยประมาณของประชากรเราสามารถกำหนดได้ว่าตัวอย่างเป็นของการแจกแจงแบบปกติหรือไม่ หากความฉลาดของความแปรปรวนทั้งสองเท่ากับหรือใกล้เคียงกับ 1 สามารถยอมรับสมมติฐานว่างได้ หากต่ำกว่า 1 มากสามารถปฏิเสธได้
เช่นเดียวกับการทดสอบที่กล่าวถึงข้างต้นสิ่งนี้ใช้อัลฟ่าและสร้างสมมติฐานสองข้อ: โมฆะและทางเลือก สมมติฐานว่างระบุว่าตัวอย่างมาจากการแจกแจงแบบปกติในขณะที่สมมติฐานทางเลือกระบุว่าตัวอย่างไม่ได้มาจากการแจกแจงแบบปกติ
การทดสอบความดีอื่น ๆ
นอกเหนือจากการทดสอบทั่วไปที่กล่าวถึงข้างต้นแล้วยังมีการทดสอบความดีอื่น ๆ อีกมากมายที่นักวิเคราะห์สามารถใช้:
- ที่เบย์เกณฑ์ข้อมูล (BIC)เป็นมาตรการทางสถิติที่ใช้สำหรับการเลือกแบบจำลองระหว่างชุดของแบบจำลอง จำกัด BIC คือการทดสอบที่ดีของพอดีที่สมดุลความซับซ้อนของโมเดลที่มีความเหมาะสมกับข้อมูล
- ที่Cramer-von Mises Criterion (CVM)เป็นการทดสอบที่ดีของพอดีที่ใช้ในการประเมินว่าชุดข้อมูลที่สังเกตได้นั้นเหมาะกับการกระจายความน่าจะเป็นที่ตั้งสมมติฐานอย่างไร มักใช้ในเศรษฐศาสตร์วิศวกรรมหรือการเงินมันขึ้นอยู่กับฟังก์ชั่นการกระจายสะสมของข้อมูลที่สังเกตและการกระจายสมมติฐาน
- ที่Akaike Information Criterion (AIC)เป็นการวัดคุณภาพสัมพัทธ์ของแบบจำลองทางสถิติสำหรับชุดข้อมูลที่กำหนดและให้การแลกเปลี่ยนระหว่างความดีของแบบจำลองและความซับซ้อน มันขึ้นอยู่กับทฤษฎีข้อมูลและวัดปริมาณข้อมูลที่สูญเสียโดยแบบจำลองเมื่อใช้เพื่อประมาณการกระจายข้อมูลพื้นฐานที่แท้จริง
- ที่การทดสอบ Hosmer-Lemeshowเปรียบเทียบความถี่ที่คาดหวังของผลลัพธ์ไบนารีกับความถี่ที่สังเกตได้ของผลลัพธ์นั้นในกลุ่มหรือช่วงเวลาที่แตกต่างกัน โดยทั่วไปแล้วกลุ่มจะเกิดขึ้นโดยการหารความน่าจะเป็นที่คาดการณ์ไว้ของผลลัพธ์ออกเป็นสิบกลุ่มหรือถังขยะ
- การทดสอบของ Kuiperคล้ายกับการทดสอบ Kolmogorov-Smirnov แต่มีความไวต่อความแตกต่างในหางของการกระจาย
- ฉันทดสอบโมแรนหรือดัชนีของโมแรนเป็นการทดสอบทางสถิติที่ใช้ในการประเมินความสัมพันธ์เชิงพื้นที่ในข้อมูล ความสัมพันธ์เชิงพื้นที่ autocorrelation เป็นการวัดระดับที่การสังเกตของตัวแปรมีความคล้ายคลึงกันหรือแตกต่างกันในอวกาศ
เคล็ดลับ
กฎทั่วไปของหัวแม่มือคือการกำหนดให้ทุกกลุ่มภายในการทดสอบความดีของพอดีมีจุดข้อมูลอย่างน้อยห้าจุด สิ่งนี้ทำให้มั่นใจได้ว่าข้อมูลที่เพียงพอจะถูกป้อนเข้าสู่การทดสอบเพื่อกำหนดการกระจาย
ความสำคัญของการทดสอบความดีของพอดี
การทดสอบความดีของพอดีมีความสำคัญในสถิติด้วยเหตุผลหลายประการ ก่อนอื่นพวกเขาให้วิธีการประเมินแบบจำลองทางสถิตินั้นดีเพียงใดชุดข้อมูลที่สังเกตได้ ความสำคัญหลักของการดำเนินการทดสอบความดีของพอดีคือการพิจารณาว่าข้อมูลที่สังเกตนั้นสอดคล้องกับแบบจำลองทางสถิติที่สันนิษฐานหรือไม่ โดยการขยายการทดสอบความดีของพอดีอาจมีประโยชน์ในการเลือกระหว่างโมเดลที่แตกต่างกันซึ่งอาจเหมาะสมกับข้อมูล
การทดสอบความดีของพอดียังสามารถช่วยระบุค่าผิดปกติหรือความผิดปกติของตลาดที่อาจส่งผลกระทบต่อความพอดีของโมเดล ค่าผิดปกติอาจมีผลกระทบอย่างมากต่อแบบจำลองที่พอดีและอาจจำเป็นต้องลบหรือจัดการแยกต่างหาก บางครั้งค่าผิดปกติจะไม่สามารถระบุได้อย่างง่ายดายจนกว่าพวกเขาจะถูกรวมเข้ากับแบบจำลองการวิเคราะห์
การทดสอบความดีของพอดียังสามารถให้ข้อมูลเกี่ยวกับความแปรปรวนของข้อมูลและพารามิเตอร์โดยประมาณของโมเดล ข้อมูลนี้มีประโยชน์สำหรับการทำนายและทำความเข้าใจพฤติกรรมของระบบที่ถูกสร้างแบบจำลอง จากข้อมูลที่ถูกป้อนเข้าสู่โมเดลอาจจำเป็นต้องปรับแต่งโมเดลเฉพาะสำหรับชุดข้อมูลที่ถูกทดสอบส่วนที่เหลือที่ถูกคำนวณและค่า p สำหรับข้อมูลที่อาจเกิดขึ้น
การทดสอบความดีของพอดีกับการทดสอบความเป็นอิสระ
การทดสอบความดีของพอดีและการทดสอบความเป็นอิสระเป็นทั้งการทดสอบทางสถิติที่ใช้ในการประเมินความสัมพันธ์ระหว่างตัวแปร ดังนั้นจึงอาจเป็นเรื่องง่ายที่จะทำให้ทั้งสองสับสน อย่างไรก็ตามแต่ละคนได้รับการออกแบบมาเพื่อตอบคำถามที่แตกต่างกัน
การทดสอบความดีของพอดีใช้เพื่อประเมินว่าชุดข้อมูลที่สังเกตได้นั้นเหมาะกับการกระจายความน่าจะเป็นโดยเฉพาะ ในทางกลับกันการทดสอบความเป็นอิสระใช้เพื่อประเมินความสัมพันธ์ระหว่างตัวแปรสองตัว มันถูกใช้เพื่อทดสอบว่ามีความสัมพันธ์ระหว่างตัวแปรสองตัวหรือไม่ วัตถุประสงค์หลักของการทดสอบความเป็นอิสระคือการดูว่าการเปลี่ยนแปลงในตัวแปรหนึ่งเกี่ยวข้องกับการเปลี่ยนแปลงในตัวแปรอื่นหรือไม่
โดยทั่วไปแล้วการทดสอบความเป็นอิสระจะใช้เมื่อคำถามการวิจัยมุ่งเน้นไปที่การทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรสองตัวและไม่ว่าจะเกี่ยวข้องหรือเป็นอิสระ ในหลายกรณีการทดสอบความเป็นอิสระนั้นชี้ไปที่ตัวแปรเฉพาะสองตัว (เช่นการสูบบุหรี่ทำให้เกิดมะเร็งปอดหรือไม่) ในทางกลับกันการทดสอบความดีของพอดีใช้กับชุดข้อมูลที่สังเกตได้ทั้งหมดเพื่อประเมินความเหมาะสมของแบบจำลองที่เฉพาะเจาะจง
ตัวอย่างที่ดีของพอดี
นี่คือตัวอย่างสมมุติฐานที่จะแสดงให้เห็นว่าการทดสอบความดีของพอดีทำงานอย่างไร
สมมติว่าโรงยิมชุมชนขนาดเล็กดำเนินงานภายใต้สมมติฐานที่ว่าการเข้าร่วมสูงสุดคือวันจันทร์วันอังคารและวันเสาร์การเข้าร่วมโดยเฉลี่ยในวันพุธและวันพฤหัสบดีและการเข้าร่วมต่ำสุดในวันศุกร์และวันอาทิตย์ ตามสมมติฐานเหล่านี้โรงยิมมีพนักงานจำนวนหนึ่งในแต่ละวันเพื่อตรวจสอบสมาชิกสิ่งอำนวยความสะดวกที่สะอาดให้บริการฝึกอบรมและสอนชั้นเรียน
แต่โรงยิมไม่ได้ทำงานทางการเงินที่ดีและเจ้าของต้องการทราบว่าสมมติฐานการเข้าร่วมและระดับพนักงานเหล่านี้ถูกต้องหรือไม่ เจ้าของตัดสินใจที่จะนับจำนวนผู้เข้าร่วมประชุมในแต่ละวันเป็นเวลาหกสัปดาห์ จากนั้นพวกเขาสามารถเปรียบเทียบการเข้าร่วมของโรงยิมกับการเข้าร่วมที่สังเกตได้โดยใช้การทดสอบความดีของไคสแควร์
ตอนนี้พวกเขามีข้อมูลใหม่พวกเขาสามารถกำหนดวิธีการจัดการโรงยิมได้ดีที่สุดและปรับปรุงผลกำไรได้-
ความดีของพอดีหมายถึงอะไร?
Goodness-of-Fit เป็นการทดสอบสมมติฐานทางสถิติที่ใช้เพื่อดูว่าข้อมูลที่สังเกตได้อย่างใกล้ชิดกับข้อมูลที่คาดหวัง การทดสอบความดีของพอดีสามารถช่วยตรวจสอบได้ว่าตัวอย่างติดตามการแจกแจงแบบปกติหรือไม่หากตัวแปรหมวดหมู่เกี่ยวข้องกันหรือไม่หรือหากตัวอย่างสุ่มมาจากการแจกแจงเดียวกัน
เหตุใดความดีของพอดีจึงมีความสำคัญ?
การทดสอบความดีของพอดีช่วยตรวจสอบว่าข้อมูลที่สังเกตได้สอดคล้องกับสิ่งที่คาดหวังหรือไม่ การตัดสินใจสามารถทำได้ตามผลลัพธ์ของการทดสอบสมมติฐานที่ดำเนินการ ตัวอย่างเช่นผู้ค้าปลีกต้องการทราบว่าผลิตภัณฑ์ใดที่เสนอให้คนหนุ่มสาว ผู้ค้าปลีกสำรวจตัวอย่างสุ่มของคนเก่าและเยาวชนเพื่อระบุว่าผลิตภัณฑ์ใดเป็นที่ต้องการ ด้วยการใช้ไคสแควร์พวกเขาระบุว่าด้วยความมั่นใจ 95% ความสัมพันธ์เกิดขึ้นระหว่างผลิตภัณฑ์ A และคนหนุ่มสาว จากผลลัพธ์เหล่านี้อาจพิจารณาได้ว่าตัวอย่างนี้แสดงถึงประชากรของคนหนุ่มสาว นักการตลาดค้าปลีกสามารถใช้สิ่งนี้เพื่อปฏิรูปแคมเปญของพวกเขา
อะไรคือความดีที่เหมาะสมในการทดสอบไคสแควร์?
การทดสอบไคสแควร์ว่ามีความสัมพันธ์ระหว่างตัวแปรเด็ดขาดและตัวอย่างแสดงให้เห็นถึงทั้งหมดหรือไม่ มันประมาณว่าข้อมูลที่สังเกตได้สะท้อนข้อมูลที่คาดหวังอย่างใกล้ชิดหรือว่าเหมาะสมเพียงใด
คุณทำแบบทดสอบความดีของพอดีได้อย่างไร?
การทดสอบความดีของพอดีประกอบด้วยวิธีการทดสอบที่แตกต่างกัน เป้าหมายของการทดสอบจะช่วยกำหนดวิธีการใช้ ตัวอย่างเช่นหากเป้าหมายคือการทดสอบปกติในตัวอย่างที่ค่อนข้างเล็กการทดสอบ Shapiro-Wilk อาจเหมาะสม หากต้องการตรวจสอบว่าตัวอย่างมาจากการกระจายเฉพาะภายในประชากรจะใช้การทดสอบ Kolmogorov-Smirnov หรือไม่ การทดสอบแต่ละครั้งใช้สูตรที่เป็นเอกลักษณ์ของตัวเอง อย่างไรก็ตามพวกเขามี commonalities เช่นสมมติฐานว่างและระดับความสำคัญ
บรรทัดล่าง
การทดสอบความดีของพอดีกำหนดว่าข้อมูลตัวอย่างเหมาะสมกับสิ่งที่คาดหวังของประชากรอย่างไร จากข้อมูลตัวอย่างค่าที่สังเกตจะถูกรวบรวมและเปรียบเทียบกับค่าที่คาดหวังที่คำนวณโดยใช้การวัดความคลาดเคลื่อน มีการทดสอบสมมติฐานความดีที่แตกต่างกันขึ้นอยู่กับผลลัพธ์ที่คุณต้องการ
การเลือกการทดสอบความดีที่เหมาะสมส่วนใหญ่ขึ้นอยู่กับสิ่งที่คุณต้องการรู้เกี่ยวกับตัวอย่างและตัวอย่างมีขนาดใหญ่แค่ไหน ตัวอย่างเช่นหากต้องการทราบว่าค่าที่สังเกตได้สำหรับข้อมูลหมวดหมู่นั้นตรงกับค่าที่คาดหวังสำหรับข้อมูลหมวดหมู่ให้ใช้ไคสแควร์ หากต้องการทราบว่าตัวอย่างขนาดเล็กตามการแจกแจงแบบปกติการทดสอบ Shapiro-Wilk อาจเป็นประโยชน์ มีการทดสอบมากมายเพื่อกำหนดความดีของพอดี