การสุ่มตัวอย่างแบบแบ่งชั้นคืออะไร?
การสุ่มตัวอย่างแบบแบ่งชั้นเกี่ยวข้องกับการแบ่งประชากรออกเป็นกลุ่มย่อยขนาดเล็กที่รู้จักกันในชื่อชั้น ชั้นถูกสร้างขึ้นตามคุณลักษณะหรือลักษณะที่ใช้ร่วมกันของสมาชิกในการสุ่มตัวอย่างแบบสุ่มแบบแบ่งชั้นหรือการแบ่งชั้นเช่นรายได้หรือการบรรลุการศึกษา
การสุ่มตัวอย่างแบบแบ่งชั้นมีแอพพลิเคชั่นและประโยชน์มากมายรวมถึงประชากรประชากรศึกษาและอายุขัย- นอกจากนี้ยังเรียกว่าการสุ่มตัวอย่างแบบสุ่มตามสัดส่วนหรือการสุ่มสุ่มโควต้า
ประเด็นสำคัญ
- การสุ่มตัวอย่างเกี่ยวข้องกับการอนุมานทางสถิติที่ทำโดยใช้ชุดย่อยของประชากร
- ประชากรแบ่งออกเป็นกลุ่มที่แบ่งปันลักษณะที่เรียกว่าชั้นสำหรับการสุ่มตัวอย่างแบบแบ่งชั้น
- การสุ่มตัวอย่างแบบแบ่งชั้นตามสัดส่วนเกี่ยวข้องกับการสุ่มตัวอย่างจากกลุ่มแบ่งชั้นตามสัดส่วนของประชากร
- ชั้นไม่ได้สัดส่วนกับการเกิดขึ้นของพวกเขาในประชากรในการสุ่มตัวอย่างที่ไม่สมส่วน
- การสุ่มตัวอย่างแบบแบ่งชั้นแตกต่างจากการสุ่มตัวอย่างแบบง่าย ๆ ซึ่งเกี่ยวข้องกับการเลือกข้อมูลแบบสุ่มจากประชากรทั้งหมด
Investopedia / Xiaojie Liu
การสุ่มสุ่มแบบแบ่งชั้นทำงานอย่างไร
นักวิจัยอาจพบว่าขนาดของประชากรมีขนาดใหญ่เกินไปที่จะทำการวิจัยให้เสร็จสมบูรณ์เมื่อเริ่มการวิเคราะห์กลุ่มของหน่วยงานที่มีลักษณะคล้ายกัน พวกเขาอาจเลือกกลุ่มเล็ก ๆ จากประชากรโดยรวมเพื่อประหยัดเวลาและเงินและเพื่อให้การวิจัยเป็นไปได้มากขึ้น สิ่งนี้เรียกว่าการสุ่มตัวอย่าง
กลุ่มเล็ก ๆ เรียกว่ากขนาดตัวอย่างซึ่งเป็นส่วนย่อยของประชากรที่ใช้เพื่อเป็นตัวแทนของประชากรทั้งหมด ตัวอย่างอาจถูกเลือกจากประชากรในหลาย ๆ ด้าน หนึ่งคือวิธีการสุ่มตัวอย่างแบบแบ่งชั้น
การสุ่มตัวอย่างแบบแบ่งชั้นเกี่ยวข้องกับการแบ่งประชากรทั้งหมดออกเป็นกลุ่มที่เป็นเนื้อเดียวกันที่เรียกว่า Strata ซึ่งเป็นพหูพจน์ของชั้น จากนั้นตัวอย่างสุ่มจะถูกเลือกจากแต่ละชั้นเพื่อวิเคราะห์ประสบการณ์หรือผลลัพธ์ที่แตกต่างที่เกี่ยวข้องกับแต่ละกลุ่มประชากร
สำคัญ
การสุ่มตัวอย่างแบบแบ่งชั้นใช้เพื่อเน้นความแตกต่างระหว่างกลุ่มในประชากร สิ่งนี้แตกต่างจากการสุ่มตัวอย่างแบบง่าย ๆ ซึ่งปฏิบัติต่อสมาชิกทุกคนของประชากรเท่ากันกับโอกาสที่จะถูกสุ่มตัวอย่างเท่ากัน
พิจารณานักวิจัยด้านวิชาการที่ต้องการทราบจำนวนนักศึกษา MBA ในปีบัณฑิตที่เฉพาะเจาะจงที่ได้รับข้อเสนองานภายในสามเดือนของการสำเร็จการศึกษา นักวิจัยจะพบว่ามีบัณฑิต MBA เกือบ 200,000 คนในปีนั้น พวกเขาสามารถใช้ตัวอย่างแบบสุ่มง่าย ๆ ของบัณฑิต 50,000 คนและดำเนินการสำรวจ พวกเขาสามารถแบ่งประชากรออกเป็นชั้นและใช้ตัวอย่างสุ่มจากชั้นเรียนเพื่อเรียนรู้เพิ่มเติม
พวกเขาจะสร้างกลุ่มประชากรตามเพศช่วงอายุเชื้อชาติประเทศที่มีสัญชาติและพื้นหลังอาชีพ ตัวอย่างสุ่มจากแต่ละชั้นจะถูกนำมาใช้ในจำนวนสัดส่วนกับขนาดของชั้นเมื่อเทียบกับประชากร ชุดย่อยของชั้นเหล่านี้จะถูกรวมเข้าด้วยกันเพื่อสร้างตัวอย่างสุ่มซึ่งนักวิจัยจะวิเคราะห์ความแตกต่างในกลุ่มที่ได้รับข้อเสนองานหลังจากสำเร็จการศึกษา
ตัวอย่างสุ่มแบบง่ายกับชั้นแบ่งชั้น
ตัวอย่างสุ่มง่ายๆและตัวอย่างแบบสุ่มแบบแบ่งชั้นเป็นทั้งเครื่องมือวัดทางสถิติ ตัวอย่างแบบสุ่มอย่างง่ายใช้เพื่อแสดงประชากรข้อมูลทั้งหมด ตัวอย่างสุ่มแบบแบ่งชั้นแบ่งประชากรออกเป็นกลุ่มเล็ก ๆ หรือชั้นตามลักษณะที่ใช้ร่วมกัน การสุ่มตัวอย่างแบบแบ่งชั้นมีความซับซ้อนมากขึ้นใช้เวลานานและอาจมีราคาแพงกว่าในการดำเนินการมากกว่าการสุ่มตัวอย่างแบบง่าย
ตัวอย่างแบบสุ่มอย่างง่ายมักจะใช้เมื่อ:
- มีข้อมูลเล็กน้อยเกี่ยวกับประชากรข้อมูล
- ประชากรข้อมูลมีความแตกต่างมากเกินไปที่จะแบ่งออกเป็นชุดย่อยที่สะอาด
- มีลักษณะเฉพาะที่แตกต่างกันเพียงอย่างเดียวในหมู่ประชากรข้อมูล
บริษัท ขนมอาจต้องการศึกษาพฤติกรรมการซื้อของลูกค้าเพื่อกำหนดอนาคตของสายผลิตภัณฑ์ บริษัท อาจเลือกลูกค้า 100 รายเป็นตัวอย่างสุ่มหากมี 10,000 รายการ จากนั้นสามารถใช้สิ่งที่พบจากลูกค้า 100 รายไปยังส่วนที่เหลือของฐาน
ลูกค้า 100 รายเหล่านั้นจะถูกแบ่งออกเป็นชั้นตามอายุรายได้หรือลักษณะอื่น ๆ ด้วยการสุ่มตัวอย่างแบบแบ่งชั้น อย่างไรก็ตามจะมีจำนวนมากในแต่ละชั้นที่มีเพียง 100 คนในตัวอย่างอย่างไรก็ตามหรืออาจไม่มีความแตกต่างระหว่างชั้น มันจะสมเหตุสมผลมากขึ้นที่จะใช้การสุ่มตัวอย่างแบบง่าย ๆ ในกรณีนี้และตัวอย่างสมาชิก 100 คนอย่างหมดจดโดยไม่ต้องกำหนดลักษณะของแต่ละบุคคล
สัดส่วนกับการแบ่งชั้นที่ไม่สมส่วน
การสุ่มตัวอย่างแบบแบ่งชั้นทำให้มั่นใจได้ว่าแต่ละกลุ่มย่อยของประชากรที่กำหนดนั้นมีการแสดงอย่างเพียงพอภายในประชากรตัวอย่างทั้งหมดของการศึกษาวิจัย การแบ่งชั้นสามารถเป็นสัดส่วนหรือไม่เหมาะสม
ขนาดตัวอย่างของแต่ละชั้นมีสัดส่วนกับขนาดประชากรของชั้นที่มีการแบ่งชั้นตามสัดส่วน การสุ่มตัวอย่างแบบแบ่งชั้นแบบนี้มักจะแม่นยำกว่าตัวชี้วัดเพราะมันเป็นตัวแทนที่ดีกว่าของประชากรโดยรวม
สมมติว่านักวิจัยกำลังมองหาประชากร 180,000 คนและต้องการใช้ตัวอย่าง 50,000 ชั้นโดยใช้ช่วงอายุ นักวิจัยจะใช้สูตร:
ตัวอย่างสุ่มแบบแบ่งชั้นตามสัดส่วน = (ขนาดตัวอย่าง / ขนาดประชากร) ×ขนาดชั้น
กลุ่มอายุ | 24–28 | 29–33 | 34–37 | ทั้งหมด |
---|---|---|---|---|
จำนวนคนใน Stratum | 90,000 | 60,000 | 30,000 | 180,000 |
ขนาดตัวอย่างชั้น | 25,000 | 16,667 | 8,333 | 50,000 |
ขนาดตัวอย่างชั้นในช่วงอายุ 24 ถึง 28 ปีคำนวณเป็น:
(50,000/180,000) × 90,000 = 25,000
วิธีการเดียวกันนี้ใช้สำหรับกลุ่มช่วงอายุอื่น ๆ นักวิจัยสามารถทำการสุ่มตัวอย่างแบบสุ่มอย่างง่ายในแต่ละชั้นเพื่อเลือกผู้เข้าร่วมสำรวจของพวกเขาในขณะนี้ว่าขนาดตัวอย่างชั้นเป็นที่รู้จัก: 25,000 คนอายุ 24 ถึง 28 จะถูกสุ่มจากประชากรทั้งหมด 16,667 คนอายุ 29 ถึง 33 และ 8,333 คนอายุ 34 ถึง 37
ขนาดของแต่ละชั้นไม่ได้สัดส่วนกับขนาดของประชากรในตัวอย่างแบ่งชั้นที่ไม่เป็นสัดส่วน นักวิจัยอาจตัดสินใจลองชิมผู้สำเร็จการศึกษาครึ่งหนึ่งภายในกลุ่มอายุ 34 ถึง 37 และหนึ่งในสามของบัณฑิตภายในกลุ่มอายุ 29 ถึง 33
คนคนหนึ่งไม่สามารถพอดีกับหลายชั้นได้ แต่ละเอนทิตีสามารถรวมอยู่ในชั้นเดียวเท่านั้น การมีกลุ่มย่อยที่ทับซ้อนกันหมายความว่าบุคคลบางคนจะมีโอกาสได้รับการคัดเลือกสำหรับการสำรวจที่สูงขึ้นและสิ่งนี้จะลบล้างแนวคิดของการสุ่มตัวอย่างแบบแบ่งชั้นเป็นประเภทของการสุ่มตัวอย่างความน่าจะเป็น
ข้อเท็จจริง
ผู้จัดการพอร์ตโฟลิโอสามารถใช้การสุ่มตัวอย่างแบบแบ่งชั้นเพื่อสร้างพอร์ตการลงทุนโดยทำซ้ำดัชนีเช่นดัชนีพันธบัตร
ข้อดีของการสุ่มตัวอย่างแบบแบ่งชั้น
ข้อได้เปรียบหลักของการสุ่มตัวอย่างแบบแบ่งชั้นคือมันจับลักษณะของประชากรที่สำคัญ วิธีการสุ่มตัวอย่างนี้สร้างลักษณะในตัวอย่างที่เป็นสัดส่วนกับประชากรโดยรวมที่คล้ายกับกถ่วงน้ำหนักเฉลี่ย- การสุ่มตัวอย่างแบบแบ่งชั้นทำงานได้ดีสำหรับประชากรที่มีคุณลักษณะที่หลากหลายซึ่งกลุ่มย่อยสามารถเกิดขึ้นได้
การแบ่งชั้นให้เล็กลงข้อผิดพลาดในการประมาณค่าและแม่นยำกว่าวิธีการสุ่มตัวอย่างแบบง่าย ๆ ยิ่งความแตกต่างระหว่างชั้นมากเท่าใดก็ยิ่งได้รับความแม่นยำมากขึ้นเท่านั้น
ข้อเสียของการสุ่มตัวอย่างแบบแบ่งชั้น
น่าเสียดายที่วิธีการวิจัยนี้ไม่สามารถใช้ในการศึกษาทุกครั้ง นักวิจัยจะต้องสามารถระบุสมาชิกทุกคนของประชากรที่กำลังศึกษาเพื่อใช้ พวกเขาจะต้องจำแนกแต่ละพวกเขาออกเป็นหนึ่งเดียวและมีประชากรย่อยเพียงหนึ่งเดียว ไม่สามารถใช้การสุ่มตัวอย่างแบบแบ่งชั้นได้หากนักวิจัยไม่สามารถจำแนกสมาชิกทุกคนของประชากรลงในกลุ่มย่อยได้อย่างมั่นใจ ซึ่งอาจเป็นเรื่องยากโดยเฉพาะอย่างยิ่งหากรายการทั้งหมดของทั้งหมดประชากรไม่สามารถใช้ได้
การทับซ้อนกันอาจเป็นปัญหาหากมีวิชาที่อยู่ในกลุ่มย่อยหลายกลุ่ม ผู้ที่อยู่ในกลุ่มย่อยหลายกลุ่มมีแนวโน้มที่จะถูกเลือกเมื่อทำการสุ่มตัวอย่างแบบง่าย ๆ ผลที่ได้อาจเป็นการบิดเบือนความจริงหรือการสะท้อนที่ไม่ถูกต้องของประชากร การสุ่มตัวอย่างแบบแบ่งชั้นจะไม่ได้ผลหากกระบวนการจัดเรียงนั้นยากเกินไป
ตัวอย่างการสุ่มตัวอย่างแบบแบ่งชั้น
สมมติว่าทีมวิจัยต้องการกำหนดคะแนนเฉลี่ยคะแนน (เกรดเฉลี่ย) ของนักศึกษาทั่วสหรัฐอเมริกา ทีมมีปัญหาในการรวบรวมข้อมูลจากนักศึกษาทั้งหมด 21 ล้านคนและตัดสินใจที่จะใช้ตัวอย่างประชากรแบบสุ่มโดยใช้นักเรียน 4,000 คน
ทีมดูคุณลักษณะที่แตกต่างกันของผู้เข้าร่วมตัวอย่างและสิ่งมหัศจรรย์หากมีความแตกต่างใน GPAs เมื่อเทียบกับวิชาเอกของนักเรียน สมมติว่าพบว่านักเรียน 560 คนเป็นวิชาเอกภาษาอังกฤษ 1,135 คนเป็นวิชาเอกวิทยาศาสตร์ 800 เป็นวิชาเอกวิทยาการคอมพิวเตอร์ 1,090 เป็นวิชาเอกวิศวกรรมและ 415 เป็นวิชาเอกคณิตศาสตร์ ทีมต้องการใช้ตัวอย่างสุ่มแบบแบ่งชั้นตามสัดส่วนซึ่งชั้นของตัวอย่างเป็นสัดส่วนกับตัวอย่างสุ่มในประชากร
ตอนนี้สมมติว่าทีมวิจัยข้อมูลประชากรของนักศึกษาวิทยาลัยในสหรัฐอเมริกาและพบว่า 12% ที่สำคัญในภาษาอังกฤษ, 28% สาขาวิทยาศาสตร์, 24% สาขาวิชาคอมพิวเตอร์, 21% สาขาวิชาวิศวกรรมและ 15% วิชาเอกคณิตศาสตร์ ห้าชั้นถูกสร้างขึ้นจากกระบวนการสุ่มตัวอย่างแบบแบ่งชั้น
ทีมจะต้องยืนยันว่าชั้นของประชากรอยู่ในสัดส่วนของชั้นในตัวอย่าง พวกเขาพบว่าสัดส่วนไม่เท่ากัน ทีมจะต้องมีนักเรียนอีก 4,000 คนจากประชากรและสุ่มเลือก 480 ภาษาอังกฤษ, วิทยาศาสตร์ 1,120, วิทยาศาสตร์คอมพิวเตอร์ 960, วิศวกรรม 840, และนักศึกษาคณิตศาสตร์ 600 คน
ทีมวิจัยมีกลุ่มตัวอย่างสุ่มแบบแบ่งชั้นของนักศึกษากับกลุ่มเหล่านี้ มันให้การเป็นตัวแทนที่ดีขึ้นของวิชาเอกวิทยาลัยของนักเรียนในสหรัฐอเมริกานักวิจัยสามารถเน้นชั้นเฉพาะและตรวจสอบเกรดเฉลี่ยด้วยข้อมูลเพิ่มเติมเกี่ยวกับวิชาเอกของนักเรียน
ฉันจะใช้การสุ่มตัวอย่างแบบแบ่งชั้นเมื่อใด
การสุ่มตัวอย่างแบบแบ่งชั้นมักจะใช้เมื่อนักวิจัยต้องการทราบเกี่ยวกับกลุ่มย่อยหรือชั้นที่แตกต่างกันตามประชากรทั้งหมดที่กำลังศึกษา นักวิจัยอาจต้องการสำรวจผลลัพธ์สำหรับกลุ่มตามความแตกต่างในการแข่งขันเพศหรือการศึกษา
วิธีการสุ่มตัวอย่างใดที่ดีที่สุด?
วิธีที่ดีที่สุดในการสุ่มตัวอย่างจะขึ้นอยู่กับลักษณะของการวิเคราะห์และข้อมูลที่ใช้ การสุ่มตัวอย่างแบบสุ่มอย่างง่ายโดยทั่วไปนั้นง่ายที่สุดและถูกที่สุดในการใช้งาน แต่การสุ่มตัวอย่างแบบแบ่งชั้นสามารถสร้างตัวอย่างที่แม่นยำยิ่งขึ้นเมื่อเทียบกับประชากรที่อยู่ระหว่างการศึกษา
การสุ่มตัวอย่างแบบแบ่งชั้นสองประเภทคืออะไร?
มีสองประเภทหลักของการสุ่มตัวอย่างแบบแบ่งชั้น: สัดส่วนและไม่สมส่วน การสุ่มตัวอย่างสัดส่วนใช้แต่ละชั้นตามสัดส่วนกับขนาดประชากรของชั้น นักวิเคราะห์จะมีชั้นบางส่วนหรือต่ำกว่าตัวอย่างตามคำถามการวิจัยหรือการออกแบบการศึกษาที่ใช้ในการสุ่มตัวอย่างที่ไม่สมส่วน
Strata ถูกเลือกสำหรับการสุ่มตัวอย่างแบบแบ่งชั้นอย่างไร?
ชั้นจะขึ้นอยู่กับกลุ่มย่อยที่คุณสนใจที่ปรากฏในประชากรของคุณ กลุ่มย่อยเหล่านี้ขึ้นอยู่กับลักษณะที่ใช้ร่วมกันระหว่างผู้เข้าร่วมเช่นเพศเชื้อชาติความสำเร็จทางการศึกษาที่ตั้งทางภูมิศาสตร์หรือกลุ่มอายุ
บรรทัดล่าง
การสุ่มตัวอย่างแบบแบ่งชั้นเป็นกระบวนการสร้างกลุ่มย่อยในชุดข้อมูลตามปัจจัยต่าง ๆ เช่นอายุเพศระดับรายได้หรือการศึกษา จากนั้นตัวอย่างแบบสุ่มจะถูกนำมาจากแต่ละชั้นเพื่อให้นักวิจัยได้รับตัวอย่างจากกลุ่มย่อยต่าง ๆ รวมถึงกลุ่มที่อาจไม่ได้เป็นตัวแทน
ตัวอย่างแบบสุ่มแบบแบ่งชั้นอาจให้ภาพที่ครอบคลุมมากขึ้นของชุดข้อมูลที่กว้างขึ้นด้วยวิธีนี้ อย่างไรก็ตามการใช้วิธีนี้อาจเป็นไปไม่ได้ในการศึกษาทั้งหมดอย่างไรก็ตามขึ้นอยู่กับประชากรหรือขนาดตัวอย่างระดับข้อมูลที่มีอยู่เกี่ยวกับประชากรและเวลาและทรัพยากรที่มีอยู่ ประโยชน์ของการสุ่มตัวอย่างแบบแบ่งชั้นคือมันช่วยให้การเป็นตัวแทนของประชากรโดยรวมที่แม่นยำและเหมาะสมยิ่งขึ้นเมื่อเทียบกับวิธีการสุ่มตัวอย่างอย่างง่าย