การกระจายตัวอย่างคืออะไร?
การกระจายตัวอย่างเป็นแนวคิดที่ใช้ในสถิติ มันคือการกระจายความน่าจะเป็นของสถิติที่ได้จากตัวอย่างจำนวนมากที่ดึงมาจากประชากรเฉพาะ การกระจายตัวอย่างของประชากรที่กำหนดคือการกระจายความถี่ของช่วงของผลลัพธ์ที่แตกต่างกันซึ่งอาจเกิดขึ้นได้สำหรับสถิติของ Aประชากร- สิ่งนี้ช่วยให้หน่วยงานเช่นรัฐบาลและธุรกิจสามารถตัดสินใจได้อย่างดีขึ้นอยู่กับข้อมูลที่รวบรวมไว้ มีวิธีการกระจายตัวอย่างบางอย่างที่นักวิจัยใช้รวมถึงการกระจายการสุ่มตัวอย่างของค่าเฉลี่ย
ประเด็นสำคัญ
- การกระจายตัวอย่างคือการกระจายความน่าจะเป็นของสถิติที่ได้รับจากการสุ่มตัวอย่างซ้ำ ๆ ของประชากรเฉพาะ
- มันอธิบายช่วงของผลลัพธ์ที่เป็นไปได้สำหรับสถิติเช่นค่าเฉลี่ยหรือโหมดของตัวแปรบางอย่างของประชากร
- ข้อมูลส่วนใหญ่ที่วิเคราะห์โดยนักวิจัยเป็นตัวอย่างไม่ใช่ประชากร
การแจกแจงตัวอย่างทำงานอย่างไร
ข้อมูลช่วยให้นักสถิตินักวิจัยนักการตลาดนักวิเคราะห์และนักวิชาการได้ข้อสรุปที่สำคัญเกี่ยวกับหัวข้อและข้อมูลเฉพาะ มันสามารถช่วยให้ธุรกิจต่างๆตัดสินใจเกี่ยวกับอนาคตของพวกเขาและเพิ่มประสิทธิภาพของพวกเขาหรือสามารถช่วยรัฐบาลวางแผนสำหรับบริการที่จำเป็นโดยกลุ่มคน
ข้อมูลจำนวนมากที่วาดและใช้เป็นตัวอย่างมากกว่าประชากร ตัวอย่างเป็นส่วนย่อยของประชากร พูดง่ายๆคือตัวอย่างเป็นส่วนเล็ก ๆ ของกลุ่มที่ใหญ่กว่า ดังนั้นส่วนที่เล็กกว่านี้จึงเป็นตัวแทนของประชากรโดยรวม
การแจกแจงการสุ่มตัวอย่าง (หรือการกระจายข้อมูล) เป็นตัวชี้วัดทางสถิติที่กำหนดว่าเหตุการณ์หรือผลลัพธ์บางอย่างจะเกิดขึ้น การแจกแจงนี้ขึ้นอยู่กับปัจจัยที่แตกต่างกันสองสามประการรวมถึงขนาดตัวอย่างกระบวนการสุ่มตัวอย่างที่เกี่ยวข้องและประชากรโดยรวม มีไม่กี่ขั้นตอนที่เกี่ยวข้องกับการกระจายตัวอย่าง เหล่านี้รวมถึง:
- การเลือกตัวอย่างสุ่มจากประชากรโดยรวม
- กำหนดสถิติบางอย่างจากกลุ่มนั้นซึ่งอาจเป็นค่าเบี่ยงเบนมาตรฐาน, ค่ามัธยฐานหรือค่าเฉลี่ย
- การสร้างการกระจายความถี่ของแต่ละตัวอย่าง
- การทำแผนที่การกระจายบนกราฟ
เมื่อข้อมูลถูกรวบรวมวางแผนและวิเคราะห์นักวิจัยสามารถทำการอนุมานและข้อสรุป สิ่งนี้สามารถช่วยให้พวกเขาตัดสินใจเกี่ยวกับสิ่งที่คาดหวังในอนาคต ตัวอย่างเช่นรัฐบาลอาจสามารถลงทุนได้โครงสร้างพื้นฐานโครงการตามความต้องการของชุมชนบางแห่งหรือ บริษัท อาจตัดสินใจที่จะดำเนินการธุรกิจใหม่หากการกระจายการสุ่มตัวอย่างแสดงให้เห็นถึงผลลัพธ์ที่เป็นบวก
สำคัญ
แต่ละตัวอย่างมีค่าเฉลี่ยตัวอย่างของตัวเองและการกระจายของค่าเฉลี่ยตัวอย่างเรียกว่าการกระจายตัวอย่าง
ข้อพิจารณาพิเศษ
จำนวนการสังเกตในประชากรจำนวนการสังเกตในตัวอย่างและขั้นตอนที่ใช้ในการวาดชุดตัวอย่างกำหนดความแปรปรวนของการแจกแจงตัวอย่าง ค่าเบี่ยงเบนมาตรฐานของการกระจายตัวอย่างเรียกว่าข้อผิดพลาดมาตรฐาน-
ในขณะที่ค่าเฉลี่ยของการกระจายตัวอย่างเท่ากับค่าเฉลี่ยของประชากรข้อผิดพลาดมาตรฐานขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานของประชากรขนาดของประชากรและขนาดของตัวอย่าง
การรู้ว่าการกระจายค่าเฉลี่ยของชุดตัวอย่างแต่ละชุดนั้นมาจากกันและจากค่าเฉลี่ยของประชากรจะเป็นตัวบ่งชี้ว่าค่าเฉลี่ยของตัวอย่างใกล้เคียงกับค่าเฉลี่ยของประชากร ข้อผิดพลาดมาตรฐานของการแจกแจงการสุ่มตัวอย่างลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น
การกำหนดการกระจายตัวอย่าง
สมมติว่านักวิจัยทางการแพทย์ต้องการเปรียบเทียบน้ำหนักเฉลี่ยของเด็กทารกทุกคนที่เกิดในอเมริกาเหนือตั้งแต่ปี 2538-2548 กับผู้ที่มาจากอเมริกาใต้ภายในระยะเวลาเดียวกัน เนื่องจากพวกเขาไม่สามารถดึงข้อมูลสำหรับประชากรทั้งหมดภายในระยะเวลาที่เหมาะสมพวกเขาจะใช้ทารก 100 คนในแต่ละทวีปเพื่อสรุป ข้อมูลที่ใช้คือตัวอย่างและน้ำหนักเฉลี่ยที่คำนวณคือตัวอย่างหมายถึง-
ตอนนี้สมมติว่าพวกเขาใช้ตัวอย่างสุ่มซ้ำจากประชากรทั่วไปและคำนวณค่าเฉลี่ยตัวอย่างสำหรับแต่ละกลุ่มตัวอย่างแทน ดังนั้นสำหรับอเมริกาเหนือพวกเขาดึงข้อมูลสำหรับน้ำหนักทารกแรกเกิด 100 รายการที่บันทึกไว้ในสหรัฐอเมริกาแคนาดาและเม็กซิโกดังนี้:
- สี่ตัวอย่าง 100 ตัวอย่างจากโรงพยาบาลที่เลือกในสหรัฐอเมริกา
- ห้า 70 ตัวอย่างจากแคนาดา
- สามบันทึก 150 บันทึกจากเม็กซิโก
นักวิจัยลงเอยด้วยเด็กทารกแรกเกิด 1,200 คนที่จัดกลุ่มใน 12 ชุด พวกเขายังรวบรวมข้อมูลตัวอย่างของน้ำหนักแรกเกิด 100 ครั้งจากแต่ละ 12 ประเทศในอเมริกาใต้
น้ำหนักเฉลี่ยที่คำนวณสำหรับแต่ละชุดตัวอย่างคือการกระจายตัวอย่างของค่าเฉลี่ย ไม่ใช่แค่ค่าเฉลี่ยที่สามารถคำนวณได้จากตัวอย่างสถิติอื่น ๆเช่นค่าเบี่ยงเบนมาตรฐานความแปรปรวนสัดส่วนและช่วงสามารถเป็นได้คำนวณจากข้อมูลตัวอย่าง- ค่าเบี่ยงเบนมาตรฐานและความแปรปรวนวัดความแปรปรวนของการแจกแจงการสุ่มตัวอย่าง
ประเภทของการแจกแจงตัวอย่าง
นี่คือคำอธิบายสั้น ๆ เกี่ยวกับประเภทของการแจกแจงตัวอย่าง:
- การกระจายตัวอย่างของค่าเฉลี่ย:วิธีนี้แสดงการแจกแจงแบบปกติโดยที่กลางคือค่าเฉลี่ยของการแจกแจงการสุ่มตัวอย่าง เช่นนี้แสดงถึงค่าเฉลี่ยของประชากรโดยรวม เพื่อที่จะมาถึงจุดนี้นักวิจัยจะต้องทราบค่าเฉลี่ยของแต่ละกลุ่มตัวอย่างและแมปข้อมูลส่วนบุคคล
- การกระจายตัวอย่างสัดส่วน:วิธีนี้เกี่ยวข้องกับการเลือกชุดตัวอย่างจากประชากรโดยรวมเพื่อให้ได้สัดส่วนของตัวอย่าง ค่าเฉลี่ยของสัดส่วนกลายเป็นสัดส่วนของกลุ่มใหญ่
- การแจกจ่าย T:การแจกแจงการสุ่มตัวอย่างประเภทนี้เป็นเรื่องปกติในกรณีของตัวอย่างขนาดเล็ก มันอาจจะใช้เมื่อมีข้อมูลน้อยมากเกี่ยวกับประชากรทั้งหมด T-distribution ใช้เพื่อทำการประมาณการเกี่ยวกับค่าเฉลี่ยและจุดทางสถิติอื่น ๆ
ข้อเท็จจริง
ในสถิติประชากรคือสระว่ายน้ำทั้งหมดที่สถิติตัวอย่างถูกวาด ประชากรอาจอ้างถึงกลุ่มคนทั้งหมดวัตถุเหตุการณ์การเยี่ยมโรงพยาบาลหรือการวัด ประชากรสามารถกล่าวได้ว่าเป็นการสังเกตโดยรวมของอาสาสมัครที่จัดกลุ่มเข้าด้วยกันโดยคุณลักษณะทั่วไป
วางแผนการแจกแจงตัวอย่าง
ประชากรหรือชุดตัวอย่างหนึ่งชุดจะมีการแจกแจงแบบปกติ อย่างไรก็ตามเนื่องจากการแจกแจงการสุ่มตัวอย่างมีการสังเกตหลายชุดจึงไม่จำเป็นต้องมีระฆังรูปร่าง.
จากตัวอย่างของเราน้ำหนักเฉลี่ยประชากรของทารกในอเมริกาเหนือและในอเมริกาใต้มีการกระจายปกติเพราะทารกบางคนจะมีน้ำหนักน้อย (ต่ำกว่าค่าเฉลี่ย) หรือน้ำหนักเกิน (สูงกว่าค่าเฉลี่ย) โดยมีทารกส่วนใหญ่ตกอยู่ระหว่าง (รอบค่าเฉลี่ย) หากน้ำหนักเฉลี่ยของทารกแรกเกิดในอเมริกาเหนือคือเจ็ดปอนด์ตัวอย่างค่าเฉลี่ยของน้ำหนักในการสังเกตตัวอย่าง 12 ชุดที่บันทึกไว้สำหรับอเมริกาเหนือจะใกล้เคียงกับเจ็ดปอนด์เช่นกัน
แต่ถ้าคุณกราฟแต่ละค่าเฉลี่ยที่คำนวณในแต่ละกลุ่มตัวอย่าง 1,200 กลุ่มรูปร่างที่ได้อาจส่งผลให้เกิดการแจกแจงแบบสม่ำเสมอ แต่ก็ยากที่จะทำนายด้วยความมั่นใจว่ารูปร่างจริงจะเป็นอย่างไร ยิ่งนักวิจัยใช้ตัวอย่างมากขึ้นจากประชากรที่มีน้ำหนักมากกว่าหนึ่งล้านตัวเลขมากเท่าไหร่กราฟก็จะเริ่มก่อให้เกิดการแจกแจงแบบปกติมากขึ้น
เหตุใดการสุ่มตัวอย่างจึงใช้ในการรวบรวมข้อมูลประชากร?
การสุ่มตัวอย่างเป็นวิธีการรวบรวมและวิเคราะห์ข้อมูลเกี่ยวกับกลุ่มที่ใหญ่กว่า มันทำเพราะนักวิจัยไม่สามารถศึกษาประชากรทั้งหมดได้เนื่องจากปริมาณที่เกี่ยวข้อง ดังนั้นทุกคนในกลุ่มที่มีขนาดใหญ่จึงไม่สามารถรวมได้เนื่องจากอาจใช้เวลานานเกินไปในการศึกษาและวิเคราะห์ข้อมูล ช่วยให้หน่วยงานเช่นรัฐบาลและธุรกิจสามารถตัดสินใจที่สำคัญเกี่ยวกับอนาคตไม่ว่าจะหมายถึงการลงทุนในโครงการโครงสร้างพื้นฐานโปรแกรมบริการสังคมหรือผลิตภัณฑ์ใหม่
เหตุใดจึงใช้การแจกแจงการสุ่มตัวอย่าง?
การแจกแจงการสุ่มตัวอย่างใช้ในสถิติและการวิจัย พวกเขาเน้นโอกาสหรือความน่าจะเป็นของเหตุการณ์ที่อาจเกิดขึ้น สิ่งนี้ขึ้นอยู่กับชุดข้อมูลที่รวบรวมจากกลุ่มเล็ก ๆ ภายในประชากรจำนวนมาก
ค่าเฉลี่ยคืออะไร?
ค่าเฉลี่ยคือตัวชี้วัดที่ใช้ในสถิติและการวิจัย เป็นค่าเฉลี่ยสำหรับตัวเลขอย่างน้อยสองตัว ค่าเฉลี่ยอาจถูกกำหนดโดยการเพิ่มตัวเลขทั้งหมดและหารผลลัพธ์ด้วยจำนวนตัวเลขในชุดนั้น สิ่งนี้เรียกว่าค่าเฉลี่ยเลขคณิต คุณสามารถกำหนดค่าเฉลี่ยเรขาคณิตโดยการคูณค่าของชุดข้อมูลและการใช้รูทของผลรวมเท่ากับจำนวนของค่าภายในชุดข้อมูลนั้น
บรรทัดล่าง
นักวิจัยไม่สามารถสรุปได้เกี่ยวกับกลุ่มที่มีขนาดใหญ่มากเนื่องจากจำนวนวิชาที่เกี่ยวข้อง นั่นเป็นเหตุผลที่พวกเขาใช้การสุ่มตัวอย่าง การสุ่มตัวอย่างช่วยให้พวกเขาใช้กลุ่มเล็ก ๆ จากประชากรขนาดใหญ่และวิเคราะห์ข้อมูล เมื่อรวบรวมข้อมูลแล้วนักวิจัยสามารถวางแผนการแจกแจงตัวอย่างซึ่งอนุญาตให้พวกเขาตรวจสอบว่าเหตุการณ์อาจเกิดขึ้นภายในประชากรบางกลุ่มหรือไม่ ซึ่งอาจรวมถึงการเติบโตทางธุรกิจหรือแนวโน้มประชากรซึ่งสามารถช่วยธุรกิจรัฐบาลและหน่วยงานอื่น ๆ ทำการตัดสินใจที่ดีขึ้นสำหรับอนาคต