การกระจายความน่าจะเป็นคืออะไร?
การกระจายความน่าจะเป็นเป็นฟังก์ชันทางสถิติที่อธิบายถึงค่าที่เป็นไปได้ทั้งหมดและโอกาสที่กตัวแปรสุ่มสามารถใช้เวลาในช่วงที่กำหนด ช่วงนี้จะถูก จำกัด ระหว่างค่าต่ำสุดและสูงสุดที่เป็นไปได้ อย่างไรก็ตามในกรณีที่ค่าที่เป็นไปได้มีแนวโน้มที่จะถูกพล็อตในการแจกแจงความน่าจะเป็นขึ้นอยู่กับปัจจัยหลายประการ ปัจจัยเหล่านี้รวมถึงการกระจายหมายถึง(เฉลี่ย),ค่าเบี่ยงเบนมาตรฐาน-ความเบ้, และKurtosis-
ประเด็นสำคัญ
- การกระจายความน่าจะเป็นแสดงให้เห็นถึงผลลัพธ์ที่คาดหวังของค่าที่เป็นไปได้สำหรับกระบวนการสร้างข้อมูลที่กำหนด
- การแจกแจงความน่าจะเป็นมาในหลายรูปแบบที่มีลักษณะต่าง ๆ
- พวกเขาถูกกำหนดโดยค่าเฉลี่ยค่าเบี่ยงเบนมาตรฐานความเบ้และ kurtosis
- นักลงทุนใช้การกระจายความน่าจะเป็นเพื่อคาดการณ์ผลตอบแทนจากสินทรัพย์เช่นหุ้นเมื่อเวลาผ่านไปและเพื่อป้องกันความเสี่ยง
การแจกแจงความน่าจะเป็นอย่างไร
บางทีการกระจายความน่าจะเป็นที่พบบ่อยที่สุดคือการกระจายปกติหรือเส้นโค้งระฆังแม้ว่าการแจกแจงหลายครั้งจะใช้กันทั่วไป กระบวนการสร้างข้อมูลของปรากฏการณ์บางอย่างมักจะกำหนดการกระจายความน่าจะเป็น กระบวนการนี้เรียกว่าฟังก์ชันความหนาแน่นของความน่าจะเป็น
การแจกแจงความน่าจะเป็นยังสามารถใช้ในการสร้างฟังก์ชั่นการแจกแจงแบบสะสม (CDFs) ที่เพิ่มความน่าจะเป็นของการเกิดขึ้นสะสม พวกเขาจะเริ่มต้นที่ศูนย์และสิ้นสุดที่ 100%
นักวิชาการนักวิเคราะห์ทางการเงินและผู้จัดการกองทุนอาจกำหนดการกระจายความน่าจะเป็นของหุ้นโดยเฉพาะเพื่อประเมินผลตอบแทนที่คาดหวังซึ่งหุ้นอาจให้ผลตอบแทนในอนาคต
สำคัญ
ประวัติผลตอบแทนของหุ้นสามารถวัดได้จากช่วงเวลาใด ๆ และมีแนวโน้มที่จะประกอบด้วยเพียงเศษเสี้ยวของผลตอบแทนของหุ้น สิ่งนี้จะอยู่ภายใต้การวิเคราะห์ถึงข้อผิดพลาดในการสุ่มตัวอย่าง- ข้อผิดพลาดนี้สามารถลดลงได้อย่างมากโดยการเพิ่มขนาดตัวอย่าง
การกระจายความน่าจะเป็นแบบไม่ต่อเนื่องกับการกระจายความน่าจะเป็นอย่างต่อเนื่อง
การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องและต่อเนื่องเป็นสองประเภทพื้นฐานของการแจกแจงความน่าจะเป็นแต่ละประเภทอธิบายตัวแปรสุ่มชนิดต่าง ๆ การทำความเข้าใจความแตกต่างระหว่างพวกเขาเป็นสิ่งจำเป็นสำหรับการใช้วิธีการทางสถิติอย่างถูกต้องและการตีความข้อมูล
การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องอธิบายสถานการณ์ที่ชุดของผลลัพธ์ที่เป็นไปได้นับได้และ จำกัด หรือไม่มีที่สิ้นสุดที่นับได้ การแจกแจงเหล่านี้จะใช้เมื่อตัวแปรสุ่มสามารถใช้กับค่าที่เฉพาะเจาะจงและแตกต่างกัน
ตัวอย่างเช่นจำนวนหัวในการพลิกเหรียญ 10 เหรียญหรือจำนวนลูกค้าที่เดินทางมาถึงร้านค้าในหนึ่งชั่วโมงเป็นกรณีของตัวแปรสุ่มแบบไม่ต่อเนื่อง ในสถานการณ์เหล่านี้คุณสามารถแสดงรายการผลลัพธ์ที่เป็นไปได้ทั้งหมดเช่นศูนย์หนึ่งสองและอื่น ๆ มีโอกาสมากขึ้นที่การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องนั้น "ขาด ๆ หาย ๆ " มากขึ้นเนื่องจากมีผลลัพธ์น้อยลง
ในทางตรงกันข้ามการแจกแจงความน่าจะเป็นอย่างต่อเนื่องใช้กับตัวแปรสุ่มที่สามารถใช้กับค่าใด ๆ ภายในช่วงที่กำหนด ค่าเหล่านี้ไม่สามารถนับได้เนื่องจากมีความเป็นไปได้มากมายภายในช่วงเวลาใด ๆ
ตัวอย่างเช่นความสูงที่แน่นอนของบุคคลในประชากรหรือเวลาที่แน่นอนที่ใช้ในการทำงานให้เสร็จสมบูรณ์คือตัวแปรต่อเนื่อง มีโอกาสมากขึ้นที่การแจกแจงความน่าจะเป็นอย่างต่อเนื่องอาจมีเส้นโค้งการกระจายที่ราบรื่นขึ้นเนื่องจากอาจมีผลลัพธ์มากขึ้น
ประเภทของการแจกแจงความน่าจะเป็น
การแจกแจงความน่าจะเป็นมีการจำแนกประเภทมากมาย พวกเขารวมถึงปกติไคสแควร์-ทวินามและการกระจายปัวซอง การแจกแจงความน่าจะเป็นเหล่านี้มีวัตถุประสงค์ที่แตกต่างกันและแสดงถึงกระบวนการสร้างข้อมูลที่แตกต่างกัน
ทวินาม
การกระจายแบบทวินามประเมินความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นหลายครั้งจากจำนวนการทดลองที่กำหนดเนื่องจากความน่าจะเป็นของเหตุการณ์ในการทดลองแต่ละครั้ง มันอาจถูกสร้างขึ้นโดยการติดตามว่ามีจำนวนนักเล่นบาสเก็ตบอลโยนฟรีในเกมโดยที่ 1 = ตะกร้าและ 0 = พลาด
อีกตัวอย่างหนึ่งคือการใช้เหรียญและหาความน่าจะเป็นของเหรียญที่ขึ้นมาใน 10 พลิกตรง การแจกแจงแบบทวินามนั้นไม่ต่อเนื่องมากกว่าต่อเนื่องเพราะมีเพียงหนึ่งหรือศูนย์คือการตอบสนองที่ถูกต้อง
ปกติ
การแจกแจงที่ใช้กันมากที่สุดคือการแจกแจงแบบปกติ สิ่งนี้ใช้บ่อยในด้านการเงินการลงทุนวิทยาศาสตร์และวิศวกรรม การแจกแจงแบบปกตินั้นมีลักษณะอย่างเต็มที่โดยค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐาน การกระจายไม่เบ้และมันแสดงถึง kurtosis
สิ่งนี้ทำให้การกระจายสมมาตร มันปรากฎเป็นเส้นโค้งรูประฆังเมื่อวางแผน การแจกแจงแบบปกติถูกกำหนดโดยค่าเฉลี่ย (เฉลี่ย) ของศูนย์และค่าเบี่ยงเบนมาตรฐานของหนึ่งที่มีความเบ้ของศูนย์และ kurtosis = 3
ประมาณ 68% ของข้อมูลที่เก็บรวบรวมในการแจกแจงปกติจะอยู่ภายใน +/- หนึ่งส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ย ประมาณ 95% จะอยู่ใน +/- เบี่ยงเบนมาตรฐานสองตัวและ 99.7% จะอยู่ใน +/- ค่าเบี่ยงเบนมาตรฐานสามแบบ ซึ่งแตกต่างจากการกระจายแบบทวินามการกระจายปกติจะต่อเนื่อง ค่าที่เป็นไปได้ทั้งหมดจะแสดงมากกว่าศูนย์และหนึ่งที่ไม่มีอะไรอยู่ระหว่างนั้น
บันทึก
ความน่าจะเป็นคือการวัดทางคณิตศาสตร์ของโอกาสที่เหตุการณ์จะเกิดขึ้น นอกจากนี้ยังหมายถึงสาขาคณิตศาสตร์ที่เกี่ยวข้องกับเหตุการณ์และคำอธิบายเชิงตัวเลขว่าพวกเขาจะเกิดขึ้นได้อย่างไร
การแจกจ่ายปัวซอง
การแจกแจงปัวซองเป็นการกระจายความน่าจะเป็นแบบไม่ต่อเนื่องซึ่งเป็นแบบจำลองจำนวนเหตุการณ์ที่เกิดขึ้นภายในระยะเวลาหรือพื้นที่คงที่ เหตุการณ์เหล่านี้จะต้องเกิดขึ้นอย่างอิสระซึ่งกันและกันและอัตราเฉลี่ย (จำนวนเงินเฉลี่ยของเหตุการณ์) จะต้องคงที่
ลักษณะสำคัญของการแจกแจงปัวซองคืออธิบายถึงความน่าจะเป็นของจำนวนเหตุการณ์ที่เกิดขึ้นภายในช่วงเวลาที่กำหนดเมื่อเหตุการณ์นั้นหายากและเป็นอิสระ
การแจกแจงปัวซองถูกใช้ในแอปพลิเคชันในโลกแห่งความจริงที่เหตุการณ์เกิดขึ้นแบบสุ่มและเป็นอิสระ ตัวอย่างเช่นสามารถสร้างแบบจำลองจำนวนการมาถึงของลูกค้าที่ธนาคารในหนึ่งชั่วโมงจำนวนอีเมลที่ได้รับในหนึ่งวันหรือจำนวนการโทรที่ศูนย์บริการต่อนาที
การกระจายความน่าจะเป็นที่ใช้ในการลงทุน
ผลตอบแทนจากสต็อกมักจะถูกแจกจ่ายตามปกติ แต่พวกเขาแสดง kurtosis ที่มีผลตอบแทนเชิงลบขนาดใหญ่และผลตอบแทนที่เป็นบวกดูเหมือนจะเกิดขึ้นมากกว่าที่จะทำนายโดยการแจกแจงแบบปกติ
การกระจายของผลตอบแทนหุ้นได้รับการอธิบายว่าเป็นบันทึกปกติเนื่องจากราคาหุ้นถูก จำกัด ไว้เป็นศูนย์ แต่เสนอ upside ที่ไม่ จำกัด สิ่งนี้แสดงให้เห็นถึงพล็อตของสต็อกผลตอบแทนด้วยหางของการกระจายที่มีความหนามากขึ้น
การแจกแจงความน่าจะเป็นมักใช้ในการจัดการความเสี่ยงเช่นกันเพื่อประเมินความน่าจะเป็นและจำนวนการสูญเสียที่พอร์ตการลงทุนจะเกิดขึ้นจากการกระจายผลตอบแทนในอดีต
หนึ่งตัวชี้วัดความเสี่ยงที่ได้รับความนิยมที่ใช้ในการลงทุนคือคุณค่าสู่ความเสี่ยง (คือ)- VAR ให้ผลการสูญเสียขั้นต่ำที่สามารถเกิดขึ้นได้เนื่องจากความน่าจะเป็นและกรอบเวลาสำหรับพอร์ตโฟลิโอ นักลงทุนสามารถได้รับความน่าจะเป็นของการสูญเสียสำหรับจำนวนการสูญเสียและกรอบเวลาโดยใช้ VAR การใช้ในทางที่ผิดและความเชื่อมั่นใน VAR นั้นมีส่วนเกี่ยวข้องเป็นหนึ่งในสาเหตุสำคัญของวิกฤตการณ์ทางการเงินปี 2551-
การกระจายความน่าจะเป็นและทฤษฎีขีด จำกัด กลาง
ทฤษฎีบทขีด จำกัด กลาง (CLT) เป็นหลักการทางสถิติที่ระบุว่าการกระจายของผลรวมของตัวแปรสุ่มอิสระจำนวนมากที่กระจายตัวเป็นอิสระเข้าใกล้การแจกแจงแบบปกติ
ทฤษฎีบทนี้มีความสำคัญเนื่องจากช่วยให้นักสถิติสามารถทำการอนุมานเกี่ยวกับพารามิเตอร์ประชากรแม้ว่าจะไม่ทราบการกระจายประชากรตราบใดที่ขนาดตัวอย่างมีขนาดใหญ่พอสมควร
หนึ่งในความหมายที่สำคัญของ CLT คือสำหรับตัวอย่างขนาดใหญ่การกระจายการสุ่มตัวอย่างของค่าเฉลี่ยตัวอย่างจะถูกกระจายโดยประมาณปกติ
ตัวอย่างเช่นลองจินตนาการว่าคุณมีชั้นเรียนของนักเรียนที่ความสูงของนักเรียนแต่ละคนแตกต่างกันไป แต่โดยเฉลี่ยแล้วพวกเขามักจะสูงประมาณ 5 ฟุตด้วยความแปรปรวนบางอย่าง จากข้อมูลของ CLT การกระจายตัวอย่างความสูงเฉลี่ยจะมีแนวโน้มที่จะเป็นไปตามเส้นโค้งปกติ (รูประฆัง)
ตัวอย่างของการกระจายความน่าจะเป็น
ดูจำนวนที่สังเกตได้เมื่อกลิ้งลูกเต๋าหกด้านมาตรฐานสองตัว ผู้ตายแต่ละคนมีความน่าจะเป็น 1/6 ที่จะหมุนหมายเลขใด ๆ หนึ่งถึงหกถึงหก แต่ผลรวมของลูกเต๋าสองตัวจะสร้างการกระจายความน่าจะเป็นที่แสดงในภาพนี้ เจ็ดเป็นผลลัพธ์ที่พบบ่อยที่สุด (1+6, 6+1, 5+2, 2+5, 3+4, 4+3) สองและ 12 มีโอกาสน้อยกว่า (1+1 และ 6+6)
อะไรทำให้การกระจายความน่าจะเป็นถูกต้อง?
สองขั้นตอนตรวจสอบว่าการกระจายความน่าจะเป็นถูกต้องหรือไม่ การวิเคราะห์ควรกำหนดในขั้นตอนที่หนึ่งว่าความน่าจะเป็นแต่ละอย่างมากกว่าหรือเท่ากับศูนย์และน้อยกว่าหรือเท่ากับหนึ่ง พิจารณาในขั้นตอนที่สองว่าความน่าจะเป็นทั้งหมดเท่ากับหนึ่งหรือไม่ การกระจายความน่าจะเป็นนั้นถูกต้องหากทั้งขั้นตอนที่หนึ่งและขั้นตอนที่สองเป็นจริง
การแจกแจงความน่าจะเป็นในการเงินเป็นอย่างไร?
การแจกแจงความน่าจะเป็นคือใช้ในด้านการเงินในสองวิธีหลัก:
- เพื่อประเมินผลตอบแทนของสินทรัพย์การลงทุน
- เพื่อกำหนดความเป็นไปได้ของเหตุการณ์การสูญเสียซึ่งจะช่วยให้นักลงทุนป้องกันความเสี่ยง
การแจกแจงความน่าจะเป็นที่ใช้กันมากที่สุดคืออะไร?
การแจกแจงความน่าจะเป็นที่ใช้กันมากที่สุดคือเครื่องแบบทวินาม, เบอร์นูลลี, ปกติ, ปัวซองและเลขชี้กำลัง
ความน่าจะเป็นและอัตราต่อรองที่แตกต่างกันคืออะไร?
ความน่าจะเป็นวัดความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นแสดงเป็นอัตราส่วนของจำนวนผลลัพธ์ที่ดีต่อจำนวนผลลัพธ์ที่เป็นไปได้ทั้งหมด ในทางกลับกันอัตราต่อรองแสดงถึงอัตราส่วนของความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นกับความน่าจะเป็นที่จะไม่เกิดขึ้น ตัวอย่างเช่นหากความน่าจะเป็นของการชนะเกมคือ 0.25 อัตราต่อรองคือ 1: 3 (ชนะหนึ่งครั้งกับการสูญเสียสามครั้ง)
กฎของจำนวนมากคืออะไร?
กฎหมายของจำนวนมากระบุว่าเมื่อจำนวนการทดลองหรือการทดลองเพิ่มขึ้นค่าเฉลี่ยของผลลัพธ์ที่ได้รับเข้าใกล้ค่าที่คาดหวังหรือความน่าจะเป็นจริง หลักการนี้รับรองว่าค่าเฉลี่ยตัวอย่างมาบรรจบกับค่าเฉลี่ยของประชากรเมื่อรวบรวมการสังเกตมากขึ้นซึ่งให้ความมั่นคงในการอนุมานทางสถิติ
บรรทัดล่าง
การแจกแจงความน่าจะเป็นอธิบายค่าที่เป็นไปได้ทั้งหมดที่ตัวแปรสุ่มสามารถใช้ได้ สิ่งนี้ใช้ในการลงทุนโดยเฉพาะอย่างยิ่งในการกำหนดประสิทธิภาพที่เป็นไปได้ของหุ้นรวมถึงในองค์ประกอบการบริหารความเสี่ยงของการลงทุนโดยช่วยกำหนดการสูญเสียสูงสุด