什麼是二項式分佈?
二項式分佈是一個統計分佈,總結了一個值將在給定的參數或假設集中採用兩個獨立值之一的概率。
二項式分佈的基本假設是,每個試驗只有一個結果,每個試驗的成功概率相同,並且每個試驗都是相互排斥或彼此獨立的。
關鍵要點
- 二項式分佈指出,一個值將在給定的一組參數或假設下採用兩個值之一的可能性。
- 二項式分佈所基於的假設是,每個試驗只有一個結果,每個試驗都有相同的成功機會,並且每個試驗都相互排斥。
- 二項式分佈是統計中使用的常見離散分佈,而不是連續分佈(例如正態分佈)。
了解二項式分佈
首先,二項式分佈中的“二項式”意味著有兩件事:成功的數量和嘗試的數量。每個人都沒有用。
二項式分佈是離散分佈,不是連續的分佈(例如常態分佈)。這是因為二項式分佈僅計算兩個狀態,通常表示為1(成功)或0(由於失敗),給定數據中的許多試驗。因此,鑑於每個試驗的成功概率P,二項式分佈代表了N試驗中X成功的概率。
當每個試驗的概率相同的可能性達到一個特定值時,二項式分佈總結了試驗的數量或觀察次數。二項式分佈決定了在指定數量的試驗中觀察特定數量的成功結果的可能性。
重要的
二項式分佈經常在社會科學統計學中用作二分法結果變量模型的基礎,例如共和黨還是民主黨人是否會贏得即將舉行的選舉,個人是否會在指定的時期內死亡,等等。它在其他行業中也有申請。
分析二項式分佈
二項式分佈的期望值或平均值是通過將試驗(n)的數量乘以成功的概率(p)或n×p來計算的。
例如,在100個頭部或尾部試驗中,頭部的預期值為50,或(100×0.5)。二項式分佈的另一個常見例子是估計籃球中罰球射手成功的機會,其中1 =一個籃筐,0 =失敗。
將二項式分佈函數計算為:
p(x:n,p)=ncxpx(1- P)n -x
在哪裡:
- n是試驗的數量(發生)
- X是成功試驗的數量
- P是單個試驗中成功的概率
- ncx是N和X的組合。組合是從一組n個不同對像中選擇x元素樣本的方法的數量,這些n不同對象無關緊要,並且不允許替換。注意ncx= n! / r! (n -r)! ), 在哪裡 !是階乘(因此,4!= 4×3×2×1)。
二項式分佈的平均值為NP,二項式分佈的方差為NP(1 -P)。當p = 0.5時,分佈是對稱在平均值周圍(例如翻轉硬幣時),因為獲得頭或尾巴的機會為50%或0.5。當p> 0.5時,分佈曲線偏向左側。當p <0.5時,分佈曲線偏向右側。
二項式分佈是一系列多個獨立和相同分佈的Bernoulli試驗的總和。在Bernoulli試驗中,據說該實驗是隨機的,只能有兩個可能的結果:成功或失敗。
例如,翻轉硬幣被認為是伯努利審判;每個試驗只能採用兩個值之一(頭或尾巴),每個成功的概率相同,一個試驗的結果不會影響另一個試驗的結果。 Bernoulli分佈是二項式分佈的特殊情況,其中試驗數n = 1。
二項式分佈的示例
二項式分佈是通過乘以成功數量和成功率的成功概率而計算的。可能性失敗的力量與成功數量和試驗數量之間的差異。然後,將產品乘以試驗和成功數量的組合。
例如,假設賭場創建了一個新遊戲,其中參與者可以在指定數量的硬幣翻轉中下注頭或尾巴的賭注。假設參與者想下注10美元的賭注,即將有20個硬幣翻轉中的六個頭。參與者希望計算發生這種情況的概率,因此,他們將計算用於二項式分佈。
概率計算為(20! /(6!×(20-6)!))×(0.50)(6)×(1-0.50)(20-6)。因此,在20個硬幣翻轉中恰好發生六個頭部的概率為0.0369,即3.7%。在這種情況下,預期價值為10個負責人,因此參與者下注不佳。下圖顯示平均值為10(預期值),獲得六個頭的機會在左尾部為紅色。您會看到,六個頭部發生的機會少於七個,八,九,10、11、12或13頭。
StatCrunch二項式計算器
那麼如何在金融中使用呢?一個例子:假設您是銀行,一個貸方,這想在三個小數點內知道特定借款人違約的可能性。這麼多藉款人的機會是什麼預設他們會使銀行無力償債嗎?一旦使用二項式分佈函數來計算該數字,您就可以更好地了解如何為保險定價,並最終要藉出多少錢並保留。
二項式分佈意味著什麼?
二項式分佈指出,一個值將在給定的一組假設下採用兩個獨立值之一的可能性。
如何使用二項式分佈?
這種分佈模式用於統計數據,但對金融和其他領域具有影響。銀行可以使用它來估計特定借款人違約的可能性,藉多少錢以及保留的金額。它也用於保險行業來確定保單定價和評估風險。
為什麼二項式分佈很重要?
二項式分佈用於計算調查中通過或失敗結果的概率,或多次復制的實驗。這種類型的分佈只有兩個潛在結果。更廣泛地說,分佈是分析數據集以估計數據的所有潛在結果以及它們發生的頻率的重要組成部分。預測和理解結果的成功或失敗對於業務發展至關重要。
底線
二項式分佈是描述二進制結果的重要統計分佈(例如硬幣的翻轉,是/否答案或開/關條件)。了解其特徵和功能對於在各種情況下的數據分析很重要,涉及以兩種獨立值之一的結果之一。
它在社會科學,金融,銀行,保險和其他領域中有申請。例如,它可以用來估計借款人是否會拖欠貸款,期權合約是否將完成貨幣貨幣或貨幣貨幣,或者公司是否會錯過或擊敗收益估算。