什么是二项式分布?
二项式分布是一个统计分布,总结了一个值将在给定的参数或假设集中采用两个独立值之一的概率。
二项式分布的基本假设是,每个试验只有一个结果,每个试验的成功概率相同,并且每个试验都是相互排斥或彼此独立的。
关键要点
- 二项式分布指出,一个值将在给定的一组参数或假设下采用两个值之一的可能性。
- 二项式分布所基于的假设是,每个试验只有一个结果,每个试验都有相同的成功机会,并且每个试验都相互排斥。
- 二项式分布是统计中使用的常见离散分布,而不是连续分布(例如正态分布)。
了解二项式分布
首先,二项式分布中的“二项式”意味着有两件事:成功的数量和尝试的数量。每个人都没有用。
二项式分布是离散分布,不是连续的分布(例如正态分布)。这是因为二项式分布仅计算两个状态,通常表示为1(成功)或0(由于失败),给定数据中的许多试验。因此,鉴于每个试验的成功概率P,二项式分布代表了N试验中X成功的概率。
当每个试验的概率相同的可能性达到一个特定值时,二项式分布总结了试验的数量或观察次数。二项式分布决定了在指定数量的试验中观察特定数量的成功结果的可能性。
重要的
二项式分布经常在社会科学统计学中用作二分法结果变量模型的基础,例如共和党还是民主党人是否会赢得即将举行的选举,个人是否会在指定的时期内死亡,等等。它在其他行业中也有申请。
分析二项式分布
二项式分布的期望值或平均值是通过将试验(n)的数量乘以成功的概率(p)或n×p来计算的。
例如,在100个头部或尾部试验中,头部的预期值为50,或(100×0.5)。二项式分布的另一个常见例子是估计篮球中罚球射手成功的机会,其中1 =一个篮筐,0 =失败。
将二项式分布函数计算为:
p(x:n,p)=ncxpx(1- P)n -x
在哪里:
- n是试验的数量(发生)
- X是成功试验的数量
- P是单个试验中成功的概率
- ncx是N和X的组合。组合是从一组n个不同对象中选择x元素样本的方法的数量,这些n不同对象无关紧要,并且不允许替换。注意ncx= n! / r! (n -r)! ), 在哪里 !是阶乘(因此,4!= 4×3×2×1)。
二项式分布的平均值为NP,二项式分布的方差为NP(1 -P)。当p = 0.5时,分布是对称在平均值周围(例如翻转硬币时),因为获得头或尾巴的机会为50%或0.5。当p> 0.5时,分布曲线偏向左侧。当p <0.5时,分布曲线偏向右侧。
二项式分布是一系列多个独立和相同分布的Bernoulli试验的总和。在Bernoulli试验中,据说该实验是随机的,只能有两个可能的结果:成功或失败。
例如,翻转硬币被认为是伯努利审判;每个试验只能采用两个值之一(头或尾巴),每个成功的概率相同,一个试验的结果不会影响另一个试验的结果。 Bernoulli分布是二项式分布的特殊情况,其中试验数n = 1。
二项式分布的示例
二项式分布是通过乘以成功数量和成功率的成功概率而计算的。可能性失败的力量与成功数量和试验数量之间的差异。然后,将产品乘以试验和成功数量的组合。
例如,假设赌场创建了一个新游戏,其中参与者可以在指定数量的硬币翻转中下注头或尾巴的赌注。假设参与者想下注10美元的赌注,即将有20个硬币翻转中的六个头。参与者希望计算发生这种情况的概率,因此,他们将计算用于二项式分布。
概率计算为(20! /(6!×(20-6)!))×(0.50)(6)×(1-0.50)(20-6)。因此,在20个硬币翻转中恰好发生六个头部的概率为0.0369,即3.7%。在这种情况下,预期价值为10个负责人,因此参与者下注不佳。下图显示平均值为10(预期值),获得六个头的机会在左尾部为红色。您会看到,六个头部发生的机会少于七个,八,九,10、11、12或13头。
StatCrunch二项式计算器
那么如何在金融中使用呢?一个例子:假设您是银行,一个贷方,这想在三个小数点内知道特定借款人违约的可能性。这么多借款人的机会是什么默认他们会使银行无力偿债吗?一旦使用二项式分布函数来计算该数字,您就可以更好地了解如何为保险定价,并最终要借出多少钱并保留。
二项式分布意味着什么?
二项式分布指出,一个值将在给定的一组假设下采用两个独立值之一的可能性。
如何使用二项式分布?
这种分布模式用于统计数据,但对金融和其他领域具有影响。银行可以使用它来估计特定借款人违约的可能性,借多少钱以及保留的金额。它也用于保险行业来确定保单定价和评估风险。
为什么二项式分布很重要?
二项式分布用于计算调查中通过或失败结果的概率,或多次复制的实验。这种类型的分布只有两个潜在结果。更广泛地说,分布是分析数据集以估计数据的所有潜在结果以及它们发生的频率的重要组成部分。预测和理解结果的成功或失败对于业务发展至关重要。
底线
二项式分布是描述二进制结果的重要统计分布(例如硬币的翻转,是/否答案或开/关条件)。了解其特征和功能对于在各种情况下的数据分析很重要,涉及以两种独立值之一的结果之一。
它在社会科学,金融,银行,保险和其他领域中有申请。例如,它可以用来估计借款人是否会拖欠贷款,期权合约是否将完成货币货币或货币货币,或者公司是否会错过或击败收益估算。