绘制概率分布
无论您对市场的可预测性或效率有何看法,您都可能同意,对于大多数资产,保证的回报都是不确定或冒险的。如果我们忽略了基础的数学概率分布,我们可以看到它们是描述不确定性的特定观点的图片。概率分布是一个统计计算,它描述了给定变量在绘图图上的特定范围之间或之内的机会。
不确定性是指随机性。它与缺乏可预测性不同,或者市场效率低下。新兴的研究观点认为金融市场既不确定又可预测。而且,市场可以是高效的但也不确定。
在金融中,我们使用概率分布来绘制图片,以说明我们对资产返回敏感性的看法,而当我们认为资产归还可以视为一种随机变量。在本文中,我们将介绍一些最受欢迎的概率分布,并向您展示如何计算它们。
分布可以归类为离散的或连续的,以及是否是概率密度函数(pdf)或a累积分布。
关键要点
- 概率分布是交易者使用的一种统计计算,以证明特定变量将位于盆栽图表上的一定范围内的可能性。
- 概率分布用于强调市场参与者对资产返回敏感性的阅读,当收益视为随机变量时。
- 概率分布的特征是离散或连续的,并且作为概率密度函数或累积分布的工作。
离散与连续分布
离散的是指从有限的可能结果集中绘制的随机变量。例如,一个六面的模具具有六个离散结果。连续分布是指从无限集中绘制的随机变量。连续随机变量的示例包括速度,距离和一些资产回报。通常用点或破折号说明离散的随机变量,而连续变量则用实线说明。下图显示了正态分布的离散和连续分布意思是(预期值)50和a标准偏差10:
分布是试图绘制不确定性的尝试。在这种情况下,最有可能的结果最有可能,但只有4%的时间才会发生。结果40是低于平均值的标准偏差,其时间将不到2.5%。
概率密度与累积分布
另一个区别是概率密度函数(PDF)和累积分布函数。 PDF是我们的随机变量达到特定值的概率(或在连续变量的情况下,在间隔之间落入)。我们通过指示随机变量的概率来表明x将等于实际值X:
p[x=x这是给出的
累积分布是随机变量的概率x将小于或等于实际价值X:
p[x<=x这是给出的
例如,如果您的高度是一个随机变量,则期望值在5'10英寸英寸(您的父母的平均身高)中,PDF问题是:“您的高度达到5'4”的可能性是多少?”相应的累积分配函数问题是:“您将比5'4的概率短?”
上图显示了两个正常分布。现在,您可以看到这些是概率密度函数(PDF)图。如果我们重新绘制与累积分布完全相同的分布,我们将获得以下内容:
累积分布最终必须达到Y轴的1.0或100%。如果我们足够高的栏,那么在某个时候,几乎所有结果都将属于该条形(我们可以说分布通常是渐近的1.0)。
金融是一门社会科学,不像物理科学那样干净。例如,重力具有一个优雅的公式,我们可以一次又一次地依靠。金融资产另一方面,返回不能如此稳定地复制。多年来,聪明的人损失了大量的钱,这些人将准确的分布(即源自物理科学衍生而来)与试图描绘财务回报的混乱,不可靠的近似值混淆了。在金融中,概率分布只不过是粗略的图形表示。
均匀分布
最简单,最受欢迎的分布是均匀分布,其中所有结果都有同等的发生机会。六面的模具具有均匀的分布。每个结果的概率约为16.67%(1/6)。我们下面的图显示了实线(因此您可以更好地看到它),但请记住,这是一个离散的分布 - 您不能滚动2.5或2.11:
现在,将两个骰子一起滚动,如下图所示,分布不再均匀。它达到七个峰值,恰好有16.67%的机会。在这种情况下,所有其他结果都不太可能:
现在,将三个骰子一起滚动,如下图所示。我们开始看到最令人惊奇的定理的效果:中央限制定理。中心限制定理大胆地承诺,一系列自变量的总和或平均值往往会正态分布,不管他们自己的分销。我们的骰子是个体均匀的,但将它们结合在一起,并且 - 正如我们添加更多的骰子一样,它们的总和几乎会趋向于熟悉的正态分布。
二项式分布
这二项式分布反映了一系列“/或”试验,例如一系列硬币折腾。这些被称为Bernoulli审判- 指的是只有两个结果的事件 - 但您甚至不需要(50/50)的赔率。下面的二项式分布绘制了一系列10个硬币折腾,其中头部的概率为50%(p-0.5)。您可以在下图中看到,恰好翻转五个头和五个尾巴(订单无关紧要)的机会仅为25%:
如果二项式分布对您来说是正常的,那么您对此是正确的。随着试验数量的增加,二项式趋向于正态分布。
对数正态分布
这对数正态分布在金融中非常重要,因为许多最受欢迎的模型都认为股票价格是按物体伸展的。将资产返回混淆很容易价格水平。
资产回报通常被视为普通人 - 股票可以上涨10%或下降10%。价格水平通常被视为lognormal,10美元的股票最高可达30美元,但不能降至10美元。对数正态分布非零,偏向右侧(同样,股票不能低于零,但没有理论上的上行限制):
泊松
这泊松分布用于描述某个事件的几率(例如,每天文件夹损失低于5%)在时间间隔内发生。因此,在下面的示例中,我们假设某些操作过程的错误率为3%。我们进一步假设100个随机试验;泊松分布描述了在一段时间内(例如一天)遇到一定数量错误的可能性。
学生的t
学生的T分布也非常受欢迎,因为它的尾巴比正常分布略“较胖”。当我们的样本量很小时,通常使用学生的T(即小于30)。在金融中,左尾代表损失。因此,如果样本量很小,我们敢于低估损失的几率。学生t上的尾巴会帮助我们在这里。即便如此,这种分布的脂肪尾巴通常不够脂肪。在罕见的灾难性场合,财务回报往往会表现出真正的脂肪尾损失(即比分布所预测的胖子)。从这一点上讲,大量的钱已经损失了。
beta分布
最后,beta分布(不要与beta参数资本资产定价模型)在估计的模型中很受欢迎恢复率在债券投资组合上。 Beta分布是分布的实用程序。像普通人一样,它仅需要两个参数(alpha和beta),但是可以合并它们以具有显着的灵活性。下面说明了四个可能的Beta分布:
底线
就像我们统计鞋壁橱中的许多鞋子一样,我们尝试选择最适合这种情况的鞋子,但我们真的不知道天气对我们来说是什么。我们可以选择一个正态分布,然后发现低估的左尾损失;因此,我们切换到偏斜的分布,只是发现数据在下一个时期看起来更加“正常”。下面的优雅数学可能会引诱您以为这些分布揭示了一个更深层的真理,但它们更有可能仅仅是人工制品。例如,我们审查的所有分布都非常流畅,但是某些资产回报不连续。
正态分布无处不在且优雅,仅需要两个参数(平均值和分布)。许多其他分布会趋于正常(例如,二项式和泊松)。但是,许多情况,例如对冲基金收益,信贷投资组合和严重的损失事件,不应该得到正常分布。