平均值与标准偏差的标准误差
假设您在两个工作之间进行选择。有人告诉您,这两个人平均每月支付5,000美元,但有一个收获:工作A的薪水每月根据合同每月支付5,000美元。 Job B是演出工作,您可能会在其中赚取7,500美元,而下一个月可能会赚取2,000美元。它们的平均水平相同,但在计划租金或抵押贷款时意味着非常不同的事情。
这样的情况就是为什么采用标准偏差(通常象征为σ)和平均值(SEM)等标准误差等统计措施的原因,它们比简单平均更深入。标准偏差告诉您这些收入波动可能是多么疯狂。在我们的示例中,乔布·A的稳定薪水将具有较小的标准偏差(实际上,在整个月份中都没有),而乔布·B(Job B)不可预测的演出收入将具有很大的收入。
SEM解决了一个不同的问题:您能相信多少5,000美元的数字?如果工作A的平均值来自在几年内跟踪数百名员工,但是Job B的平均值是基于上个月的几个演出工人的经验,那是您决定的关键信息。标准偏差最简洁的是,数据将数据聚集在一个示例数据中,而SEM是围绕一组给定的事物的许多样本聚集的均值。我们在下面解决两个。
关键要点
- 标准偏差描述了数据集中有多少可变性(或波动)。
- 平均值(SEM)的标准误差指示数据集通过将数据集的平均值与总体平均值进行比较来代表真实总体的准确性。
- 数据集的大小(样本量)不会影响标准偏差,但是样本量是计算SEM的关键因素。
- 较大的随机样本将始终提供更接近人口平均值的平均值。
朱尔斯·加西亚(Joules Garcia) / investopedia
如何使用SEM和标准偏差
标准偏差和SEM都广泛用于科学研究,业务和金融,以衡量数据可靠性。他们通常在一起报告。
使用标准偏差
从体育分析到融资和投资,都采用了标准偏差。在金融中,标准偏差是帮助企业和投资者量化风险的关键,因此,他们需要从投资中获得的回报才能使其值得。
在现代投资组合理论中标准偏差用于确定未来绩效的可能结果的范围,包括整个个人资产和投资组合。提出它的另一种方法是衡量挥发性,这是一种测量的方式风险。可能的结果或波动性的标准偏差越高,风险越大。
让我们回到我们可用的工作的示例。假设您正在查看您的每月收入弹跳的演出工作位置。该公司告诉您平均每月收入为5,000美元,标准偏差为1,000美元。但是,这实际上对您的银行帐户意味着什么?
1,000美元的标准偏差告诉您,您的每月薪水中约有三分之二将在4,000至6,000美元以内($ 5,000±1,000美元)。但是几个月将超出此范围。您可能会有一个月的发薪日为6,100美元,但是当您赚4,100美元时,您还必须为艰难的月份做好准备。
这是实际知识:在工作稳定的情况下,您可能只需要将一个月的费用作为安全网。那是因为其标准偏差应为零,根据合同设定。但是,借助您的演出工作及其1,000美元的标准偏差,您需要一个更大的应急基金来处理这些低收入的月份。
使用平均值的标准错误
SEM通常用于科学研究,医学研究和临床试验,以及政治调查和许多其他领域。在金融和投资中,通过评估样本数据集的可靠性,使用SEM来判断诸如平均收益,风险和经济指标之类的估计的一致性或不确定性。
例如,投资者或基金经理经常使用历史数据来计算股票或指数的平均收益。他们使用SEM来计算根据所使用的数据样本(包括不同的时间范围,市场状况等)的这些未来收益可能波动的数量。
虽然标准偏差揭示了存在多少变化之内单个样本SEM显示样品的平均值正确。 SEM越小,您的样本的平均值就越接近整个人群的实际平均水平(请记住,在统计数据中,“人口”不仅仅是人,而且可能是特定工作的每月薪水)。
这是公式:
哪个=n一个
在哪里:
- σ表示人口。实际上,我们很少知道真正的人口标准偏差。我们通常将样品的标准偏差作为估计值。
- n是样本量- 样本中的数据点数。
- √n是样本量的平方根。
虽然在线计算器可以为您处理以上内容,但概念很简单:样本量越小,与真实人群相匹配的机会越小。
回到我们的工作例子,假设您不仅考虑一个演出的工作机会,而且还在研究领域所有演出工人的收入。您不可能调查每个人,因此您要采取样本。假设您调查了100名演出工人,并找到他们的平均每月收入为5,000美元,SEM为100美元。
100美元的SEM与您的个人薪水无关,而是关于所有演出工人的平均$ 5,000的可靠性。 100美元的SEM告诉您,如果您要多次重复调查,每次采集不同的100名演出工人的样本,平均那些样本意味着将聚集在真实人口平均值上。具体而言,这些样本手段中约有68%落在$ 4,900和5,100美元(5,000美元±$ 100)之内。其中约95%的人将落入两个标准错误(4,800美元至5,200美元,或$ 5,000 +/- $ 200。
这是研究研究时的实际知识。想象一下,另一位研究人员仅调查25名演出工人,还报告平均收入为5,000美元。由于它们的样本量较小,因此他们的SEM可能会更大(例如,200美元)。这意味着他们的平均$ 5,000比您的可靠性不那么可靠。他们对真实人口均值的估计,存在更广泛的不确定性。
SEM使您了解在报告的平均水平上可以放心多少信心。较小的SEM意味着更大的信心,表明样本平均值是对实际人口均值的良好表示。较大的SEM表示更大的不确定性,这意味着真实的人口平均值可能与样本的平均值有很大不同。
底线
平均值的标准偏差和标准误差都是财务和投资中普遍使用的可变性措施,以及任何需要统计分析的领域。在投资中,两者都用于评估风险:标准偏差查看数据集中的波动的重要性,并评估SEM与实际人群相比的均值可靠性。