什么是统计信息?
统计数据是应用数学的一个分支,涉及从定量数据中收集,描述,分析和推断结论。统计背后的数学理论在很大程度上依赖于差分和整体演算,线性代数和概率理论。
那些使用统计的人被称为统计学家。他们特别关注确定如何得出有关大型群体的可靠结论以及来自小样本的行为以及其他可观察到的特征的一般事件。这些样品代表了大组的一部分或一般现象的数量有限的实例。
关键要点
- 统计数据是对数据的研究和操纵,其中包括收集,审查,分析和得出结论的方法。
- 统计的两个主要领域是描述性和推论性的。
- 统计数据可以在不同的级别上传达,从非数字描述符,名义级别或数值,参考零点或比率水平。
- 几种采样技术可用于编译统计数据,包括简单的随机,系统,分层或群集采样。
- 统计数据几乎存在于每个公司的每个部门,它们是投资不可或缺的一部分。
Dennis Madamba / Investopedia
了解统计
统计数据几乎用于所有科学学科,例如物理和社会科学以及商业,医学,人文,政府和制造业。统计数据是应用数学的一个分支,包括从数学工具到概率理论的应用,包括微积分和线性代数。
这是我们可以了解大型对象或事件的属性的想法(a人口)通过研究较小数量的类似物体或事件的特征(a样本)。在许多情况下,收集有关整个人口的综合数据过于昂贵,困难或不可能,因此统计数据始于可以方便或负担得起的样本。
统计学家测量和收集有关样本的个人或要素的数据,并分析这些数据以生成描述性统计。然后,他们可以使用样本数据的这些观察到的特征来推断或对广泛人口的未衡量特征进行良好的猜测。这些被称为参数。
快速事实
统计数据可以追溯到几个世纪。法国数学家皮埃尔·德·费尔马特(Pierre de Fermat)和布莱斯·帕斯卡(Blaise Pascal)在1654年的对应关系的早期记录通常被称为统计概率分析的早期例子。
描述性和推论统计
统计的两个主要领域是描述性统计和推论统计。描述性统计描述样本和人口数据的特性。推论统计使用这些特性来检验假设并得出结论。
描述性统计数据包括平均值或平均值,方差,偏斜, 和峰度。推论统计数据包括线性回归分析,方差分析或ANOVA,Logit/ProbIT模型和无假设检验。
描述性统计
描述性统计主要关注样本数据的中心趋势,可变性和分布。中心趋势是指特征的估计,这是样本或人群的典型元素。它包括描述性统计数据,例如意思是,,,,中位数, 和模式。
可变性是指一组统计数据,这些统计数据表明样本或人群沿所测量的特征的元素有多大差异。它包括范围等指标,方差, 和标准偏差。
分布是指数据的总体“形状”。这可以在图表上描绘,例如直方图或点图,并包括概率分布函数,偏度和峰度等属性。
描述性统计还可以描述数据集元素的观察到特征之间的差异。他们可以帮助我们了解数据样本元素的集体特性,并构成测试假设并使用推论统计进行预测的基础。
推论统计
推论统计是统计学家用来得出有关人群特征的结论的一种工具。它是从样本的特征中得出的。它还用于确定统计学家如何具有这些结论的可靠性。统计学家可以计算统计数据将提供准确图片的概率,以根据样本量和分布从中绘制样本的整个人群的相应参数。
推论统计数据用于对大型群体进行概括,例如通过调查消费者样本的购买习惯或试图预测未来事件,从而估计产品的平均需求。这可能意味着根据示例期间的回报预测安全性或资产类别的未来回报。
回归分析是一种广泛使用的统计推断技术。它用于确定因变量与一个或多个解释性或自变量之间关系的强度和性质。经常分析回归模型的输出的统计显着性。通过测试或实验产生的发现的结果不可能随机或偶然发生。
统计显着性表明,结果归因于数据所解释的特定原因。
重要的
具有统计学意义对于严重依赖数据和研究的学术学科或从业者来说很重要。
卑鄙,中位数和模式
术语“平均值”,“中间”和“模式”属于中心趋势的保护。他们描述了给定样本组中典型的元素。您可以通过在组中添加数字并将结果除以数据集观测值的数量来找到平均描述符。
集合中的中间数是中位数。所有包含数字的一半高于中位数,一半较低。如果有五套房屋,市区的中位房屋价值为$ 350,000,价值为500,000美元,$ 400,000,$ 350,000,325,000美元和300,000美元。两个值更高,两个值较低。
模式标识了最高值和最低值之间的数字。它在数据集中最常出现。
了解统计数据
统计的根由变量驱动。变量是可以计数的数据集,该数据集可以标记项目的特征或属性。汽车可以具有诸如制造,型号,年度,里程,颜色或状况之类的变量。统计数据使我们可以通过组合一组数据(例如停车场所有汽车的颜色)的变量来更好地理解趋势和结果。
有两种类型的变量。
定性变量
定性变量是通常非数字的特定属性。统计中定性变量的示例包括性别,眼睛颜色或出生城市。定性数据通常用于确定任何给定的定性变量发生的结果的百分比。定性分析通常不依赖数字。试图确定女性拥有业务分析的百分比来定性数据。
定量变量
统计中的第二种变量是定量变量。这些是数字研究的,只有在非数字描述符时才具有重量。此信息植根于数字。行驶的行驶里程是一个定量变量,但是60,000的数字没有价值,除非它知道这是驱动的英里总数。
定量变量可以进一步分为两类。离散变量在统计数据中存在局限性,并推断潜在离散变量值之间存在差距。足球比赛中得分的积分数量是一个离散变量,因为没有小数,球队只能得分只能得分。
统计数据还利用连续的定量变量。这些值按比例运行。离散值具有局限性,但连续变量通常被测量为小数。在测量足球运动员的高度时,可以在可能的限制内获得任何值,并且可以将高度降低到1/16英寸的1/16英寸。
统计水平
分析变量和结果后,有几个结果的测量水平。统计数据可以通过四种方式量化结果。
标称级别的测量
在此测量中没有数值或定量价值,并且质量没有排名。相反,名义级别的测量仅是分配给其他变量的标签或类别。将标称级别的测量值视为有关变量的非数字事实,这是最简单的。
例子:美国总统于2020年当选的名字是小约瑟夫·罗宾特·拜登(Joseph Robinette Biden Jr.)
顺序级别的测量
结果可以使用此测量来按顺序排列,但所有数据值都具有相同的值或权重。它们是数值的,但是在统计数据中不能相互减去序数级测量,因为只有数据点的位置很重要。序数水平通常被纳入非参数统计数据,并与总变量组进行比较。
例子:美国弗雷德·克利(Fred Kerley)是2020年东京奥运会上的第二快人,基于100米的冲刺时间。
间隔级测量
在此测量中可以按顺序排列结果,但是数据值之间的差异现在可能具有意义。通常使用两个数据点来比较数据集中的时间或变化条件的传递。对于数据值的范围,通常没有“起点”。日历日期或温度可能没有有意义的内在零值。
例子:通货膨胀2022年5月达到8.6%。上次通货膨胀是1981年12月。
比率级别的测量
可以按照此测量来安排结果,并且数据值之间的差异现在具有含义。但是,有一个起点或“零值”,可用于进一步为统计值提供值。数据值之间的比率具有距离零的距离。
例子:1983年在南极洲记录的最低气象温度为-128.6华氏度。
统计抽样技术
通常不可能从人群中每个数据点访问数据来收集统计信息。统计数据依赖于不同的抽样技术来创建一个易于分析的人群的代表性子集。统计数据中有几种主要的抽样类型。
简单的随机抽样
简单的随机抽样呼吁人口中的每个成员都有相等的机会进行分析。整个人群被用作抽样的基础,任何基于机会的随机发电机都可以选择样本项目。也许100个人被排队,然后随机选择10个人。
系统性抽样
系统抽样还需要随机样本,但其技术进行了稍微修改以使其更容易进行。
生成一个随机数以确定起点,然后以指定的常规间隔选择个体,直到样本量完成为止。如果将100个个体排列并编号,并且随机起点是第七个人,则选择了随后的第九个人,直到选择了10个样本项目。看起来像这样:第7、16、25。
分层采样
分层采样要求对样本进行更多控制。基于相似特征将种群分为亚组。然后,您将计算每个子组中有多少人代表整个人群。也许有100个人被性别和种族分组。然后,来自每个亚组的样本与该亚组的人群的代表性成正比。
集群采样
集群抽样也需要亚组,但每个亚组都应代表人群。整个亚组是随机选择的,而不是在子组中随机选择个体。
快速事实
不确定去年哪个美国职棒大联盟球员应该赢得最有价值的球员?统计信息通常用于确定价值,并且在宣布最佳球员奖励时经常被引用。统计数据可以包括击球平均值,命中率的本垒打数量以及被盗基地。
统计的用途
统计数据在金融,投资,业务和广泛领域的统计数据中很突出。您看到的许多信息和您提供的数据都是从企业各个方面使用的统计信息得出的。
- 投资的统计数据包括平均交易量,52周低,52周高,beta和资产类别或证券之间的相关性。
- 经济学的统计数据包括国内生产总值(GDP),失业,消费者定价,通货膨胀和其他经济增长指标。
- 营销的统计数据包括转换率,点击率,搜索量和社交媒体指标。
- 会计统计数据包括流动性,偿付能力和盈利性指标。
- 信息技术的统计数据包括带宽,网络功能和硬件物流。
- 统计信息人力资源包括员工周转,员工满意度以及相对于市场的平均薪酬。
为什么统计数据很重要?
统计数据用于进行研究,评估结果,发展批判性思维并就一组数据做出明智的决定。统计数据可用于查询几乎任何研究领域,以调查事情发生,何时发生以及再次发生的情况是否可以预测。
描述性统计数据和推论统计之间有什么区别?
描述性统计用于描述或总结样本或数据集的特征,例如变量的均值,标准偏差或频率。推论统计数据采用任何数量的技术来将数据集中的变量相互关联。一个示例将使用相关或回归分析。然后可以使用这些来估计预测或推断因果关系。
谁使用统计信息?
每当收集和分析数据并在一系列应用程序和专业中广泛使用数据时,都会使用统计信息。这些包括政府机构,学术研究和投资分析。
如何使用经济学和金融中的统计数据?
经济学家收集并查看各种数据,从消费者支出和住房开始通货膨胀和GDP增长。分析师和投资者收集有关公司,行业,情绪和市场价格和数量数据的数据。这些领域中推论统计的使用称为计量经济学。
几种重要的财务模型,包括资本资产定价模型(CAPM),现代投资组合理论(MPT)和黑色choles选项定价模型依赖于统计推断。
底线
统计数据是分析数据结果并从样本结果中得出推论的实践。从政府机构到资金的各个领域都使用统计数据,以收集有关给定数据集的结论。
统计研究的研究可能导致统计学家的职业生涯,但它在日常生活中也可能是一个方便的指标。统计数据可用于了解对象的可能结果或事件的洞察力,无论您是分析您最喜欢的团队在下注之前赢得超级碗的几率,计算投资的可行性,还是确定您是否在产品或服务中收费过多。