t检验是推论统计用于确定两组的均值与它们之间的关系之间是否存在显着差异。当数据集遵循正态分布并具有未知方差时,使用t检验,例如从翻转硬币100次的数据集。
t检验是用于统计中假设检验的测试,并使用t统计量,T分布值,以及确定统计意义的自由度。
关键要点
- t检验是一种推论统计量,用于确定两个变量的均值之间是否存在统计学上的显着差异。
- t检验是用于统计中假设检验的测试。
- 计算t检验需要每个数据集的平均值之间的差异,每个组的标准偏差和数据值数量。
- t检验可以取决于或独立。
Investopedia / Sabrina Jiang
了解t检验
t检验比较了两个数据集的平均值,并确定它们是否来自同一人群。例如,来自物理课的学生和来自写作课的不同学生的学生等级不太可能具有相同的平均值和标准偏差。同样,从药物测试的安慰剂喂养的对照组中采集的样品,从药物规定组中获得的样品应具有略有不同的均值和标准偏差。
使用t检验时做出四个假设:
- 收集的数据必须遵循连续或有序的量表,例如智商测试的分数。
- 数据是从总人口的随机部分收集的
- 数据将导致钟形曲线的正态分布。
- 当标准变化相等时,存在相等或同质的差异。
从数学上讲,t检验从两组中的每一组中获取样本,并确定问题陈述。它假设一个零假设,这意味着它假定两种均值是相等的。
使用t检验公式,计算值并与标准值进行比较。此比较帮助确定机会的影响关于差异以及差异是否超出了机会范围。 t检验质疑两组之间的差异是在研究中的真正差异还是仅仅是随机差异。
根据结果,假定的无效假设被接受或拒绝。如果拒绝零假设,则表明数据读数很强,可能不是偶然的。
- 零假设拒绝了:差异具有统计学意义
- 零假设接受:差异在统计上没有意义
t检验只是用于此目的的许多测试之一。根据变量的数量或样本的大小,其他可能更合适。例如,统计学家使用z检验对于具有较大样本量的数据集。其他测试选项包括卡方测试和F检验。
何时使用t检验的示例
想象一下,一家药物制造商测试了一种新药物。按照标准程序,将药物提供给一组患者,并将安慰剂给予另一组称为对照组的组。安慰剂是一种没有治疗价值的物质,是衡量另一组对实际药物进行响应的方式的基准。
药物试验后,对照组的成员报告说,平均预期寿命为三年。开处方的小组成员报告说,新药的平均预期寿命增加了四年。
初始观察表明该药物正在起作用。但是,观察结果也可能是由于机会。 t检验可用于确定结果是否显着且适用于整个人群,或者它们是否是随机的,而不是由于药物干预。
使用t检验
计算t检验需要三个基本数据值:
- 每个数据集的平均值之间的差异,也称为平均差异
- 这标准偏差每个组
- 每个组的数据值数量
t检验产生两个值作为其输出:t值和自由度。 T值或T得分是两个样本集的平均值与样品集中存在的变化之间的差异之比。
分子值是两个样本集的平均值之间的差异。分母是样本集中存在的变化,是分散或变异性的测量。
然后将此计算出的T值与从称为t分布表的临界值表获得的值进行比较。 T评分的较高值表明两个样本集之间存在很大的差异。 t值越小,两个样本集之间存在越多的相似性。
重要的
较大的T评分或T值表示组不同,而小的T得分表示组相似。
自由度是指具有改变自由的研究中的价值,对于评估无原假设的重要性和有效性至关重要。这些值的计算通常取决于样本集中可用的数据记录数量。
配对样品t检验公式
相关的t检验或配对t检验是一种依赖性测试类型,当样本由匹配对类似单位或有重复措施的情况。例如,在接受特定治疗之前和之后,可能在某些情况下反复测试相同的患者。每个患者都被用作对照样本对照。
此方法还适用于样本相关或具有匹配特征的情况,例如涉及儿童,父母或兄弟姐妹的比较分析。
计算配对t检验的T值和自由度的公式是:
t=((n)s((差异)意思是1- 意思是2在哪里:意思是1和意思是2=每个样品集的平均值s((差异)=配对数据值的差异的标准偏差n=样本量(配对差异的数量)n- 1=自由度
相等的差异或汇总t检验公式
相等的方差t检验是一个独立的t检验,当每组中的样本数量相同,或者两个数据集的方差相似时,使用。
用于计算T值和相等差异的自由度的公式t检验是:
T值=n1+n2- 2((n1- 1)×我们的12+((n2- 1)×我们的22×n11+n21意思是1- 意思是2在哪里:意思是1和意思是2=每个的平均值样品集我们的1和我们的2=每个样本集的差异n1和n2=每个样本中的记录数
和,
自由度=n1+n2- 2在哪里:n1和n2=每个样本中的记录数
差异不平等t检验公式
不平等差异t检验是一个独立的t检验,当每个组中的样本数量不同时使用,并且两个数据集的方差也不同。该测试也称为Welch的T检验。
用于计算T值和自由度的不平等差异t检验的公式是:
T值=((n1v一个r1+n2v一个r2)me一个1- me一个2在哪里:me一个1和me一个2=每个的平均值样品集v一个r1和v一个r2=每个样本集的差异n1和n2=每个样本中的记录数
和,
自由度=n1- 1((n1v一个r12)2+n2- 1((n2v一个r22)2((n1v一个r12+n2v一个r22)2在哪里:v一个r1和v一个r2=每个样本集的差异n1和n2=每个样本中的记录数
使用哪个t检验
以下流程图可用于根据样品集的特征来确定要使用的t检验。要考虑的关键项目包括:
- 样本记录的相似性
- 每个示例中的数据记录数量
- 每个样本集的差异
朱莉·邦(Julie Bang)的图片©©Investopedia 2019
差异不平等t检验的示例
假设对在美术馆中收到的绘画进行对角线测量。一组样品包括10幅画,另一幅画包括20幅画。数据集,带有相应的意思是和差异值如下:
设置1 | 设置2 | |
---|---|---|
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
意思是 | 19.4 | 21.6 |
方差 | 1.4 | 17.1 |
仅由于机会而导致的差异是19.4到21.6,还是在美术馆收到的所有绘画的总体中存在差异?我们通过假设零假设在两个样本集之间的平均值相同,并进行t检验来测试该假设是否合理,从而确定了问题。
由于数量数据记录是不同的(N1 = 10和N2 = 20),方差也不同,使用不平等方差t检验的公式计算上述数据集的T值和自由度。
T值为-2.24787。由于比较两个T值时可以忽略负符号,因此计算值为2.24787。
自由度值的程度为24.38,降低到24(公式定义需要将值舍入到最小可能的整数值)。
一个人可以指定概率水平(α水平,显着性水平,p)作为接受的标准。在大多数情况下,可以假设5%的值。
使用自由度值为24和5%的显着性水平,查看T值分配表的值为2.064。将该值与2.247的计算值进行比较,表明计算出的t值大于显着性水平5%的表值。因此,可以肯定的是拒绝零假设,即手段之间没有差异。
拒绝零假设意味着人口集具有内在差异,并且不是偶然的。
如何使用T分布表?
T分布表可用一尾和两尾格式。一尾格式用于评估具有固定值或范围具有明确方向(正值)的案例。例如,输出值的概率保持在-3以下,或者在滚动一对骰子时获得七个以上的概率?两尾格式用于范围内分析,例如询问坐标是否介于-2和+2之间。
什么是独立的t检验?
独立t检验的样本是独立于彼此独立的,其中两个组中的数据集未指相同的值。它们可能包括一组100名随机无关的患者,分为两组50例患者。其中一个组成为对照组,并接受安慰剂,而另一组则接受了规定的治疗。这构成了两个独立的样本组,这些样本群是不成对的,彼此无关的。
t检验解释了什么?如何使用?
t检验是一种统计检验,用于比较两组的均值。它通常用于假设检验中,以确定过程或治疗是否会影响感兴趣的人群,或者两组是否彼此不同。
底线
t检验是一种推论统计量,用于确定两个种群样本的均值之间是否存在统计学上的显着差异。它用于假设检验的统计数据中,可以指示两个人群之间的差异是有意义的还是随机的。
t检验计算使用三个数据:每个数据集的平均值之间的差,每个组的标准偏差以及数据值数量。 t检验公式有不同的变化。使用哪一个取决于因素,例如样本记录的相似性,每个数据集的大小以及每个集合的方差。但是,t检验的每个变化都用于研究相同的统计问题。