8小时整理!t检验原理!R语言实现!一文彻底搞定t检验(下)
本文将加入一些注释,用于解释一些常见的混淆概念。主要涵盖t检验的适用范围、实际案例以及R语言的实现方法。
在上一篇文章中,我们详细讲解了独立样本t检验和配对t检验,具体内容请参考下方链接。本文将重点介绍两个独立样本t检验(成组t检验)以及方差不相等的t'检验。
两样本均数的比较
两样本均数比较的t检验,也称为两独立样本的t检验或成组t检验。
一、两样本均数比较的t检验
假设两个样本所代表的总体分别服从正态分布[公式],如果两个总体方差相等([公式]),则可以估计出两者的合并方差[公式],计算公式为:
[公式] (1.2)
其中:[公式]分别表示两个样本的含量和方差。
在假设[公式]成立的情况下,此时的检验统计量为:
[公式] (1.3)
其中:[公式]表示两个样本均数,[公式]为合并方差。
举例:某医生研究血清白介素-6(IL-6)与银屑病的关系,收集了12例处于进行期的银屑病患者及12例正常人的血清标本进行IL-6检测,得到表8.2结果,问银屑病患者与正常人的血清IL-6均数是否不同。
(1)建立检验假设,确定检验水准
[公式],银屑病患者与正常人的血清IL-6均数相等
[公式],银屑病患者与正常人的血清IL-6均数不相等
[公式]
(2)计算检验统计量
[公式]
[公式]
根据式子1.3得:
[公式]
(3)确定P值,做出统计推断
查t界表,得0.02
<0.05,按[公式]水准拒绝[公式],接受[公式],差异有统计学意义。可认为银屑病患者与正常人的血清IL-6均数不同,银屑病患者的血清IL-6较高。
对于大样本两组均数得Z检验(n1、n2均大于50),式子1.3简化为:
[公式],此时自由度[公式]较大,可查t界表得最后一行求出界值,推断方法如上。
R语言实现
首先进行正态性检验和方差齐性检验。只有满足这两个条件,才能进行两个独立样本的t检验。
输入工厂中两个机器制作出来的螺母的长度数据,每组6个,比较x1和x2的均数是否相等,看两个机器制作出来的螺母是否有差异。
# 建立一个数据框
# 使用Shapiro-Wilk正态性检验
输出结果中,两个p值大于显着性水平0.05,说明两组数据的分布与正态分布没有显着差异。数据分布符合正态分布的假设检验成立。
# F检验来检验方差齐性
F检验为p = 0.0766。它大于显着性水平[公式]。因此,两组数据的方差之间没有显著差异。因此我们认为方差齐性。
# 开始t检验
注:var.equal = TRUE意味着我们指定方差相等
注:
t'检验
在进行两小样本均数比较时,如果两个总体方差[公式]不相等,可使用t'检验。用公式(1.4)计算t'值,自由度的校正按公式(1.5)计算并四舍五入取整,最后查t界值表,确定P值。
[公式] (1.4)
[公式] (1.5)
其中:[公式]。
举例:由X线胸片上测得两组患者的肺门横径右侧距R值(cm),算得结果如下,比较其均数是否相同?
(1)建立检验假设,确定检验水准
[公式],两组病人R1值的总体均数相等
[公式],两组病人R1值的总体均数不相等
[公式]
(2)计算检验统计量
[公式]
[公式]
以上可以推断两总体的方差不等,且为小样本,故应选择了t'统计量
[公式]
[公式]
(3)确定P值,作出统计推断
以自由度9查t界表,0.005
<0.01,按照[公式]水准,拒绝[公式],接受[公式],差异有统计学意义,可认为两种病人R值不等,肺癌患者的R值大于硅沉着病0期患者。
R语言实现
方差不齐时,设置var.equal = F(默认)
版权声明:本文由哟品培原创或收集发布,如需转载请注明出处。