使用R语言进行单样本t检验

2023-04-28 12:24:13

字体：大中小

来源：转载

供稿：网友

一、单样本t检验

单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布，如总体标准差未知且样本容量小于30，那么样本平均数与总体平均数的离差统计量呈t分布。（--百度百科）

在单样本的情况下，假设数据x₁，x₂，...,x_n来自于服从N(μ,σ²)的独立随机变量。我们希望对假设μ=μ0进行检验。

对n个均值为μ，标准差为σ的随机变量求平均值，使用均值的标准误（SEM，standard Error of the Mean)来描述这个均值的波动性，它的表达式是：SEM= σ/sqrt(n)

对于服从正态分布的数据，有一般性准则：有95%的数据会落在μ±2σ这个区间里。所以如果μ0是真实的平均数，那么x均就应该落在μ0±2SEM中。通过计算 t = （x均-μ0）/SEM来判定t是否落在了一个接受域中。

t应该以一定的概率落在这个接受域之外，这个概率被称为显著性水平。如果t落在接受域之外，那么我们就在预设的显著性水平上拒绝零假设。另一种等价的方法是计算p值，它指的是得到一个绝对值上大于或等于当前t值的概率，我们在p值小于显著性水平的情况下拒绝零假设。

有时候我们需要对样本数据的均值进行单边检验，即判定μ是落在右边区域（偏大）还是左边区域（偏小）。

二、R语言中进行t检验的函数

在R中可以使用t.test()函数来进行单样本t检验。其形式如下：

t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95, ...)

其中，x为非空数值型向量；y是可选的数值型向量；

alternative是字符型字符串，用于指定备择假设方法，其中two.sided是双边检验，less是左侧单边检验，greater是右侧单边检验；

mu是数据的真实均值；

paired是一个逻辑值，用于指定是否进行配对检验，默认为FALSE；

var.equal是一个逻辑值，用于指定两个方差是否相等（a logical variable indicating whether to treat the two variances as being equal. If TRUE then the pooled variance is used to estimate the variance otherwise the Welch (or Satterthwaite) approximation to the degrees of freedom is used.）

conf.level指定置信水平，默认为0.95.