Footsteps on my way !
perl/linux/测序分析

t检验和秩和检验的区别

t-检验

选用t-检验的基本前提假设是,两组样本都服从正态分布,且方差相同。设有两类(x, y)分别有 m m m个和 n n n个样本,它们的总体样本方差是:

它服从自由度为 n + m − 2 的t分布。
在实际问题中,首先计算出实际样本的t值,然后根据t分布可以查出在原假设下取得该t值的 p值,最后根据适当的显著性水平(如0.05)来决定是否拒绝原假设,推断两类样本的均值是否有显著差异。

t检验属于参数化检验方法,此类方法对数据分布有一定的假设,必要时需要首先检验样本分布是否符合该假设。

秩和检验

Wilcoxon秩和检验(rank-sum test),有时也叫Mann-Whitney U检验,是另一类非参数检验方法,它们不对数据分布作特殊假设,因而能适用于更复杂的数据分布情况。而当数据实际上满足正态分布时,用 t检验更有效。

秩和检验的做法是,首先将两类样本混合在一起,对所有样本按照所考察的特征从小到大排序。在两类样本中分别计算所得排序序号之和 T 1 和 T 2 ,称作秩和。

两类的样本数分别是 n 1  个和 n 2。秩和检验的基本思想是,如果一类样本的秩和显著地比另一类小(或大),则两类样本在所考察的特征上有显著差异。秩和检验的统计量就是某一类(如第一类,秩和为 T 1 )的秩和。
为了比较两类样本的秩和是否差异显著,需要比较T分布,当样本数目较大时,人们可以用正态分布来近似秩和 T 1 的分布。其中