不符合正态分布的配对数据也有自己的统计方法。
1.在观察到数据不符合正态分布后,首先要考虑是否是离群值或者极值的影响,也就是说某个或少数个体对整体分布影响很大。如果有要认真分析其产生原因,客观地判断这些样本是否要剔除(不要为了凑正态而随便剔)
2.如果排除上面的原因,接下来应该考虑:能否经过数据转换来达到正态分布。最简单的例子比如抗体滴度,这种数据一般都是指数分布的,把数据转换成指数后也许能符合正态分布。举例:10,100,1000,以10为底指数化以后就成为1,2,3。数据转换有很多方法,比较常见的就是对数化了,当然也有别的。
3.如果没法通过数据转换符合正态分布,也不是就没法分析了。还可以使用非参数检验的方法。比如Wilcoxon符号秩和检验。
关键在于忠于数据的真实性,不要硬套某一种方法。如果数据不符合正态还要用t检验的话,得出的结果反而是不可信的。其实非参也不错的,虽然不是首选,但检验效能并不比参数检验(比如t检验)低很多,尤其是数据不符合参数检验要求时,更是不错的选择。
附:各非参数统计检验中所需样本(N)及处理组数(k)至少应该要多大?
Wilcoxon 符号秩检验
N>15
Mann–Whitney U检验
N1=3 或 4 且 N2>12; N1>4 且 N2>10
Kruskal–Wallis H检验
k>3 且所有的N>5
Friedman检验(方差分析)
k=3: N>13; k=4: N>8;k=5: N>5; k>5
符号检验
N>35