一、为什么要做GWAS的条件分析(conditional analysis)
我们做GWAS的时候,经常扫出一堆显著的信号,假设rs121是我们扫出来与某表型最显著相关的位点(P=1.351e-36),rs124尾随其后(6.673e-22),也是与该表型显著相关,那么这个时候,我们就有问题了:这个rs124位点是真的与该表型显著相关,还是因为rs124与rs121高度连锁不平衡(linkage disequilibrium)。换句话说,rs124之所以出类拔萃,是因为它本身厉害,还是有rs121提拔,导致我们看到的结果是:rs124永远跟随者rs121水涨船高。为了解决这个问题,我们就需要做条件分析。
二、GWAS的条件分析(conditional analysis)步骤
如果你有全基因组关联分析的基础的话,条件分析的工作则很简单,只需要在原来的基础上加上“--condition”的参数,具体为:
如果表型为case/control的情况:
./plink --bfile ./data --condition rs121 --logistic --pheno ./pheno.txt --mpheno 1 --covar ./covar.txt --covar-number 1.2 --out ./gwas_condition
如果表型为连续性变量的情况:
./plink --bfile ./data --condition rs121 --linear --pheno ./pheno.txt --mpheno 1 --covar ./covar.txt --covar-number 1.2 --out ./gwas_condition
三、结果解读
一般来说,有两种结果。
第一种,条件分析以后,rs124不显著了;
这种情况说明rs124是因为rs121才导致信号显著。
第二种,条件分析以后,rs124依旧显著;
这种情况说明rs124确实与表型相关,跟rs121没有关系。
参考链接:
https://www.biostars.org/p/190006/
https://biology.stackexchange.com/questions/7871/what-does-conditional-analysis-of-a-snp-in-a-gwa-study-entail