1.VCF文件指的是Query还是Reference的变异?
二代测序将fastq比对到参考基因组得到bam文件
2.现在的做法到底能不能表达出INS的特征点?
3.简单说说高通量测序。
ACGT每个被称为一种碱基,两两配成碱基对(只能A-T或C-G)。
DNA是两条核苷酸链通过碱基间的氢键相连,呈双螺旋状。脱氧核苷酸是DNA的基本单位,有四种,每种里面因碱基不同而不同。
DNA和蛋白质结合组成染色体,人有23对(46条)染色体,其中一对决定性别(XXorXY)。一条染色单体可以看作一条双螺旋DNA。
基因是携带遗传信息的特定DNA序列,他们在DNA上不一定连续分布,而且它们只是DNA序列上的少数,大多数是非编码DNA序列。
4.全三代测序的特点,以及我为什么做二代?
第二代(又称高通量)测序:读长较短(100的样子)但能并行测几十万至几百万条DNA分子。
5.区分SNP、SV和CNV
SNP指单核苷酸多态性,也就是一个核苷酸的变异,也就是一个碱基变了(也可能是插入、缺失),它的互补链顺应也变。
6.低覆盖度和高覆盖度有什么区别,或者有什么影响,解释下我为什么用了低。低容易假阳性、假阴性?
7.