参考:
这个模型是鸟枪法测序和基因组装的最基本的理论模型,它揭示了测序深度与覆盖度之间的关系。
该模型回答了一个最基本的问题:How many reads to we need to be sure we cover the whole genome?
Genome Sequencing - PPT
Chapter 5.1. Lander-Waterman Statistics for Shotgun Sequencing
这个模型是用来做基因组装的。
鸟枪法做了shotgun后,每个碱基被检测的概率是很小的,碱基长度长,
即 p小,n长,二次分布就近似为泊松分布。
在这个理论下,碱基期望深度,(就是每个碱基被检测的次数)为泊松分布的期望值u,基因组覆盖率为1-exp(-u)。