大家基本都知道什么是 FASTA 和 FastQ 格式了,但这是不够的。
我们还需要了解世界上最大的测序公司自己定制的 FastQ 格式,因为你可能会经常用到,有时还会亲自去处理它们。
本文主题:Illumina 测序数据中的 Index
@FCHCGKFBCXY:1:1101:1110:2162#AACAGCACCTAGCA_GTAGTGCG/1 ATGTATACTATTGTATGTGAAATGGATCACCAGTCCAGGTTCAACGCCCGAGACAGGGTGCTCAGGGCTGGTGCACTGGATGACCCTGAGGGACGGGATG + cccccggegghgbgggggdfgdegfhggggdgfdgghdgggghfghhhhhghhgggdgdgghhhhghhhgghfhghdPcdgPc_dfghbdgfghhhhhgg @FCHCGKFBCXY:1:1101:1077:2164#NNNNNNNNNNNNNN_NNNNNNNN/1 TGCTGAGCATCAGATCAACCTGATTAAGGTTGATGACAACAAGAAACTAGGGGAATGGGTAGGCCTCTGTAAAANNGANANNNNNNNNNNNNNNNNNNNN + ccccchhhhhhhhghhgfgghhhhhhhghhhhhhhhhhhhghhhgghghhhhgghgd_gggghhgghghhhghhBBBBBBBBBBBBBBBBBBBBBBBBBB
ILLUMINA SEQUENCE IDENTIFIERS
@HWUSI-EAS100R:6:73:941:1973#0/1
HWUSI-EAS100R:the unique instrument name
6:flowcell lane
73:tile number within the flowcell lane
941:‘x’-coordinate of the cluster within the tile
1973:‘y’-coordinate of the cluster within the tile
#0:index number for a multiplexed sample (0 for no indexing)
/1:the member of a pair, /1 or /2 (paired-end or mate-pair reads only)
有了index就可以同时在一个lane中测多种数据了,后期可以根据index将数据分开。