区别samtools faid产生的.fai文件功能和bwa index 产生的四个文件的功能

区别samtools faid产生的.fai文件功能和bwa index 产生的四个文件的功能

samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件，根据这个.fai 文件和原始的fastsa文件，能够快速的提取任意区域的序列

用法：

samtools faidx input.fa

该命令对输入的fasta序列有一定要求：对于每条序列，除了最后一行外，其他行的长度必须相同,

>one
ATGCATGCATGCATGCATGCATGCATGCAT
GCATGCATGCATGCATGCATGCATGCATGC
ATGCAT
>two another chromosome
ATGCATGCATGCAT
GCATGCATGCATGC

最后生成的.fai文件如下，共5列，分隔；

one 66 5 30 31
two 28 98 14 15

第一列 NAME : 序列的名称，只保留“>”后，第一个空白之前的内容；

第二列 LENGTH: 序列的长度，单位为bp；

第三列 OFFSET : 第一个碱基的偏移量，从0开始计数，换行符也统计进行；

第四列 LINEBASES : 除了最后一行外，其他代表序列的行的碱基数，单位为bp；

第五列 LINEWIDTH : 行宽，除了最后一行外，其他代表序列的行的长度，包括换行符，在windows系统中换行符为 , 要在序列长度的基础上加2；

提取序列：

samtools faidx input.fa chr1 > chr1.fa

samtools faidx input.fa chr1:100-200 > chr1.fa

PS:

引用：http://www.cnblogs.com/xudongliang/p/5200655.html

bwa index 产生的是:

/*/Public_dir/Database/Human/Hg19_ref/bwaIndex/下的hg19.fasta.amb、hg19.fasta.ann、hg19.fasta.bwt、hg19.fasta.pac、hg19.fasta.sa四个文件.作用是为后续比对做准备。
相关阅读:
程序集“xxx"中的类型"xxx"的方法“XXXX”没有实现
 关于C# json转object时报错：XXXXXXXXXX需要标记“"”，但找到“XX”。
System.Reflection.Assembly.GetEntryAssembly()获取的为当前已加载的程序集
 MongoDB 模糊查询，及性能测试
 SignalR介绍与Asp.net，前台即时通信【转】
mongodb常用命令【转】
MongoDB update数据语法【转】
Mongodb在Windows下安装及配置【转】
C#(asp.net)备份还原mssql数据库代码【转】
小记,取GB2312汉字的首字母【转】
原文地址：https://www.cnblogs.com/Formulate0303/p/7446962.html