• samtools faidx 命令处理fasta序列


    samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件,根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列

    用法:

    samtools faidx input.fa

    该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外, 其他行的长度必须相同,  

    >one 
    ATGCATGCATGCATGCATGCATGCATGCAT 
    GCATGCATGCATGCATGCATGCATGCATGC 
    ATGCAT 
    >two another chromosome 
    ATGCATGCATGCAT 
    GCATGCATGCATGC 

    最后生成的.fai文件如下, 共5列, 分隔;

    one 66 5 30 31
    two 28 98 14 15


    第一列 NAME   :   序列的名称,只保留“>”后,第一个空白之前的内容;

    第二列 LENGTH:   序列的长度, 单位为bp;

    第三列 OFFSET :   第一个碱基的偏移量, 从0开始计数,换行符也统计进行;

    第四列 LINEBASES : 除了最后一行外, 其他代表序列的行的碱基数, 单位为bp;

    第五列 LINEWIDTH : 行宽, 除了最后一行外, 其他代表序列的行的长度, 包括换行符, 在windows系统中换行符为 , 要在序列长度的基础上加2;

    提取序列:

    samtools faidx input.fa chr1 > chr1.fa

    samtools faidx input.fa chr1:100-200 > chr1.fa

  • 相关阅读:
    go ERROR invalid character '<' looking for beginning of value
    C#实现将网址生成二维码图片
    二、WPF入门教程——Bingding学习
    一、WPF入门教程——创建WPF项目
    C#实现DataTable行列转置
    VBS整蛊代码
    Task.WhenAll和Task.WhenAny
    Task.WaitAll和Task.WaitAny
    CancellationTokenSource
    组合ContinueWith
  • 原文地址:https://www.cnblogs.com/xudongliang/p/5200655.html
Copyright © 2020-2023  润新知