• RNA-Seq数据去接头(Adapter)


    1、adapter是一段短的序列已知的核酸链,用于链接序列未知的目标测序片段。

    2、barcode,也称为index,是一段很短的寡居核酸链,用于在多个样品混合测序时,标记不同的样品。

    3、insert是用于测序的目标片段,因为是包括在两个adapter之间,所以被称为“插入”片段。

    一个常见测序片段类似与adapter--barcode--insert--adapter。测序开始时前几个碱基无法测得,第一个adapter在数据输出时被去除;由于测序仪读长限制,第二个adapter通常无法测得。所以,经常得到类似 barcode--部分insert的read。最后,把barcode去除,只保留测度insert的片段,这个操作的术语是demultiplexing。但是有时候测序时会测穿,也就是说会得到barcode--insert的read--部分adapter,那么这里就包含了接头了,这里的接头也就是大家经常说去接头要去除的部分。

    接头序列一般提供的比较稳定,是一个类似fasta的文件序列

    1. cutadapt -a adapt2 -A adapt1_REV -m 20 --pair-filter=both -o out_fq1 -p out_fq2 fq1 fq2  
    2. trimmomatic 去接头,处理reads (模式一:去除adapter  模式二: 去除adapter并且去除低质量序列)

  • 相关阅读:
    nginx article
    学习历程
    GRPC
    学习记录
    JAVA知识点记录
    flag
    读的文章
    This usually happens because your environment has changed since running `npm install`.
    expandedRowKeys、expandedRowsChange、expand
    服务端高并发分布式架构演进之路
  • 原文地址:https://www.cnblogs.com/jinhh/p/8622305.html
Copyright © 2020-2023  润新知