• 各种测序平台对比


    各种测序平台对比

      (2016-10-25 12:54:58)
      分类: 科技前沿
    各种测序平台对比
     
     
    Hiseq X ten与HiSeq2000对比
    1. HiSeq2000测序的数据集,正常情况下会有一些开头和末尾第一个碱基为N的序列,每条lane会有数千至数万条这种序列,除第一个碱基外,后面碱基的Phred score都还比较高,而在我们的数据中,没有这一特征。
     
    “第一个碱基为N”并非正常情况。只有特定版本的HCS软件,比如说v2.0.5,由于软件存在bug,才可能会出现第一或者倒数第一个碱基为N的序列。也就是说,这是软件运算的问题,测序没有问题,而且还不一定每次都出现。
     
    进行2X100个循环的Paired-End测序,就测序2X101个循环。多出来一个循环是行业标准做法,也是Illumina官方建议的;
     
    另外,“每条序列的前面几个碱基的质量评分很低”也不是一定的。如果文库的碱基复杂度高,簇密度又控制得好,则前面几个碱基的质量评分也可以达到比较高的数值。碱基质量,包括前几个碱基的质量评分高低,与文库构建的好坏有关,比如试剂的质量和操作水准;也与软件进行数据分析的参数估算有关,比如簇密度和碱基复杂度。
     
    2. 用HiSeq2000测定模式生物基因组,然后将测序数据mapping回其本身的基因组,mapping率通常在75%~80%左右,有20~25%的序列是不能mapping回去的,而我们数据的mapping率达到了95%以上。
     
    Illumina专家所指出的,mapping率高低与数据质量有关,也受比对方法、比对参数前后是否有差异、或者是否使用了不同版本的参考序列等因素影响。
  • 相关阅读:
    JAVA maven 仓库 基础命令
    JAVA maven 环境变量配置
    JAVA jdk 环境变量配置
    kafka 环境搭建
    java servlet 基础
    java idea 配置tomcat
    java tomcat服务器
    java io流
    java 字符流
    【火炉炼AI】深度学习005-简单几行Keras代码解决二分类问题
  • 原文地址:https://www.cnblogs.com/wangprince2017/p/9873534.html
Copyright © 2020-2023  润新知