• 单细胞测序的知识


    单细胞测序的知识

    96 
    刘小泽 已关注
    2018.07.20 21:33* 字数 1885 阅读 675评论 0

    刘小泽写于18.7.20
    https://hemberg-lab.github.io/scRNA.seq.course/index.html

    介绍

    Bulk RNA-seq:

    测量一个大的细胞群体中每一个基因的平均表达水平,对比较转录组学(例如比较 不同物种的相同组织) 是有帮助的,但对于研究异质性系统(例如,复杂的组织如脑)还是不够的,对于基因表达的本质研究不够深入

    scRNA-seq:

    2009年由Tang发表,但直到14年才降低测序费用,逐渐进入大家的视野。它测定的是细胞种群中每个基因的表达量分布,对于研究特定细胞转录组的变化是重要的。测定的细胞量也由最初的102 涨到了106 并且还在递增,向着高通量的方向发展。现在有许多处理单细胞测序的流程,比如13年的SAMRT-seq2,12年的CELL-seq,15年的Drop-seq。有一些做单细胞的平台,包括Fluidigm C1、Wafergen ICELL8、10X Genomics Chromium。

     
    发展历史

    单细胞测序的流程:

     
    测序流程

    看着和普通的mRNA转录组差不多,取材要求更高了

     
    分析流程

    黄色部分对于高通量数据的处理都是差不多的流程;橙色的部分需要整合多个转录组分析流程以及显著性分析,来解决单细胞测序的技术误差;最后是下游表达量、通路、互作网络等生物类别的分析,需要使用针对单细胞研发的方法

    可以借助许多工具:

    • Falco [云端处理流程]

    • SCONE(Single-Cell Overview of Normalized Expression)—一个质控和标准化的包

    • Seurat-- QC以及后续分析探索数据

    • ASAP(Automated Single-cell Analysis Pipeline) —交互式网页分析

    面临挑战:

    单细胞转录组与群体转录组的最大不同之一就是:测序文库是建立在单独一个细胞上的,并非一群细胞。单细胞目前面临的挑战主要是:扩增量目前最多是一百万个细胞;有可能一个基因在一个细胞中能检测到中等表达量,但是在另一个细胞中却检测不到,这种现象叫做"gene dropouts"。下一步需要增加转录本捕获效率,减少扩增误差

    分析方法:

    近几年,发展起来的方法很多,大体上(并不全面)包括:

    • CEL-seq (Hashimshony, 2012)

    • CEL-seq2(Hashimshony, 2016)

    • Drop-seq(Macosko, 2015)

    • InDrop-seq (Klein, 2015)

    • MARS-seq(Jaitin, 2014)

    • SCRB-seq(Soumillon, 2014)

    • Seq-well (Gierahn, 2017)

    • Smart-seq (Picelli, 2014)

    • Smart-seq2 (Picelli, 2014)

    • SMARTer

    • STRT-seq (Islam, 2013)

    方法主要分为两大部分:定量与捕获。
    • 定量包括两种类型:全长以及基于标签(tag)。前者对每个转录本都试图获得一致的read覆盖度,后者只捕获5‘或者3’端的RNA。定量方法的选择也影响了后续分析的方法选择。理论上,全长的方法应该得到转录本的平均覆盖度,但是实际上,覆盖度经常是有偏差的。基于标签的方法能够利用特异性分子标记(Unique Molecular Identifiers, UMIs)提高定量准确度,但是呢,这种限制了转录组一端的方法有降低了转录本的可拼接性,让以后的isoform识别变得困难。

    • 捕获的技术决定了细胞如何被筛选、获取怎样的测序外的补充信息、数据产量,三种最常用的方法是基于微孔microwell-、微液流microfluidic-、微滴droplet-

      基于微孔的捕获技术可以使用细胞移液器或激光捕获分离细胞,并将他们放置于微液流孔中。这样的一个优势就是:可以与荧光触发细胞分离技术(FACS)结合,实现基于表面标记的细胞选择。对于想要分离特定细胞群的研究很有效;另外一个优势就是,可以对细胞进行拍照,帮助确定孔中是否存在损伤的或者重复的细胞。当然,他也有缺点,通量低,对每个细胞进行操作需要很大的工作量。

      基于微液流的捕获技术 例如Fluidigm's C1

       
      Fluidigm's C1

    相对微孔,它的通量更高。但是他的弱点就是:只有10%的细胞能被捕获到,加入处理的细胞类型比较稀少,那么能被芯片捕获的就更少了,数据产出是不够的。另外芯片相对较贵,但是试剂的价格再降低,日后可能总的价格也会下降。

    微滴技术 是将单个细胞包裹在µl级别的液滴中,液滴被搭载到建库所用的酶上,每个微滴包含一个独特的条码(barcode),由那个被包装好的细胞产生的所有reads都被贴上了该条码,也是为了之后对于不同细胞reads的分辨。一般微滴技术的通量最大,查资料得知一秒能包装7万个以上的液滴,并且建库费用合适--0.05美元/细胞。但是高额测序费用又成了他的短板,鉴定出的一般只有一千多个差异转录本,覆盖度还是比较低的

     
    微滴技术

    如何根据实验选择测序平台?

    关于捕获,比如:如果想要分析组织中的成分,那么微滴技术可以提供数量可观的细胞;如果研究的细胞种群比较稀少,并且有已知的标记,那么最好用FACS,测少量细胞即可;关于定量,比如:如果想要研究不同的转录本,由于标签是有限的,不可能全部标记完这些转录本,那么全长的转录本定量就更合适;UMIs只能用于使用标签的方法,在基因水平做定量更有优势。

    2017年Ziegenhain所在的Enard团队和Svensson所在的Teichmann团队都比较了不同的方法组合:

    • Ziegenhain使用同样的小鼠胚胎干细胞(mouse embryonic stem cells,mESCs)分析了5种不同的方法,控制细胞数量、测序深度一致,比较了方法的检测灵敏度、噪声水平以及各个方法的费用。结果显示了检测到基因的数目(给定一个检测阈值),结果显示drop-seq检测到的基因数目比Smart-seq2低了两倍。因此,方法的选择对于实验结果很重要!
       
      Enard团队
    • Svensson使用的是已知浓度的合成的转录本(加入了spike-in)来检测不同方法的准确度和敏感度
       
      Teichmann团队
  • 相关阅读:
    paddlepaddle训练网络的基本流程二(进阶Paddle-detection框架)
    paddlepaddle训练网络的基本流程一(入门示例)
    redis常用操作命令
    mysql基础命令
    使用Gunicorn和nginx进行Flask服务部署
    如何测试(八)抖音 如何测试?
    全(十九)Jmeter 请求 之 遇到 cookie、token 处理方式(使用 正则表达式提取器 获取 然后在引用)
    全(十八)Jmeter 请求元件 之 JSON PATH 提取 响应结果
    全(十七)Jmeter 请求元件 之 正则表达式提取器 提取 响应结果、foreach循环控制器
    全(十六)Jmeter 请求 之 正则表达式
  • 原文地址:https://www.cnblogs.com/wangprince2017/p/9818481.html
Copyright © 2020-2023  润新知