• 【宏蛋白组】iMetaLab平台分析肠道宏蛋白质组数据


    一、iMetaLab简介

    宏蛋白组学是个非常小众的领域,即使从事的学者也并非专门做这个,大多是作为系统生物学的延伸研究。业界有几个比较有影响力的研究团队,一是比利时根特大学的Computational Omics and Systems Biology Group(COMPOMICS) 团队,开发了有代表性的宏蛋白分析工具如UnipeptMetaProteomeAnalyzer (MPA),此外还有很多常规蛋白组的工具,如SearchGUIPeptideShakerThermo Raw File Parser 等,后面如果有机会再介绍。二是加拿大渥太华大学的Daniel Figeys团队,专注于研究人类、小鼠肠道宏蛋白组,一开始提出了经典的迭代搜库三步法(MetaPro-IQ),后面陆续也实现了一些工具,开发了从MetaPro-IQ,到MetaLab,最后到iMetaLab平台的技术路线。
    Daniel Figeys介绍:https://med.uottawa.ca/bmi/people/figeys-daniel

    iMetaLab有云服务器版本和桌面版本,用来分析宏蛋白数据,下游可视化绘图等分析提供了Shiny Apps,并且也有相应的Demo报告和Wiki。内容主要包括了:肽段和蛋白的鉴定及定量,物种和功能分析,数据分析及其可视化

    关于收费,对于学术研究是免费的,商业用途则需要获得许可。

    二、内置工具与模块

    1. Data Processing module

    2. Functional Analysis

    • KEGG
    • eggNOG database
    • NCBI nr database

    3. R Developing environment

    • Rstudio
    • Rstudio server
    • ShinyR
    • Shiydashboard

    4. R based data analysis packages

    • ggplot2, ggpairs
    • Htmlwidgets, visNetwork, d3heatmap
    • Eulerr, colourpicker, DT,shinysky, GGally, ggcorrplot, reshape2, ggfortify, mixOmics

    5. Web development libraries and frameworks

    • React.js
    • D3.js

    从内置工具和模块可以看出,这个平台主要处理的是DDA数据,最后得到的蛋白鉴定和定量结果就是MaxQuant产出格式的。

    三、报告内容

    iMetaLab分析完成后生成网页报告https://shiny.imetalab.ca/metalab_report/
    对于报告结果,主要有以下五方面内容:

    • ID Summary:谱图肽段ID统计
    • Peptides Summary:肽段鉴定结果分析
    • ProteinGroups Summary:蛋白鉴定结果分析
    • Taxon Summary:物种注释结果分析
    • Function Summary:功能注释结果分析
      此外,还有一个MetaMep for Taxon Vis模块,主要是利用MetaMap软件对物种分析结果进行可视化展示和可交互式操作。

    1. 谱图肽段ID统计

    image.png

    分析点包括了报告介绍,项目信息,谱图解析率,肽段鉴定数,汇总统计表。

    • MSMS ID Rate
      这是数据质控的一个指标,可以判断 MS run的质量,即在1%FDR条件下谱图鉴定为肽段,QE系列仪器一般能达到50%。可以判断组内重复性,以及仪器是否需要清洗,数据是否可利用等。
      展示方式:分组散点图,密度图,箱形图。
    • Peptide Sequence
      同样也是统计各样本的肽段鉴定数目分布。
      可视化:分组散点图,密度图,箱形图。

    2. 肽段鉴定结果分析

    image.png
    上图红框内的分析,包括对肽段鉴定各方面的统计绘图,多变量统计和方差检验,到得到整洁的肽段数据。
    肽段结果分析及其可视化:价态分布,长度分布,得分分布,肽段强度分布(离散和累积),各样本肽段强度箱形图,全部样本肽段的聚类热图,肽段层次PCA(2D/3D),各组间方差分析。
    最后得到的过滤后的肽段表格(MaxQuant结果)是去除了来自反库和污染库的肽段,他们用的强度值是LFQ和自带的Intensity,整洁肽段表可用于后续分析,也可用作者的shiny.imetalab.ca

    3. 蛋白鉴定结果分析

    image.png
    蛋白组层次和肽段层次的分析基本是一样的。多了一个unique peptide分布。

    疑问:为什么都用方差分析?难道更多的情况不是两组吗,即便是多组,很多客户也是要求两两比较。

    最后得到的也是过滤后的蛋白表格。

    4. 物种分析

    image.png

    • 每个样本在物种各个层级的注释统计
    • alpha多样性:计算的是种(species)层级的Shannon-Wiener index
    • beta多样性:计算的是种(species)层级的PCoA
    • 样本聚类:基于种(species)层级的丰度数据,欧氏距离ward.D聚类
    • 物种组成:各物种层级bar图(原始强度,无归一化)

    5. 功能分析

    image.png

    • 功能数据库注释统计:COG,NOG,KEGG,GO及其unique数目(与蛋白一对一)。
    • 分类饼图:包括COG,NOG和Pathway,饼图的扇形大小并非分类功能的数目,而是所有样本proteinGroup的强度之和。
    • 功能组成bar图:包括COG,NOG和Pathway,各样本的功能bar图(原始强度,无归一化)。
    • 功能组成热图:包括COG,NOG和Pathway,各样本的功能聚类热图。
    • PCA分析:包括COG,NOG和KEGG(这里应该也是Pathway层级)功能丰度的PCA。

    疑问:一般蛋白/基因注释KEGG是到KO层级,这里都是转化到了Pathway层面,一条Pathway中多个蛋白分子强度不知他们是怎么处理的,之前我是进行加和处理的。

    MetaMep for Taxon Vis

    最后一个工具是对物种分析进行可视化,可交互是它的优点,而且有多种展示方式。你如果用过MEGAN的话,就知道这些展示方式也都有。当然Unipept也可实现,它这个就是嵌套了Unipept。
    image.png

  • 相关阅读:
    STS 创建 Maven 项目填坑
    JeeSite | 访问控制权限
    《Spring + MyBatis 企业应用实战》书评
    MyBatis-Generator 用法介绍
    Java描述数据结构之链表的增删改查
    Java中的Object类的几个方法
    设计模式之策略模式(Strategy Pattern)
    设计模式之模板方法(Template Method)
    JeeSite | 数据分页与翻页
    day 19
  • 原文地址:https://www.cnblogs.com/jessepeng/p/12882565.html
Copyright © 2020-2023  润新知