• 【6】蛋白质组学鉴定定量软件之MaxQuant


    1.简介

    2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQuant软件(MQ),并发表在nbt上,protocol也相应发表在nature protocols上。不足五年,MQ的引用率已高达上万次,其中不乏CNS级别文章(有大佬的加持果然不一样)。毫不夸张地说,MaxQuant是业界良心,它的横空出世沉重地打击了深恶痛绝的质谱厂商们的嚣张气焰。

    主要特点:

    • 支持多种质谱仪厂商产生原始数据,如raw/wiff;
    • 免费不开源,基于Andromeda搜索引擎;;
    • 支持标记定量和非标定量,如labelfree(优势)/ICAT/SILAC/TMT/iTRAQ等;
    • 蛋白鉴定数多,定量准确性高(主要是因为非线性质量校正和Match Between Runs);
    • 有较完整的结果查看和分析界面;
    • 主要部署在Windows系统(Linux需要mono,MacOS需借助Parallels或Bootcamp);
    • 有配套的结果后处理软件Perseus。

    2.下载安装

    官网:https://www.maxquant.org/
    MQ的下载需要用邮箱注册,并填写注册码。
    依赖.NET Framework(基于.net框架编写,有些没安装的电脑需要安装) 和MSFileReader(识别质谱raw文件)。

    解压后无需安装,点击MaxQuant.exe即可使用。

    3.配置与运行

    MaxQuant使用很简单,参数界面设置也不像PD那么凌乱。
    image.png

    6大参数配置模块,我这里只选一些重要的参数,大部分默认就好:

    • Raw files:导入原始数据和设计实验,包括组分和样本,Group(指不同的实验,如label/SILAC同时进行即为2个Group0和Group1,一般跑一个就好);
    • Group-specific parameters:Group参数的设置,一般只是Group0;
    • Global parameters:全局参数配置;
    • Performance:显示正在运行的具体步骤和动态;
    • Viewer:数据可视化模块, 能在labelfree定量中呈现三维图形。我认为没啥用,无需设置,拖慢速度;
    • Andromeda configuration:用于配置修饰、酶,以及数据库ID规则设置等,一般无额外需求,无需设置。

    所以,实际需要配置的就是前面三项,我这里以Labelfree定量为例,写下Group-specific parameters和Global parameters中一些重要的参数:

    模块 选项 值或动作
    Group-specific parameters Variable modifications 增加Deamidation(NQ)、Gln->pyro-Glu
    Label-free quantification 选LFQ
    Global parameters Fasta files 添加数据库文件(可加入多个)
    Match between runs 打勾
    iBAQ 打勾
    Min.unique peptides 1

    其他选项基本上用默认就好,具体项目具体分析。配置完后设置线程数,点击Start。(若中间暂停,可在Partial processing选中中间步骤运行。
    MQ的主要运行步骤如下:
    image.png

    • feature信息的提取(定量信息)
    • 最初的搜库(first search)
    • 质量校正
    • 搜库鉴定(main search)
    • 峰处理
    • 第二次搜库(second peptide search)
    • 定量和鉴定结果合并
    • 导出结果

    更多参数可查看官方文档:http://coxdocs.org/doku.php?id=maxquant:start
    也可以查看我分享的两个文档:MaxQuant_Infos_and_Tutorial_07(中间每个参数都介绍得很详细)
    MaxQuant_Introduction_112409

    4.结果

    如果参数中路径没有额外设置,那么在原始数据同级目录下会得到搜库结果:
    image.png
    combined文件夹包含了搜库结果,如果是DIA建库,导入的即是这个文件夹。里面包含了txt文件夹,即鉴定和定量的全部结果。

    mqpar.xml是所有参数配置文件,若二次搜库,可直接导入MaxQuant中,无需重复设置。所以,一般建议保留下来,这样也可对结果的设置进行追溯。

    在combined/proc/#runningTimes.txt中包含了每一步运行的时间。

    combined文件夹中的txt文件夹包含很多结果:
    image.png

    msms.txt、peptides.txt、proteinGroups.txt即为谱图、肽段和蛋白结果文件。其他比较重要的文件如evidence.txt,summary,modificationSpecificPeptides等。每个表都很大,样品数多的话可达上百列。每个文件的每一列(即表头)在tables.pdf文档中都有详细解释。


    Linux运行
    需要mono调用MQ,参数配置文件mqpar.xml同Windows系统,注意输入原始文件(谱图和数据库)的路径。一般是先通过Windows生成mqpar.xml,再来Linux运行。但这样的话,又需要在两个系统间来回转移原始数据,非常低效。所以现在也有一些小工具来专门生成mqpar.xml。MaxQuant的Linux试运行

    /path/to/bin/mono /path/to/MaxQuant/bin/MaxQuantCmd.exe mqpar.xml
    

    5.Perseus后处理

    Perseus也是上面两位大佬开发的软件,发在nature methods上。一开始是专门针对MQ数据处理的。后来对所有矩阵类型的表达数据,甚至是多组学数据都适合。
    image.png

    对于蛋白质组学常规的统计分析和可视化(不太友好)都能实现,而且大佬团队也持续开发了基于调用本地R或Python解释器的插件,使得功能更加丰富。

    这里不做过多介绍了。因为我如果不是有授课的需求的话,也不会用这个软件。为有需要的朋友提供了一些教程可参考:

    MQ团队几乎每年都会举办暑期学校,Youtube上很多视频。不过中文教程近乎于无。

    6.小结

    蛋白质组学鉴定和定量系列软件说明到此结束,还有很多没有介绍的,比如国产软件pFind,MSFragger,OMSSA,SEQUEST等都是常用的蛋白鉴定软件。有些我自己也没用过,也没必要一一使用,适合自己的才是好的。而且,目前也有很多平台是整合了多个鉴定软件的综合结果,比如SearchGUI,PeptideShaker,TPP等等。


    蛋白质组学鉴定定量系列软件总结:
    【1】蛋白鉴定软件之X!Tandem
    【2】蛋白鉴定软件之Comet
    【3】蛋白鉴定软件之Mascot
    【4】蛋白质组学鉴定软件之MSGFPlus
    【5】蛋白质组学鉴定定量软件之PD
    【6】蛋白质组学鉴定定量软件之MaxQuant

  • 相关阅读:
    【穿插】Python基础之文件、文件夹的创建,对上一期代码进行优化
    爬虫实战【5】送福利!Python获取妹子图上的内容
    爬虫实战【4】Python获取猫眼电影最受期待榜的50部电影
    爬虫实战【3】Python-如何将html转化为pdf(PdfKit)
    爬虫实战【2】Python博客园-获取某个博主所有文章的URL列表
    爬虫实战【1】使用python爬取博客园的某一篇文章
    Oracle中Lpad函数和Rpad函数的用法
    oracle中如何判断blob类型字段是否为空
    将图片文件转化为字节数组字符串,并对其进行Base64编码处理,以及对字节数组字符串进行Base64解码并生成图片
    oracle中使用函数控制过程是否执行(结合job使用)
  • 原文地址:https://www.cnblogs.com/jessepeng/p/13580371.html
Copyright © 2020-2023  润新知