• 序列相似性比较与同源性分析


    首先应该注意区分序列相似性与序列同源性的关系,序列相似不一定同源,但是判定同源性关系的时候有些算法(Maximum likelihood除外)要考虑到序列相似性。序列相似性是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么,完成这一工作只需要用到两两序列比较算法,常用的程序包有BLAST,FASTA等。同源性分析是将待研究序列加入到一组与之同源,但是来自不同物种的序列中进行多序列比对,以确定该序列与其它序列间的同源性大小。多序列比较算法常用的程序包有CLUSTAL等。

    1、  序列比对,从数据库中寻找相似序列: 首先打开NCBI的BLAST网站:https://blast.ncbi.nlm.nih.gov/Blast.cgi ,选择protein blast,然后将待比对序列粘贴进去,进行BLAST(一些参数的设置收藏夹或百度)。等待一定时间后将会出现与所选数据库的比对结果,按照打分高低将top100(可以设置成其他数值)的序列显示出来,然后可以将该100条序列下载下来。存成test.fasta文件。这个文件就是在mega中进行多序列比对建树所用的文件。

    2、  多序列比对:打开mega,ALIGN-BUILDALIGNMENT-Create a new alignment-protein-open-retrieve sequences from file-no -test.fasta(或者直接拖动进去,或者双击打开test.fasta),然后点击Alignment——Align by ClustalW——OK——OK。然后比对成功,选择Data——Export Alignment——MEGA format保存文件为test.meg,可以关闭Align会话框。

    3、  构建进化树:打开test.meg。点击PHYLOGENY——选择最上面的ML方法,参数可以选择默认参数。就出现了进化树。当然一些参数最好还是用到,比如说可信度验证的次数设置最好要大于等于500次。

    4、  进化树的美化与理解

    http://www.360doc.com/content/14/0617/22/17553313_387599563.shtml

    https://www.sohu.com/a/196872269_675868

  • 相关阅读:
    #include <utility>
    Html的空格显示
    ExtJs自学教程(1):一切从API開始
    天黑的时候,我又想起那首歌
    citrix协议ICA技术原理
    约瑟夫环问题
    数据结构和算法设计专题之---八大内部排序
    HDU
    深入分析C++引用
    八大排序算法总结
  • 原文地址:https://www.cnblogs.com/jszd/p/11178733.html
Copyright © 2020-2023  润新知