• 【群体遗传】PopART 绘制 Haplotype Network 图解(By Raindy)


    转载于:http://blog.sciencenet.cn/home.php?mod=space&uid=460481&do=blog&id=1191502

    絮语:
            重建单倍型网络是群体遗传学的一个重要分析内容,最常用的分析工具有Network、TCS等,但不同工具都有相应的优缺点,具有详见日志后的参考文献,本文不作赘述。

            本文介绍一款全能型的单倍型网络重建工具-- PopART,该软件整合了多种不同的单倍型网络重建算法,支持Windows、Linux、MacOS多平台...

            PopART 官网:http://popart.otago.ac.nz/index.shtml


    辅助工具:DnaSP 和 Arlequin

    简明流程:
    1. 数据格式准备:

    PopART 数据格式,主要有两个data和Traits模块,红色部分为主要模板参数,黑色部分需要通过实际数据修改:

    Begin Data;

        Dimensions ntax=12 nchar=13;

        Format datatype=DNA missing=N gap=-;

        Matrix

    单倍型数据(需要替换上实际数据)

    ;

    END;

    Begin Traits;

    Dimensions NTraits=4;

    format labels=yes missing=? separator=Comma;

    TraitLabels Fujian Hebei Heilongjiang Jiangsu;

    Matrix
    单倍型频率分布数据(需要替换上实际数据)

    ;

    End;

    Raindy 注:
    Data 模块中,ntax是单元类别数,nchart是字符长度,即:序列长度
    Traits模块中,NTraits是性状数,示例数据为不同地区群体,共有四个;separator是不同性状群体间的分隔符,可以是逗号也可以是Tab制表符,需要下方的数据统一。示意数据是Comma分隔;TraitLabels是具有的性状名称,不同名称之间由半角空格间隔;

    (1)准备 Haplotype 数据和频率分布数据
            将原始FASTA格式的序列文件载入DnaSP后,点击菜单栏“Data”的“Defined Seeuence sets”对序列根据特定的性状进行分组(图1),示例数据根据地区分组,分组完毕 “Update All Entries”。





            随后,依次点击菜单栏“Generate”->“Haplotye data file”将分组后的数据生成“Arlequin Haplotype List”文件,生成Test.arp和Test.hap 两个文件,Test.arp用Arlequin的方案文件,Test.hap为单倍型数据文件。

    psb_03.png

            将Test.arp和Test.hap复制到Arlequin目录中,打开Arlequin主程序,通过“Open project”载入“Test.arp”(图)
    psb_04.png

            标签切换到“Structure Edior”对不同地区的群体进行归组,示例数据的不同群体均为一个组,故“Group”均设置为“1”,并点击“Update Project”更新项目分组内容:
    psb_05.png

            标签切换到“Settings”选择不同的分析内容,可以点击“Population comparison”选项(由灰变暗红即启用),勾选“Compute pairwise Fst”选项,其他参数采用默认设置:
    psb_06.png

            在生成结果文件(Test_main.html)中找到“Haplotype frequencies in populations”内容,复制不同单倍型在不同群体中的频率分布值(下图突出选中区域),粘贴入一个空的记事本中并保存为Test_frq.txt。
    psb_07.png

            运行 Excel后打开Test_frq.txt通过导入向导(注意:间隔符号为空格)导入频率文件,并整理如下格式图备用(文件名:Test_frq.xlsx)
    psb_08.png


    (2)合并单倍型数据和频率分布为PopART所需的Nexus文件
            用文本编辑类工具(如:Notepad++等)创新一个模板文件,分别在Data模块和Traits相应的位置中添加入单倍型数据和频率分布数据,完整如下代码所示:

    #NEXUS

    Begin Data;

        Dimensions ntax=12 nchar=13;

        Format datatype=DNA missing=N gap=-;

        Matrix

    Hap_1   TACATCAGGGTAG

    Hap_2   TACATCAGGGTAC

    Hap_3   TACATTAGGGTAC

    Hap_4   TCCACCAGGGAAC

    Hap_5   TCCATCAGGGTAC

    Hap_6   TACATCAGGGTCC

    Hap_7   TACAACAGCTTAC

    Hap_8   TACAACAGGGTAC

    Hap_9   CACCACCACGTAC

    Hap_10  TATAACAAGGTAC

    Hap_11  TACTTCAGGGAAC

    Hap_12  TACAACAGGGAAC

    ;

    END;

    Begin Traits;

    Dimensions NTraits=4;

    format labels=yes missing=? separator=Comma;

    TraitLabels Fujian Hebei Heilongjiang Jiangsu;

    Matrix

    Hap_1 10,0,0,0

    Hap_2 19,9,12,10

    Hap_3 1,0,0,0

    Hap_4 1,0,0,0

    Hap_5 1,0,0,0

    Hap_6 0,0,1,0

    Hap_7 0,0,1,0

    Hap_8 0,0,2,0

    Hap_9 0,0,1,0

    Hap_10 0,0,0,7

    Hap_11 0,0,0,2

    Hap_12 0,0,0,1

    ;

    End;


    2. 绘制单倍型网络
            在PopART中载入格式正确的nexus文件后,在“Network”菜单下选择一个算法,示例为“TCS Network”,此时默认生成的是黑白样式的,如下图所示:

    PopART_09.png

    可以在“Edit”菜单下设置包括性状颜色、标签字体和图注字体等属性:
    PopART_10.png

            如果需要修改性状颜色,在右下角图注选择相应的圆圈(如:Fujian前的圆圈),鼠标右键弹出“Change trait colour”设置不同的颜色。在PopART中,很多元件(如:单倍型标签、图注和外框边界)都可以直接拖动。
    PopART_11.png
            设置完毕后的Haplotype Network可以“File”菜单中导出矢量的图形,为便于后期在AI中进一步美化,推荐导出svg格式:
    PopART_12.png


            以下示意为Minimum Spanning Network算法重建的单倍型网络图:

    psb_13.png

    Raindy注:PopART除了可以选择不同算法重建单倍型网络图外,还可以结合地图(map)进行呈现...

    参考文献:
    Leigh, J.W., Bryant, D., 2015. popart: full-feature software for haplotype network construction. Methods in Ecology and Evolution 6, 1110-1116.

  • 相关阅读:
    题解 CF934A 【A Compatible Pair】 ——贪心
    洛谷 P3381 【【模板】最小费用最大流】
    洛谷 P3376 【【模板】网络最大流】
    洛谷 P1027 【Car的旅行路线】
    TYVJ P1039 【忠诚2】
    洛谷 P1273 【有线电视网】
    斯特林数相关
    从 简单容斥 到 min-max 容斥 与 二项式反演
    POI2011 Lightning Conductor
    LOJ6089 小 Y 的背包计数问题
  • 原文地址:https://www.cnblogs.com/triple-y/p/14302523.html
Copyright © 2020-2023  润新知