• plink软件maf过滤24号染色体异常


    001、

    root@PC1:/home/test# ls
    outcome.map  outcome.ped
    root@PC1:/home/test# cat outcome.map     ## 测试数据,均为24号染色体数据
    24      snp1    0       260996
    24      snp2    0       363750
    24      snp3    0       299533
    root@PC1:/home/test# cat outcome.ped
    DOR     1       0       0       0       -9      A A     A G     A A
    DOR     2       0       0       0       -9      A A     G G     A A
    DOR     3       0       0       0       -9      A A     A A     A A
    DOR     4       0       0       0       -9      A A     G G     A A
    DOR     5       0       0       0       -9      A A     G G     A A
    DOR     6       0       0       0       -9      A A     A G     A A

    002、利用maf参数过滤

    root@PC1:/home/test# plink --file outcome --maf 0.01 --recode tab --out test &>/dev/null; rm *.log *.nosex
    root@PC1:/home/test# ls    ## 过滤结果, test*文件
    outcome.map  outcome.ped  test.map  test.ped
    root@PC1:/home/test# cat test.map      ##  maf命令并没有起作用,而且snp顺序发生了变化
    24      snp1    0       260996
    24      snp3    0       299533
    24      snp2    0       363750
    root@PC1:/home/test# cat test.ped           ## 仍然有没有多态性的位点
    DOR     1       0       0       0       -9      A A     A A     A G
    DOR     2       0       0       0       -9      A A     A A     G G
    DOR     3       0       0       0       -9      A A     A A     A A
    DOR     4       0       0       0       -9      A A     A A     G G
    DOR     5       0       0       0       -9      A A     A A     G G
    DOR     6       0       0       0       -9      A A     A A     A G

    出现如下警告:

    003、设定染色体的情况

    root@PC1:/home/test# ls
    outcome.map  outcome.ped
    root@PC1:/home/test# plink --file outcome --chr-set 40 --maf 0.01 --recode tab --out test &>/dev/null; rm *.log *.nosex
    root@PC1:/home/test# ls        ## 过滤结果, test*文件
    outcome.map  outcome.ped  test.map  test.ped
    root@PC1:/home/test# cat test.map    ## 当指定染色体时, maf参数起作用
    24      snp2    0       363750
    root@PC1:/home/test# cat test.ped
    DOR     1       0       0       0       -9      A G
    DOR     2       0       0       0       -9      G G
    DOR     3       0       0       0       -9      A A
    DOR     4       0       0       0       -9      G G
    DOR     5       0       0       0       -9      G G
    DOR     6       0       0       0       -9      A G

    001、可能原因时plink将24号染色体作为了Y染色体

    002、在过滤包含24号染色体的数据时, 应注意避免设置染色体。 

    补充:利用绵羊芯片数据测试

    root@PC1:/home/test# ls
    sheep.map  sheep.ped
    root@PC1:/home/test# cut -f 1 sheep.map |uniq -c   ## 查看当前数据的染色体, 包含24号
        998 20
        768 21
        984 22
       1005 23
        662 24
        892 25
        805 26                   ## 在不加染色体信息情况下过滤
    root@PC1:/home/test# plink --file sheep --maf 0.01 --recode --out test &> /dev/null; rm *.log *.nosex
    root@PC1:/home/test# ls        ## 过滤结果, test文件
    sheep.map  sheep.ped  test.map  test.ped    ## 指定染色体(--sheep), 然后计算24号基因频率
    root@PC1:/home/test# plink --file test --sheep --freq --chr 24 --out verify &> /dev/null; rm *.log *.nosex
    root@PC1:/home/test# ls
    sheep.map  sheep.ped  test.map  test.ped  verify.frq
    root@PC1:/home/test# head verify.frq  ## 查看基因频率结果文件, 发现有基因频率为0的, 说明第一步的maf参数并没有对24号染色体起作用
     CHR                 SNP   A1   A2          MAF  NCHROBS
      24            s75016.1    0    C            0      880
      24            s72739.1    G    A        0.217      880
      24            s29575.1    A    G       0.4852      880
      24            s23759.1    0    C            0      880
      24      OAR24_862318.1    G    A       0.2716      880
      24            s01400.1    A    T       0.1284      880
      24      OAR24_885120.1    T    A       0.2568      880
      24            s65907.1    C    A       0.4989      880
      24            s56532.1    A    G       0.4818      880

    001、因此,在使用maf过滤染色体包含24的数据时,应当指定染色体数目 

  • 相关阅读:
    android动画坐标定义
    Android animation 动画背景图自动播放的实现
    松开手,你可以拥有更多
    Serializable继承和用途
    程序员必备的国外IT网站
    android 解析json数据格式
    免费的天气预报API谷歌,雅虎,中央气象台
    关于Lockfree Hash Table的一些链接资料
    字符串匹配算法之Brute force algorithm
    java 处理高精度计算
  • 原文地址:https://www.cnblogs.com/liujiaxin2018/p/16668227.html
Copyright © 2020-2023  润新知