• 认识一下生物信息领域的文件格式


    #===================================    interproscan  提到的格式  ===================================

    TSV 是Tab-separated values的缩写,即制表符分隔值。
    CSV,Comma-separated values(逗号分隔值)。
    注意:IANA规定的标准TSV格式,字段值之中是不允许出现制表符
    Python对TSV文件的支持:
    Python的csv模块准确的讲应该叫做dsv模块,因为它实际上是支持范式的分隔符分隔值文件(DSV,delimiter-separated values)的。
    delimiter参数值默认为半角逗号,即默认将被处理文件视为CSV。
    当delimiter=’ ’时,被处理文件就是TSV。

    #==================================    gff3  gff   gtf  ===============================================

    #==================================    bam  bam.bai  sam  ==========================================

    #==================================    newick   phylip   ===========================================

    #==================================    待补充 ===================================================

  • 相关阅读:
    python爬取哦漫画
    NLP系列(2)_用朴素贝叶斯进行文本分类(上)
    svm 笔记
    nlp学习笔记
    LR
    bp网络全解读
    最小二乘法
    学习参考
    pandas中的quantile函数
    泰坦尼克号与小费与乘客数量与 鸢尾花数据集
  • 原文地址:https://www.cnblogs.com/jinhh/p/7904554.html
Copyright © 2020-2023  润新知