如何快速将参考基因组拆分为各条染色体序列？ - 润新知

如何快速将参考基因组拆分为各条染色体序列？
目录
需求

客户反映，完整的基因组太大打不开，要我将之按各条染色体和scaffold拆分。如何快速实现？

方法一

借助工具：
```
$ pip install pyfaidx
$ faidx -x sequences.fa
```
方法二

自己写脚本：split.pl
```
#!/usr/bin/perl

$f = $ARGV[0]; #get the file name

open (INFILE, "<$f")
or die "Can't open: $f $!";

while (<INFILE>) {
$line = $_; 
chomp $line;
if ($line =~ />/) { #if has fasta >
close OUTFILE;
$new_file = substr($line,1);
$new_file .= ".fa";
open (OUTFILE, ">$new_file")
or die "Can't open: $new_file $!";
}
print OUTFILE "$line
";
}
close OUTFILE;
```
运行：perl split.pl sequences.fa

放到一个目录中，gzip -r dir一并发给客户。

https://www.biostars.org/p/173723/
http://seqanswers.com/forums/archive/index.php/t-32162.html
相关阅读:
excel转换为dta格式
 移动pdf
豆瓣爬虫
 python给证件照换底色
 OS模块
 决策树参数
 Pandas数据连接
 Sklearn用法
 numpy.loadtxt()用法
 单片机基础（五）：定时/计数器的工作原理及工作方式
原文地址：https://www.cnblogs.com/jessepeng/p/14714868.html

热门文章
C#泛型的使用
 SQL查询，排除指定字段
 C#泛型，实现泛型栈
 C#接口
 C#Lambda表达式
 C#委托示例
 C#枚举
 C#结构体
 自定义转换
 Conditional特性

Copyright © 2020-2023 润新知