生信分析中,很多时候需要用到sample.list, 基本上这个就是实现多样本并行的不可缺少的文件。那如果有几百个样本的fastq.gz文件,如何将快速列出一个sample.list呢?用下面这句话就可以了
ls -1 | grep "_L001_R1_001.fastq.gz$"|sed 's/_L001_R1_001.fastq.gz//g' >sample.list
刚下机的原始数据:
CM10-1_S10_L001_R1_001.fastq.gz
CM10-1_S10_L001_R2_001.fastq.gz
sample.list:
CM10-1_S10