###simulated data
#parameter setting: dc=0.5,p=0.005
###real data
##preprocess
python /home/ty/桌面/真实数据/EGAR00001004836_2561_1/fengge.py #split the whole genome into 22 samples
#查看该染色体对应参考基因组
samtools view -H test.bam
##calculate ODS 两两比较,overlapratio >= 前者的50%,算重叠。 采用一对一的方式(即在程序中加入 break),所以A和B比较 与 B和A比较的结果是不一样的
python /home/ty/桌面/真实数据/EGAD00001000144_LC/sta_overlap_entry.py #get the entry of every methods
#then deliever the results to EXCEL,calculate the ODS in EXCEL though the formula.
##统计交集
python /home/ty/桌面/真实数据/EGAD00001000144_LC/sta_interset.py #get the 'interset' file,which includes interset of results of four methods
##explain the gene and cytoband
Rscript /home/ty/桌面/真实数据/extract_cytoband_gene/cytobands-genes.R #得到检测结果对应到cghMCR.gene和chromosomeband.txt文件中,有哪些基因时有用的,然后去知网一个一个搜这些基因的文献是否与样本对应的癌症有关。
##统计cytoband和gene的个数
python /home/ty/桌面/真实数据/extract_cytoband_gene/count.py