每日一生信--idba-ud拼接 每日一读改变一生

用trimmomatic我们获得了cleanreads,然后呢,我们需要对这个reads 进行拼接。拼接的思路大体可以分为两种:一种叫做Overgap,一种是debrujin,前者是根据两条read序列前后部分的重叠来拼接,适用于一代测序的结果,而后者是将reads切割成更小的片段k-mers,k-mers的组合来完成拼接工作,适用于二代高通量测序。现在可以用的软件非常之多,比如说:clc(收费的),SOAPdenovo,velet等等。而我选择的是牛逼哄哄的idba_udidba_ud(http://i.cs.hku.hk/~alse/hkubrg/projects/idba_ud/)是一个可以针对不同测序深度的短reads的基于交互式DeBruijin作图的从头拼接软件。他从小的k-mer开始到大的的k-mer步步前进,设定阈值,短的和低深度的contigs被删掉,这样来完成低深度和高深度的拼接。
下载地址:http://i.cs.hku.hk/~alse/hkubrg/projects/idba_ud/idba_ud.php$ ./configure$ make
IDBA-UD - Iterative de Bruijn Graph Assembler for sequencingdata with highly uneven depth.Usage: idba_ud -r read.fa -o output_dirAllowed Options: -o, --out arg (=out) 生成文件的文件夹 -r, --read arg fasta文件(<=128) -l, --long_read arg fasta长read文件(>128) --mink arg (=20) 最小的k值 (<=124) --maxk arg (=100) 最大的k值(<=124) --step arg (=20) 每次增加的k-mer --inner_mink arg (=10) inner minimum k value --inner_step arg (=5) inner increment of k-mer --prefix arg (=3) prefix length used to build sub k-mer table --min_count arg (=2) minimum multiplicity forfiltering k-mer when building the graph --min_support arg (=1) minimum supoort in each iteration --num_threads arg (=0) number of threads --seed_kmer arg (=30) seed kmer size foralignment --min_contig arg (=200) min size of contig --similar arg (=0.95) similarity for alignment --max_mismatch arg (=3) max mismatch of error correction --min_pairs arg (=3) minimum number of pairs --no_local do not uselocal assembly --no_coverage do notiterate on coverage --no_correct do not docorrection --pre_correction perform pre-correction before assembly
CommentIDBA接受fasta格式的reads.Fastq格式可以通过fq2fa程序被转化为fasta文件$ bin/fq2fa read.fq read.fa
每日一生信--idba-ud拼接 每日一读改变一生
IDBA-SC需要将paired-endreads存在一个FastA文件中,一对reads保存在两行,如果不是,可以用fq2fa来合并两个FastQ为一个。$ bin/fq2fa --merge --filter read_1.fq read_2.fq read.faor convert a FastQ read file to FastA file.$ bin/fq2fa --paired --filter read.fq read.fa
最后输入如下命令即可:/sam/idba_ud/bin/idba_ud -rtotal.read.fa --maxk 90 --step 10 -o output_dir1--num_threads 12 --min_contig 200
ps: 1,我的50G的数据,用48G的内存,大概1天就出结果了,对这个结果还是比较满意的 2,上面的很多的参数的设置还不是太明白,一边用一边理解吧。

  

爱华网本文地址 » http://www.413yy.cn/a/25101010/41309.html

更多阅读

田蕴章每日一题每日一字100集笔记-1 每日一字田蕴章

1.永㈠①①②③㈡㈢每日一题:“永字八法”“永字八法”是以“永”字八笔顺序为例,阐述正楷笔势的方法:点为侧,侧锋峻落,铺毫行笔,势足收锋;横为勒,逆锋落纸,缓去急回,不可顺锋平过;直笔为努,不宜过直,太挺直则木僵无力,而须直中见曲势;钩为趯(tì

每日一题:2015天津卷-锌铜原电池

每日一题:【2015天津理综化学】锌铜原电池装置如图所示,其中阳离子交换膜只允许阳离子和水分子通过,下列有关叙述正确的是()A.铜电极上发生氧化反应B.电池工作一段时间后,甲池的c(SO42-)减小C.电池工作一段时间后,乙池溶液的总质量增加

转载 当你心情不好时,读一读它 九上语文读一读写一写

原文地址:当你心情不好时,读一读它作者:白头翁当你心情不好时,读一读它佛学的181条智慧一、人之所以痛苦,在于追求错误的东西。 二、与其说是别人让你痛苦,不如说是自己的修养不够。 三、如果你不给自己烦恼,别人也永远不可能给你烦

一读就错的100个汉字 念错字

一读就错的100个汉字@高会民 编辑制作1、氛围【注音】fēnwéi。周围的气氛和情调,也作雰围。氛,不读“奋”,读作“分割”的“分”。2、一场雨、一场大战,这里的场【注音】cháng,用于事情的经过,不读chǎng。3、匀称、称职、称心如意、对

声明:《每日一生信--idba-ud拼接 每日一读改变一生》为网友良人夜半哭乱嫁分享!如侵犯到您的合法权益请联系我们删除