高通量测序基因组拼接技术指标中的Contig N50和ScaffoldN50是什么意思?
来自美吉生物的答案:
1.什么是ContigN50?
Reads拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加,能获得一个Contig总长度。然后将所有的Contigs按照从长到短进行排序,如获得Contig1,Contig2,Contig3...………Contig 25。将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为ContigN50。举例:Contig1+Contig 2+ Contig 3 +Contig 4=Contig总长度*1/2时,Contig4的长度即为ContigN50。ContigN50可以作为基因组拼接的结果好坏的一个判断标准。
2.什么是ScaffoldN50?
Scaffold N50与ContigN50的定义类似。Contigs拼接组装获得一些不同长度的Scaffolds。将所有的Scaffold长度相加,能获得一个Scaffold总长度。然后将所有的Scaffolds按照从长到短进行排序,如获得Scaffold1,Scaffold2,Scaffold3...………Scaffold 25。将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为ScaffoldN50。举例:Scaffold1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold5=Scaffold总长度*1/2时,Scaffold5的长度即为ScaffoldN50。ScaffoldN50可以作为基因组拼接的结果好坏的一个判断标准。
详见美吉生物网站:www.majorbio.com