基因组拼接


基因组是一个生物体全部基因的总合,由完整的DNA序列组成。通过全基因组测序和 de novo 拼接,能够得到物种的全部或部分DNA信息,进而研究功能基因、代谢途径、物种起源与进化等等。

我们通过二代测序和(或)三代测序对样本进行全基因组测序,使用 de novo 的方法进行基因组拼接,通过软件进行基因预测,与Swiss-Prot数据库比对进行基因注释,与近缘物种参考基因组进行比较基因组学分析等。

主要分析:小基因组物种(原核生物,真菌,线粒体、叶绿体等)

测序平台:Illumina HiSeq Xten (小片段PCR-free文库,~450bp);
            PacBio  Sequel (~20kb文库);
            Oxford Nanopore (~2Mb文库);

分析流程

Protocol of genome assembly and gene annoation

例图1、基因组拼接原理


基因组拼接原理

例图2、某真菌基因组拼接结果的contig累积长度


某真菌基因组拼接结果的contig累积长度

例图3、某真菌基因组拼接结果的GC含量


某真菌基因组拼接结果的GC含量

例图4、牛X染色体与人X染色体共线性分析


比较基因组学--牛X染色体与人X染色体共线性分析

参考文献

Venter J C, Adams M D, Myers E W, et al. The Sequence of the Human Genome[J]. Science, 2001, 291(5507): 1304-1351.
Zimin A V, Delcher A L, Florea L, et al. A Whole-Genome Assembly of the Domestic Cow, Bos taurus[J]. Genome Biology, 2009, 10(4): 1-10.