Bionano Genomics Genome Assembly
Bionano Genomics Genome Assembly

改善基因组组装

当构建从头组装基因组时,单独的短读长 (short-read) 或长读长 (long-read) 测序不足以构建连续且准确的组装。新一代测序技术 (NGS) 技术能在核苷酸水平提供至关重要的信息,但是由于其片段读长太短,无法满足构建完整图谱所需的连续性,且难以克服基因内部和基因间重复序列带来的困扰,因此分辨率有限。

Bionano 基因组定位技术可以在更大的范围内进行结构和变异检测。该技术使用与所考察变异相匹配的分辨率——即数百 kb,而不是数百个碱基对 (bp)——来直接对基因组进行测量。将 Bionano 基因组作图与测序数据相结合,可以跨越百万碱基查看整个基因组,获得其所有背景特征及功能关系的描述。

从头组装 Bionano 基因组作图可与测序数据组装相结合以实现:

  • 序列片段的排列和定向
  • 识别并校正序列组装中可能存在的嵌合拼接
  • 估计相邻序列间的洞 (gap) 大小

为了实现上述功能,Bionano Solve 软件导入测序组装数据,并根据切口内切酶特异性识别位点在序列中识别可能的切口位点。然后将这些基于生物信息学的片段重叠群 (contig)图谱与从头组装 Bionano 基因组作图进行比对。基因组作图通过跨越重复序列和其他破坏 NGS 组装的复杂元件来为重叠群定向并确定洞大小。

通过识别并解决两者之间的冲突,软件生成了混合型长序列片段 (scaffold),其中使用测序图谱来桥接 Bionano 图谱,反之亦然。最终,获得了对应于该混合拼接的序列组装,并将其导出为 FASTA 和 AGP 文件。

Bionano 混合拼接与所所使用的测序技术无关。最近发表的文章基于单独的 Illumina 测序、PacBio 测序、10x Genomics 组装、NRGene 组装、Oxford Nanopore 测序和这些方法的组合研究了拼接组装的特点。

Enzyme Hybrid Scaffolding
两份 Bionano 基因组作图(顶部和底部)与一个大的 NGS 重叠群(中间)进行部分比对。两份 Bionano 基因组图谱由 Nt.BspQl(顶部)和 Nb.BssSI(底部)单独标记反应生成的数据分别进行了从头组装。两图谱比对末端均在完全相同的点,表明在 NGS 组装时有嵌合拼接。
Enzyme Hybrid Scaffolding
两份 Bionano 基因组作图(顶部和底部)与一个大的 NGS 重叠群(中间)进行部分比对。两份 Bionano 基因组图谱由 Nt.BspQl(顶部)和 Nb.BssSI(底部)单独标记反应生成的数据分别进行了从头组装。两图谱比对末端均在完全相同的点,表明在 NGS 组装时有嵌合拼接。
Enzyme Hybrid Scaffolding
两份 Bionano 基因组作图(顶部和底部)与一个大的 NGS 重叠群(中间)进行部分比对。两份 Bionano 基因组图谱由 Nt.BspQl(顶部)和 Nb.BssSI(底部)单独标记反应生成的数据分别进行了从头组装。两图谱比对末端均在完全相同的点,表明在 NGS 组装时有嵌合拼接。

组装冲突和解决

Bionano 的混合拼接管线能检测并解决嵌合拼接问题。嵌合拼接常常在短读长、分子或双端插入无法跨越长 DNA 重复时出现。在对 Bionano 基因组图谱和 NGS 图谱进行比对时错误以冲突拼接的形式出现。

当 Bionano 的混合拼接管线检测到冲突时,它将分析映射到 Bionano 图谱上的单分子数据,并评估哪个序列片段被错误的组装。如果 Bionano 基因组作图在冲突接合处有长分子支持,则序列重叠群被自动剪切,去除假定的嵌合拼接。

如果没有强分子支持,那么 Bionano 基因组作图会被自动剪切。两种组装都必须具有穿过嵌合拼接两端的覆盖度,以检测并解决这些冲突。

Error Correction
两份 Bionano 基因组作图(顶部和底部)与一个大的 NGS 重叠群(中间)进行部分比对。两份 Bionano 基因组图谱由 Nt.BspQl(顶部)和 Nb.BssSI(底部)单独标记反应生成的数据分别进行了从头组装。两图谱比对末端均在完全相同的点,表明在 NGS 组装时有嵌合拼接。
Error Correction
两份 Bionano 基因组作图(顶部和底部)与一个大的 NGS 重叠群(中间)进行部分比对。两份 Bionano 基因组图谱由 Nt.BspQl(顶部)和 Nb.BssSI(底部)单独标记反应生成的数据分别进行了从头组装。两图谱比对末端均在完全相同的点,表明在 NGS 组装时有嵌合拼接。
Hybrid Error Correction
两份 Bionano 基因组作图(顶部和底部)与一个大的 NGS 重叠群(中间)进行部分比对。两份 Bionano 基因组图谱由 Nt.BspQl(顶部)和 Nb.BssSI(底部)单独标记反应生成的数据分别进行了从头组装。两图谱比对末端均在完全相同的点,表明在 NGS 组装时有嵌合拼接。

Validating NGS-Based Assemblies

Bionano 基因组作图代表了一种强大的正交验证方法,用于在区域内验证基因组重叠群和 scaffold,该区域足够简单可以通过片段读长组装。与单独的短读长组装相比,拼接技术利用合成的长读长或 DNA 交联对一些错误提供了校正。但是因为这类校正是基于 NGS 的,它们也遭受了大多数与仅短读长组装相同的问题。只有 Bionano 新一代基因组作图能以高通量的方式提供不基于序列的,正交基因组结构数据,从而实现完全独立的错误校正。

Top

This website stores cookies on your computer. These cookies are used to collect information about how you interact with our website and allow us to remember you. We use this information in order to improve and customize your browsing experience and for analytics and metrics about our visitors both on this website and other media. To find out more about the cookies we use, see our Privacy Policy.