基因组信息在生命科学研究中具有重要价值。随着价格的下降,基于三代长读长的测序组装越来越广泛地应用于基因组学研究 (Nat Methods 2022; Nat Rev Gene 2024);其中,PacBio高保真(High-fidelity, HiFi)测序技术因其高精度的测序质量被认为是三代测序的金标准。然而,其标准建库方法需要大量DNA输入(>1 µg),限制了其在小型昆虫或珍稀样本中的应用 (Proc Natl Acad Sci U S A 2021; Nucleic Acids Res 2020)。DNA扩增虽然可以降低样本输入量,但会引入扩增偏好和人工嵌合序列等错误,影响基因组的完整性及变异检测的准确性。因此,低DNA用量、无扩增且操作简单的PacBio建库方法亟待开发。
2024年7月5日,中国科学院动物研究所张勇研究组与中国农业科学院深圳农业基因组研究所阮珏研究组在Nature Communications杂志上在线发表了题为Low-input PacBio sequencing generates high-quality individual fly genomes and characterizes mutational processes的论文。该研究开发了一种基于Tn5转座酶的低DNA用量(100 ng)、无扩增、低成本的PacBio建库技术LILAP。团队利用该技术实现了两个单只雄性黑腹果蝇的全基因组测序和高质量组装,同时获得了内共生菌Wolbachia完整基因组,展示出LILAP的应用价值。基因组分析还发现了两个突变特性:复杂转座事件更倾向于发生在non-B DNA序列富集的区域;基因转换(gene conversion)事件使转座子同质化。