观察|“人人基因组时代”将至,谁来高效准确读懂海量生命数据?

“人人基因组时代”到来之前,基因测序行业首先将面临生命数据分析解读的“劳动力短缺”问题。
“随着测序技术的飞速发展,当每个人都有机会获得一份专属的个人全基因组数据时,如何从海量的生命数据中高效、精准地解读生命奥秘,已成为行业关注的焦点。”近日,在国内测序行业龙头华大对外发布两款纳米孔测序仪之际,华大基因(300676.SZ)CEO赵立见如是谈到行业面临的问题。
值得一提的是,随着纳米孔测序仪的推出,华大宣布将进入“SEQ ALL”阶段,也就是实现了“全读长”测序产品的闭环。类似的,华大基因团队基于基因检测大数据,结合先进的AI算法,提出了“生成式生物智能GBI ALL (Generative Bio-Intelligent)”创新范式。
据介绍,GBI ALL理念的核心在于通过生成式生物智能技术,实现对全基因组数据的深度解析。其中,基因检测多模态大模型GeneT是华大基因在AI大模型领域的重大突破。
图片
华大基因IT副总监梁伦纲介绍,在真实临床样本的测试中,GeneT模型展现出了极高的准确率,能够从数百万个变异位点中快速筛选出与临床表型相关的致病突变,可为临床诊断和治疗提供支持。
除了面向临床的GeneT模型外,华大基因还提出了面向公众的ChatGeneT基因组咨询平台。普通用户上传自己的基因检测报告到chatGeneT平台,通过对话方式了解相关疾病的遗传风险及预防建议。
此外,华大基因还推出了智能化的疾病防控系统13311i,通过AI算法和大数据分析,帮助预测个体健康风险,制定个性化的预防方案,推动从被动治疗到主动健康管理的转变。
华大基因方面称,GBI ALL的出现,将推动精准医学迈入了数智化时代。
实际上,获取基因组数据仅仅是解开诸多生命谜团的第一步,测序获得的海量数据如何处理则是该技术有效应用的关键。这也是该领域长期提升的方向之一。
全球行业巨头因美纳(Illumina)的人工智能副总裁Kyle Farh在去年9月于江苏南京举行的一场大会上即提出,“基于人工智能和大模型的算法正在基因数据领域展现巨大潜力,因美纳研发团队正全力推动基于自然选择训练的AI算法在基因数据中的应用开发。”
去年6月,因美纳也曾宣布推出全新人工智能(AI)算法——PrimateAI-3D,其能够利用灵长类动物基因和先进的人工智能技术来改善遗传风险预测和药物靶点发现。“你可以在维基百科和其他地方的现有文本上训练ChatGPT等生成语言模型,我们使用了类似的深度学习架构,但我们的数据来自数百万年的自然选择。”该公司当时称。