【浙大推出“女娲”AI模型!破解基因组密码】浙江大学郭国骥教授团队在《细胞》杂志发表重要成果。
他们开发多任务深度学习模型女娲CE(NvwaCE),实现从基因组序列到单细胞水平调控序列图谱的直接预测,在基因组AI领域取得重大突破。
基因组由DNA构成,包含编码蛋白质的序列及大量调控序列,二者共同决定生物体的复杂特征。自2003年人类基因组计划绘制出基因图谱后,对其中遗传信息的破译却不足10%。
AI的出现为解读基因序列提供了新途径,但基因组AI模型受数据质量制约。
郭国骥团队基于自主研发的超高通量超灵敏单核ATAC测序技术(UUATAC-seq),为基因组AI模型训练打造了高质量“教材”。