谷歌DeepMind新模型AlphaGenome竟能做到这些?

宁波市海曙区图书馆

谷歌 DeepMind 发布的这个 AlphaGenome 模型可太牛,能预测好多和调控活性相关的分子属性,还能评估基因变异影响,简直让人好奇它到底有多厉害!

模型面世

谷歌 DeepMind 那可是在科技界响当当的,这次他们又搞大事情,新发布了 AlphaGenome 模型。这个模型就像一个超级小能手加入了 Alpha 系列大家庭,可以针对人类 DNA 序列进行更精准分析,考虑到了单个变异或者突变对于调控基因生物过程的影响,一下就引起了很多人的关注。你想想,之前可没有这样方便分析基因序列的东西。不管是在生物技术公司,还是在高校科研团队里,大家都在讨论它。

图片

图片

功能亮点

AlphaGenome 厉害就厉害在它的“本事”多。它会把 1 Mb 这样的 DNA 序列,再加上物种信息作为输入条件。随后,它能够一下子预测那么多不同情况!它能覆盖 5930 条人类基因组轨迹,还有 11 种输出类型,可以说是非常全能了,比如能分析不同细胞类型下的各种基因轨迹情况,这给基因研究提供了好多有用的信息。不管是对于做细胞周期基因调控的学者来说,还是那些和罕见基因病打交道的团队,它都有可能成为重要助力。

图片

技术创新

再说一个它的独特技术,也就是那个蒸馏阶段的操作。科研人员弄了一个共享预训练架构的学生模型。这个学生模型目标就非常明确通过把那些经过增强处理的输入序列拿来用,然后去预测多个全折叠教师模型综合以后输出的结果。据说,这种办法能够让模型在预测变异效应的时候更加准确,鲁棒性,也比以前好多了。好比以前预测基因变异效果可能就像在大雾里找东西,现在有这个技术,就像雾散了能更精准找到了。在各大实验室做不同基因序列预测试验时,这个技术也不断被验证着。

性能评估

不过这模型效果到底好不好?研究人员可是做了不少评估。他们就想着看看这个模型对没见过的基因组区段会有怎样的泛化能力,说到底这也是能高质量完成预测变异效应的重要基础。为了评估就采用了交叉验证折外评估的办法,还把它预测出来的结果和那些目前在各个任务里最强的外部模型做比较,这一对比啊就更能看出 AlphaGenome 的优势来了。在许多高校或者前沿研究机构的计算平台,这些评估活动时常进行着。

效果对比

在一场实打实的“对比考试”中,AlphaGenome 可是展现了超强实力。尤其是在细胞类型特异基因表达变化的预测任务里,它和多模态序列模型 Borzoi 比试了一番,结果发现 AlphaGenome 相比于对手,相对性能提升达到了 17.4%!这可真不是一个小数字,说明这个新模型在预测这块确实有两把刷子,能让基因领域科研人员更靠近追求的精准结果了,在世界各地的科研比较项目都惊叹于这个增长数据。

应用价值

图片

从对整个学界以及实际应用看,AlphaGenome 那用途太广泛了。在基础基因组学研究方面,它仿佛是一个探测器,能帮着更快地找到基因组里关键的功能元件,还能给它们的角色下准确的定义,为研究基因调控提供了相当系统的信息。无论是做生物制药的公司,还是攻克遗传疾病难题的团队,说不定都能从这个模型里得到启发和帮助。想象以后那些患有先天性遗传病的患者,也许因为它能找到更有效的治疗方法

大家说说看,以后这个 AlphaGenome 要是大范围投入使用了,还可能会给基因领域带来些啥惊喜?

图片