谷歌发布AI工具,揭秘人类基因组未解之谜

2026-04-07 05:18来源:本站

  

  编者按:在科技与生命科学交汇的前沿,谷歌再次投下一枚震撼弹。其最新发布的人工智能工具AlphaGenome,被誉为解码人类基因组“天书”的钥匙,或将彻底改变我们对遗传密码的认知。长久以来,人类基因组中高达98%的非编码序列被视作“垃圾DNA”,其运作机制如同深埋的宝藏,难以触及。如今,借助深度学习的力量,科学家得以窥见这些序列如何像交响乐指挥般,精密调控着生命的每个细胞。这不仅意味着我们离破解癌症、遗传病等顽疾的根源更近一步,更可能开启一个精准医疗的新纪元。然而,技术的突破也伴随着冷静的思考:数据局限、环境复杂性等因素,仍提醒着我们前路漫漫。这场AI与基因的共舞,正悄然重塑医学的未来。

  谷歌本周发布了一款人工智能工具,其科学家表示,这将有助于揭开人类基因组的神秘面纱——并可能在未来催生新的疾病治疗方法。

  这款深度学习模型AlphaGenome被外界研究人员誉为一项“突破性进展”,它将使科学家能够研究甚至模拟难以治疗的遗传性疾病的根源。

  谷歌DeepMind研究副总裁普什米特·科利告诉记者,尽管2003年首个完整的人类基因组图谱“给了我们生命之书,但阅读它一直是个挑战”。

  “我们有了文本,”他说,这是由构成DNA的字母A、T、C、G表示的30亿个核苷酸对序列。

  然而,“理解这个基因组的语法——我们的DNA中编码了什么,以及它如何支配生命——是研究的下一个关键前沿,”科利补充道,他也是《自然》杂志一项新研究的合著者。

  我们的DNA中只有大约2%包含制造蛋白质的指令,这些蛋白质是构建和运行身体的分子。

  另外98%曾长期被斥为“垃圾DNA”,因为科学家们难以理解它的作用。

  然而,现在认为这种“非编码DNA”就像一个指挥家,指导着遗传信息在我们每个细胞中如何运作。

  这些序列还包含许多与疾病相关的变异。AlphaGenome的目标正是理解这些序列。

  该项目只是谷歌人工智能驱动的科学工作的一部分,其中还包括获得2024年诺贝尔化学奖的AlphaFold。

  AlphaGenome的模型基于公共项目的数据进行训练,这些项目测量了人类和小鼠数百种不同细胞和组织类型中的非编码DNA。

  该工具能够分析长DNA序列,然后预测每个核苷酸对如何影响细胞内的不同生物过程。

  这包括基因的启动和停止,以及产生多少RNA(在细胞内传递遗传指令的分子)。

  已有其他模型具有类似目标。然而,它们不得不妥协,要么分析短得多的DNA序列,要么降低预测的详细程度,即分辨率。

  DeepMind科学家、该研究的主要作者齐加·阿夫塞克表示,长序列——长达一百万个DNA字母——是“理解单个基因完整调控环境所必需的”。

  而模型的高分辨率使科学家能够通过比较突变序列和非突变序列之间的差异,来研究遗传变异的影响。

  “AlphaGenome可以通过帮助绘制功能元素的位置及其在分子水平上的作用,加速我们对基因组的理解,”该研究的合著者娜塔莎·拉蒂舍娃说。

  谷歌表示,该模型已被160个国家的3000名科学家测试,并可供任何人非商业使用。

  “我们希望研究人员能用更多数据扩展它,”科利补充道。

  剑桥大学研究员本·莱纳并未参与开发AlphaGenome,但对其进行了测试。他表示,该模型“确实表现非常出色”。

  “识别我们基因组中使我们或多或少可能患上数千种疾病的精确差异,是开发更好疗法的关键一步,”他解释道。

  然而,他补充说,AlphaGenome“远非完美,仍有许多工作要做”。

  “人工智能模型的好坏取决于用于训练它们的数据”,而现有数据并不十分合适,他说。

  英国弗朗西斯·克里克研究所基因组学负责人罗伯特·戈德斯通警告说,AlphaGenome“并非解决所有生物学问题的灵丹妙药”。

  这部分是因为“基因表达受到模型无法看到的复杂环境因素的影响”,他说。

  然而,戈德斯通补充说,该工具仍然代表了一项“突破”,将使科学家能够“研究和模拟复杂疾病的遗传根源”。

打卡网声明:未经许可,不得转载。