当前位置:网站首页 > 更多 > 涨姿势 > 正文

[涨姿势] “生物学的 ChatGPT 时刻”:Ex-Meta 科学家开发人工智能模型,可创建“自然界中未发现”的蛋白质

作者:精品下载站 日期:2024-12-13 15:58:15 浏览:14 分类:涨姿势

“生物学的 ChatGPT 时刻”:Ex-Meta 科学家开发人工智能模型,可创建“自然界中未发现”的蛋白质


ESM3模型可以从头开始“编写”新蛋白质,为合成生物学开辟了新的可能性。

当您通过我们网站上的链接购买时,我们可能会赚取联属佣金。这是它的工作原理。

[涨姿势] “生物学的 ChatGPT 时刻”:Ex-Meta 科学家开发人工智能模型,可创建“自然界中未发现”的蛋白质

正如 ChatGPT 通过预测序列中最有可能出现的单词来生成文本一样,新的人工智能 (AI) 模型可以编写并非从头开始自然产生的新蛋白质。

科学家们在 7 月 2 日发表在预印本 bioRxiv 数据库上的一项研究中表示,科学家们使用新模型 ESM3 创造了一种新的荧光蛋白,其序列与天然存在的荧光蛋白仅具有 58% 的序列。由前 Meta 研究人员组建的公司 EvolutionaryScale 的代表也在 6 月 25 日的一份声明中概述了细节。

研究团队已经在非商业许可下发布了该模型的小版本,并将向商业研究人员提供该模型的大版本。据 EvolutionaryScale 称,该技术可用于从药物发现到设计用于塑料降解的新化学品等领域。

ESM3 是一种大型语言模型 (LLM),类似于 OpenAI 的 GPT-4,后者为 ChatGPT 聊天机器人提供支持,科学家们在 27.8 亿个蛋白质上训练了他们最大的版本。对于每种蛋白质,他们提取了有关序列(构成蛋白质的氨基酸构件的顺序)、结构(蛋白质的三维折叠形状)和功能(蛋白质的作用)的信息。他们随机掩盖了有关这些蛋白质的信息片段,并要求 ESM3 预测缺失的片段。

他们根据同一个团队在 Meta 时进行的研究扩展了这个模型。 2022 年,他们宣布了 EMSFold——ESM3 的前身,可以预测未知的微生物蛋白质结构。那一年,Alphabet 的 DeepMind预测了 2 亿种蛋白质的蛋白质结构

相关:DeepMind 的人工智能程序 AlphaFold3 可以预测宇宙中每种蛋白质的结构 - 并显示它们的功能

科学家随后指出,这些人工智能模型的预测存在局限性,蛋白质预测需要验证。但这些方法仍然可以大大加快蛋白质结构的搜索速度,因为另一种方法是使用 X 射线逐一绘制蛋白质结构——这种方法既缓慢又昂贵。

然而,ESM3 不仅仅是预测现有的蛋白质。利用从 7710 亿条独特的结构、功能和序列信息中收集的信息,该模型可以生成具有特定功能的新蛋白质。 EvolutionaryScale 的一位支持者将其描述为“生物学的 ChatGPT 时刻”。

在这项新研究中,研究人员询问模型以生成一种新的荧光蛋白——一种捕获光并以更长的波长将其释放回来的蛋白质,使其发出新的绿色色调。这些蛋白质对于生物研究人员来说非常重要,他们将它们附加到他们感兴趣的分子上以跟踪和成像它们。他们的发现和发展荣获 2008 年诺贝尔化学奖

该模型生成了 96 种蛋白质,其序列和结构可能会产生荧光。然后,研究人员选择了与天然荧光蛋白共有序列最少的一种。尽管这种蛋白质的亮度比天然绿色荧光蛋白低 50 倍,但 ESM3 生成了另一次迭代,产生了增加亮度的新序列 - 结果是一种与自然界中发现的任何绿色荧光蛋白不同的绿色荧光蛋白,被称为“esmGPF”。 EvolutionaryScale 团队估计,这些由人工智能在瞬间完成的迭代需要 5 亿年的进化才能实现。

您需要 登录账户 后才能发表评论

取消回复欢迎 发表评论:

关灯