当前位置:网站首页 > 更多 > 涨姿势 > 正文

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中

作者:精品下载站 日期:2024-12-13 16:52:52 浏览:10 分类:涨姿势

极端环境被编码到生活在那里的生物体的基因组中


对极端微生物基因组的计算机分析表明,它们的生活条件记录在 DNA 中。

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中

凯瑟琳·希尔和莉拉·卡里

客座作者

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中

在黄石公园的大棱镜泉中可以看到极端微生物。

图片来源:James St. John,来自 Wikimedia Commons(CC BY 2.0)

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中

生物体的基因组在其自身内部进行编码,包含可以揭示其祖先及其亲属之间联系的信息。

基因组的其他维度

我们的研究探索了这样一个假设:生物体的基因组可能包含谱系学或分类学之外的其他类型的信息。我们问:生物体的基因组是否包含可以让我们确定生物体生存环境类型的信息?

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中


尽管看起来不太可能,但我们滑铁卢大学和西部大学的计算机科学和生物学研究团队发现,极端微生物就是这种情况,即在极其恶劣的条件下生存和繁衍的生物体。这些环境条件范围从极热(超过 100°C)到极冷(低于 -12°C)、高辐射或极端酸度或压力。

DNA作为一种语言

我们将基因组 DNA 视为用“DNA 语言”编写的文本。 DNA 链(或 DNA 序列)由一系列称为核苷酸的基本单位组成,通过糖磷酸骨架串在一起。有四种不同的 DNA 单位:腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶 (A、C、G、T)。

从抽象的角度来看,DNA 序列可以被认为是一行文本,由“DNA 字母表”中的“字母”书写。例如,“CAT”是三个字母的“DNA 字”,对应于三单元 DNA 序列胞嘧啶-腺嘌呤-胸腺嘧啶。

20世纪90年代,人们发现,通过计算从生物体基因组中提取的短DNA序列中此类DNA单词的出现次数,人们可以识别该生物体的物种以及其与进化“树”中其他生物体的相关程度。的生活。 ”

这种基于 DNA 字数的生物体识别或分类机制类似于我们区分英文书和法文书的过程:通过从每本书中取出一页,人们会注意到英文文本中出现了很多三个字母的单词“the”,而法语文本中多次出现三个字母的单词“les”。 ”

请注意,每本书的词频概况并不取决于我们选择阅读的特定页面,也不取决于我们是否考虑了多页、单页或整个章节。类似地,基因组中 DNA 单词的频率分布不依赖于被选择代表该基因组的 DNA 序列的位置和长度。

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中


DNA 词频图谱可以作为生物体的“基因组签名”,这是一个重大发现,到目前为止,人们认为基因组的 DNA 词频图谱仅包含与物种有关的进化信息生物体所属的、属、科、目、纲、门、界或域。

我们的团队着手探究基因组的 DNA 词频特征是否可以揭示其他类型的信息,例如,有关微生物嗜极微生物生长的极端环境类型的信息。

极端微生物 DNA 中的环境印记

我们使用了 700 种生活在极端温度(极热或极冷)或极端 pH 条件(强酸性或碱性)条件下的微生物极端微生物的数据集。我们使用监督机器学习和无监督机器学习计算方法来检验我们的假设。

在这两种类型的环境条件下,我们发现我们可以清楚地检测到指示特定生物体所居住的极端环境类型的环境信号。

在无监督机器学习的情况下,“盲”算法被给予了极端微生物 DNA 序列的数据集(并且没有关于其分类或生活环境的其他信息)。然后,算法被要求根据 DNA 词频特征之间的相似性,将这些 DNA 序列分组为簇。

人们期望以这种方式发现的所有簇都将沿着分类学路线:细菌与细菌分组,古细菌与古细菌分组。令我们大吃一惊的是,情况并非总是如此,无论我们使用什么算法,一些古细菌和细菌始终被分组在一起。

可以解释多种机器学习算法认为它们相似的唯一明显的共同点是它们都是喜热的极端微生物。

一个令人震惊的发现

生命之树是生物学中使用的概念框架,代表物种之间的谱系关系,它具有三个主要分支,称为域:细菌、古细菌和真核生物。

真核生物是具有膜结合核的生物体,该领域包括动物、植物、真菌和单细胞微观原生生物。相比之下,细菌和古细菌是单细胞生物,不具有包含基因组的膜结合核。细菌与古细菌的区别在于其细胞壁的组成。

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中


生命的三个领域彼此截然不同,从基因上来说,细菌与古细菌的不同,就像北极熊(真核生物)与大肠杆菌的不同一样。大肠杆菌(细菌)。

因此,期望细菌和古细菌的基因组在通过任何基因组相似性测量进行的任何聚类中都尽可能远离。我们发现一些细菌和古细菌聚集在一起,显然只是因为它们都适应极端高温,这意味着它们生活的极端温度环境导致它们的基因组语言发生普遍的、全基因组的、系统性的变化。

这一发现类似于发现基因组的一个全新维度,即环境维度,除了众所周知的分类维度之外还存在。

其他环境的基因组影响

除了出乎意料之外,这一发现可能会对我们理解地球上生命的进化产生影响,并指导我们思考如何才能在外太空生活。

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中


事实上,我们正在进行的研究正在探索抗辐射极端微生物的基因组特征中是否存在环境信号,例如耐辐射球菌,它可以在辐射暴露以及寒冷、脱水的情况下生存、真空条件和酸,并被证明能够在外太空存活长达三年。

[涨姿势] 极端环境被编码到生活在那里的生物体的基因组中

Kathleen A. Hill,西方大学生物学副教授和 Lila Kari,滑铁卢大学计算机科学教授

本文是根据知识共享许可从 The Conversation 重新发布的。阅读原文。

您需要 登录账户 后才能发表评论

取消回复欢迎 发表评论:

关灯