当前位置:网站首页 > 更多 > 涨姿势 > 正文

[涨姿势] 这个人工智能可以解释狗叫的含义

作者:精品下载站 日期:2024-12-13 16:14:20 浏览:12 分类:涨姿势

这个人工智能可以解释狗叫的含义


该模型还能够区分不同品种,表明它们都有自己的“口音”。

[涨姿势] 这个人工智能可以解释狗叫的含义

研究人员称,狗有 14 种主要的发声类型。

图片来源:Dean Drobot/Shutterstock.com

狗语者现在可以加入到可能被人工智能(AI)窃取工作的专业人士名单中,因为它可能刚刚进入动物交流领域。使用机器学习软件,研究人员能够成功解码狗发声的含义,为新技术铺平道路,帮助我们更好地了解我们的四足伙伴。

这项尚未经过同行评审的研究的作者记录了 74 只宠物狗在暴露于各种旨在引发某些反应的场景时的吠叫、咆哮、嚎叫和呜咽。其中包括从玩他们最喜欢的玩具到目睹研究人员假装攻击狗主人等一切。

研究作者从这些录音中识别出 14 种不同类型的狗发声,例如游戏过程中的“积极尖叫”、“悲伤/焦虑吠叫”和“对陌生人非常激进的吠叫”。一个名为 Wav2Vec2 的人工智能模型最初是为人类语音识别而设计的,然后对这些猎犬的声音进行了训练,然后通过了一系列挑战。 

第一个是根据狗的叫声挑选出个别狗。有趣的是,当人工智能在引入狗的语言之前接受人类语言的预训练时,它能够在 50% 的试验中成功识别特定的狗,而仅接受犬类声音训练的模型则获得了 24% 的成功率。

这是非常重要的,因为它表明熟悉人类语音可以帮助人工智能掌握非人类交流的复杂性,这意味着我们在构建说话模型时不必从头开始对动物。 

研究作者 Rada Mihalcea 在一份声明中解释说:“我们的研究结果表明,源自人类语音的声音和模式可以作为分析和理解其他声音(例如动物发声)的声学模式的基础。”

对于下一个技巧,该模型能够区分不同的狗品种,并取得了不同程度的成功。研究中超过一半的狗是吉娃娃狗,该软件能够在大约 75% 的情况下根据狗的叫声正确识别这些哈巴狗。

最后,模型面临的挑战是通过将动物发声与研究人员列出的 14 种狗叫声中的一种进行匹配来解释动物发声的含义。在对人类语音进行预训练时,人工智能的成功率达到 62.2%,尽管某些类别的声音比其他类别的声音更容易解读。

例如,该模型能够正确识别 90.7% 的负面咕噜声,但只能正确识别 45.26% 的负面尖叫声。 

“对于与我们共享这个世界的动物,我们还有很多不了解的地方。人工智能的进步可以用来彻底改变我们对动物交流的理解,我们的研究结果表明,我们可能不必从头开始,”米哈尔恰说道。

她说:“通过使用最初针对人类语音进行训练的语音处理模型,我们的研究打开了一个新的窗口,让我们了解如何利用迄今为止在语音处理方面建立的模型来开始理解狗叫声的细微差别。”

该研究目前正在等待同行评审,并可在 arXiv 上作为预印本获取。

您需要 登录账户 后才能发表评论

取消回复欢迎 发表评论:

关灯