当前位置:网站首页 > 更多 > 涨姿势 > 正文

[涨姿势] 研究人员称GPT-4已通过图灵测试

作者:精品下载站 日期:2024-12-13 17:40:18 浏览:11 分类:涨姿势

研究人员称GPT-4已通过图灵测试


大多数人无法区分 ChatGPT 和人类响应者,这表明著名的图灵测试已经首次通过。

[涨姿势] 研究人员称GPT-4已通过图灵测试

我们与人工智能 (AI) 的在线互动不仅比以往任何时候都多,而且比我们意识到的还要多,因此研究人员要求人们与四个智能体(包括一名人类和三种不同类型的人工智能模型)进行对话,看看他们是否能够分辨出不同之处。 

“图灵测试”最早由计算机科学家艾伦·图灵于1950年提出,被称为“模仿游戏”,旨在判断机器表现智能的能力是否与人类没有区别。机器要通过图灵测试,它必须能够与某人交谈并欺骗他们,让他们误以为它是人类。

科学家决定重复这项测试,要求 500 人与四名受访者交谈,其中包括人类和 1960 年代的人工智能程序 ELIZA,以及 GPT-3.5 和 GPT-4(为 ChatGPT 提供支持的人工智能)。对话持续了五分钟——之后参与者必须说出他们是否相信自己正在与人类或人工智能交谈。在 5 月 9 日发布到预印本 arXiv 服务器上的这项研究中,科学家们发现参与者在 54% 的情况下判断 GPT-4 是人类, 

ELIZA 是一个预先编程了响应但没有大型语言模型 (LLM) 或神经网络架构的系统,只有 22% 的时间被判定为人类。 GPT-3.5 得分为 50%,而人类参与者得分为 67%。

阅读更多内容:“为了保护自己而伤害我们是它的自然权利”:人类现在如何在不知情的情况下虐待人工智能

电气和电子工程师协会 (IEEE) 的人工智能研究员 Nell Watson 告诉《Live Science》:“机器可以像人类一样,进行随意编造,将事物的事后合理理由混在一起。” 

“它们可能会受到认知偏见的影响,受到欺骗和操纵,并且变得越来越具有欺骗性。所有这些因素意味着人工智能系统中会表现出类人的弱点和怪癖,这使得它们比以前的方法更像人类,而以前的方法几乎没有更多的东西。”而不是预设回复列表。”

这项研究建立在数十年来让人工智能代理通过图灵测试的尝试之上,呼应了人们的普遍担忧,即被视为人类的人工智能系统将产生“广泛的社会和经济后果”。 

科学家们还认为,对图灵测试方法过于简单化的批评是合理的,他们表示“风格和社会情感因素在通过图灵测试方面比传统的智力概念发挥着更大的作用。”这表明我们一直在错误的地方寻找机器智能。

“原始智力只能到此为止。真正重要的是足够聪明,能够理解情况、他人的技能,并具有将这些元素整合在一起的同理心。能力只是人工智能价值的一小部分——它们理解事物的能力。”他人的价值观、偏好和界限也很重要,正是这些品质让人工智能成为我们生活中忠实可靠的看门人。”

沃森补充说,这项研究对未来人机交互提出了挑战,我们将对交互的真实本质变得越来越偏执,尤其是在敏感问题上。她补充说,这项研究凸显了人工智能在 GPT 时代发生的变化。 

“ELIZA 仅限于预设回复,这极大地限制了它的功能。它可能会愚弄某人五分钟,但很快限制就会变得清晰,”她说。 “语言模型具有无限的灵活性,能够综合对广泛主题的反应,使用特定的语言或社会方言,并以角色驱动的个性和价值观来描绘自己。这是从人类手工编程的东西向前迈出的巨大一步,无论多么巧妙和仔细。”

您需要 登录账户 后才能发表评论

取消回复欢迎 发表评论:

关灯