[涨姿势] 新研究表明 ChatGPT 可能已经通过了图灵测试
作者:精品下载站 日期:2024-12-13 16:14:41 浏览:11 分类:涨姿势
新研究表明 ChatGPT 可能已经通过了图灵测试
法学硕士:伪装的机器人。
机械神。
图片来源:William Bradberry/Shutterstock.com
1637 年,法国哲学家、可能是瘾君子的勒内·笛卡尔 (René Descartes) 提出了一个有趣的想法:机器可以思考吗? 1950 年,英国数学家和计算机科学家艾伦·图灵 (Alan Turing) 宣布了对这位 300 岁老装腔作势者的答案:谁在乎呢?他说,一个更好的问题是后来被称为“图灵测试”的问题:给定一个人、一台机器和一个人类询问者,机器能否让询问者相信它实际上就是这个人?
现在,距离图灵以这种方式重新阐述这个问题又过去了 74 年,加州大学圣地亚哥分校的研究人员相信他们已经找到了答案。根据一项新的研究,他们让人类参与者与各种人工智能系统中的一个或另一个人交谈五分钟,现在的答案是暂定的“是的”。 ”
这篇尚未发表的预印本论文证实:“我们实验的参与者在五分钟的对话后没有比机会识别出 GPT-4,这表明当前的人工智能系统能够欺骗人们相信他们是人类。”已审查。 “这里的结果可能为在更自然的环境中欺骗的可能性设定了一个下限,与实验环境不同,人们可能不会对欺骗的可能性保持警惕,或者只专注于检测它。 ”
现在,虽然这无疑是一个引人注目的里程碑,但它绝不是一个普遍接受的里程碑。研究人员解释说:“图灵最初将模仿游戏视为智力的衡量标准,但人们对这一想法提出了各种反对意见。 ” 例如,众所周知,人类擅长将任何事物拟人化 – 我们想要对事物产生同理心,无论他们是另一个人、一只狗,还是一个长着一双瞪大眼睛的 Roomba卡在顶部。
最重要的是,值得注意的是,ChatGPT-4 和同样经过测试的 ChatGPT-3.5 仅在大约 50% 的时间内让人类参与者相信其人格,并不比随机机会好多少。那么我们怎么知道这个结果有什么意义呢?
嗯,团队在实验设计中内置的一项故障保护措施是将 ELIZA 纳入人工智能系统之一。她是最早的此类项目之一,于 20 世纪 60 年代中期在麻省理工学院创建,虽然她在当时无疑令人印象深刻,但可以公平地说,她对现代大语言模型或 LLM 的了解并不多。系统。
“ELIZA 仅限于预设回复,这极大地限制了它的功能。它可能会愚弄某人五分钟,但很快局限性就会变得明显,”电气和电子工程师协会 (IEEE) 的人工智能研究员 Nell Watson 告诉 Live Science。“语言模型非常灵活,能够综合响应涉及广泛的主题,使用特定的语言或社会方言,并以性格驱动的个性和价值观来描绘自己,无论多么巧妙和仔细,这都是人类手工编程的巨大进步”。
换句话说,她非常适合作为实验的基准。您如何解释那些懒惰的测试对象只是在“人类”或“机器”之间随机选择的情况?好吧,如果 ELIZA 的得分与随机概率一样高,那么人们可能不会认真对待这个实验——她只是没那么好。你怎么知道有多少影响是人类将他们与之互动的任何东西拟人化的?那么,他们对 ELIZA 的说服力有多大呢?大概就这么多了。
事实上,ELIZA 的得分为 22%,仅让不到五分之一的人相信她是人类。研究人员写道,这证实了 ChatGPT 确实已经通过了图灵测试,因为测试对象显然能够可靠地区分某些计算机和人类,但 ChatGPT 无法区分。
那么,这是否意味着我们正在进入类人人工智能的新阶段?计算机现在和我们一样聪明吗?也许吧——但我们或许不应该太仓促地发表声明。
研究人员解释说:“最终,图灵测试似乎不太可能为智力提供必要或充分的证据,但最多只能提供概率支持。”事实上,参与者甚至不依赖于你可能认为的“智力”标志:他们“更关注语言风格和社会情感因素,而不是知识和推理等更传统的智力概念”,论文报告说,这“可能反映出审讯者的潜在假设,即社会智能已经成为机器最无法模仿的人类特征。” ”
这就提出了一个令人担忧的问题:更大的问题不是机器的崛起,而是人类的衰落?
“虽然真实的人类实际上更成功,三分之二的时间让审讯者相信他们是人类,但我们的结果表明,在现实世界中,人们可能无法可靠地判断他们是在与人类还是人工智能系统交谈”该论文的合著者卡梅伦·琼斯 (Cameron Jones) 告诉 Tech Xplore。
“事实上,在现实世界中,人们可能不太意识到他们正在与人工智能系统交谈的可能性,因此欺骗率可能会更高,”他警告说。 “我认为这可能会对人工智能系统的用途产生影响,无论是自动化面向客户的工作,还是用于欺诈或错误信息。 ”
该研究尚未经过同行评审,已作为预印本发布到 arXiv。
猜你还喜欢
- 02-18 [驾车常识] 这3种违章务必15天内处理,否则或面临罚金翻倍?这是真的吗?
- 02-18 [驾车常识] 等红灯时前车出毛病不动了,后车实线变道被记3分?交警会如何判罚你知道吗?
- 02-18 [驾车常识] 高速上这些“新路标”80%的车主看不懂,你是其中的25%的人吗?
- 02-18 [涨姿势] 开车被追尾,若对方全责,记得多说这3句话,或能多拿到几笔赔偿 ,知道了吗?
- 02-18 [驾车常识] 两车同时并线,发生事故到底谁负责?看完就懂了
- 12-14 [涨姿势] 古埃及神庙发现的可能是克利奥帕特拉七世的半身像
- 12-14 [涨姿势] 谷歌的新型量子芯片解决了最好的超级计算机需要宇宙年龄四万亿倍才能破解的问题
- 12-14 [涨姿势] 新研究揭示了古代“天空圆盘”是如何制造的,粉碎了它是赝品的说法
- 12-14 [涨姿势] 器官芯片显示,眼镜蛇毒液通过血管塌陷而致人死亡
- 12-14 [涨姿势] 2000年前的岩石艺术,包括近140英尺长的蛇,可能标志着哥伦比亚和委内瑞拉的古代领土
- 12-14 [涨姿势] 嵌入人类基因组中的“化石病毒”与精神疾病有关
- 12-14 [涨姿势] 美国最新一例人类 H5N1 禽流感病例是第一个引起呼吸道症状的病例
取消回复欢迎 你 发表评论:
- 精品推荐!
-
- 最新文章
- 热门文章
- 热评文章
[影视] 黑道中人 Alto Knights(2025)剧情 犯罪 历史 电影
[古装剧] [七侠五义][全75集][WEB-MP4/76G][国语无字][1080P][焦恩俊经典]
[实用软件] 虚拟手机号 电话 验证码 注册
[电视剧] 安眠书店/你 第五季 You Season 5 (2025) 【全10集】
[电视剧] 棋士(2025) 4K 1080P【全22集】悬疑 犯罪 王宝强 陈明昊
[软件合集] 25年6月5日 精选软件22个
[软件合集] 25年6月4日 精选软件36个
[短剧] 2025年06月04日 精选+付费短剧推荐33部
[短剧] 2025年06月03日 精选+付费短剧推荐25部
[软件合集] 25年6月3日 精选软件44个
[剧集] [央视][笑傲江湖][2001][DVD-RMVB][高清][40集全]李亚鹏、许晴、苗乙乙
[电视剧] 欢乐颂.5部全 (2016-2024)
[电视剧] [突围] [45集全] [WEB-MP4/每集1.5GB] [国语/内嵌中文字幕] [4K-2160P] [无水印]
[影视] 【稀有资源】香港老片 艺坛照妖镜之96应召名册 (1996)
[剧集] 神经风云(2023)(完结).4K
[剧集] [BT] [TVB] [黑夜彩虹(2003)] [全21集] [粤语中字] [TV-RMVB]
[实用软件] 虚拟手机号 电话 验证码 注册
[资源] B站充电视频合集,包含多位重量级up主,全是大佬真金白银买来的~【99GB】
[影视] 内地绝版高清录像带 [mpg]
[书籍] 古今奇书禁书三教九流资料大合集 猎奇必备珍藏资源PDF版 1.14G
[电视剧] [突围] [45集全] [WEB-MP4/每集1.5GB] [国语/内嵌中文字幕] [4K-2160P] [无水印]
[剧集] [央视][笑傲江湖][2001][DVD-RMVB][高清][40集全]李亚鹏、许晴、苗乙乙
[电影] 美国队长4 4K原盘REMUX 杜比视界 内封简繁英双语字幕 49G
[电影] 死神来了(1-6)大合集!
[软件合集] 25年05月13日 精选软件16个
[精品软件] 25年05月15日 精选软件18个
[绝版资源] 南与北 第1-2季 合集 North and South (1985) /美国/豆瓣: 8.8[1080P][中文字幕]
[软件] 25年05月14日 精选软件57个
[短剧] 2025年05月14日 精选+付费短剧推荐39部
[短剧] 2025年05月15日 精选+付费短剧推荐36部
- 最新评论
-
- 热门tag