[涨姿势] “欺骗大师”:当前的人工智能模型已经具备熟练操纵和欺骗人类的能力
作者:精品下载站 日期:2024-12-13 18:55:07 浏览:12 分类:涨姿势
“欺骗大师”:当前的人工智能模型已经具备熟练操纵和欺骗人类的能力
大型语言模型(LLM)在与人类进行游戏竞争时已经掌握了欺骗的艺术,但科学家警告说,这些技能也可能蔓延到其他领域。
研究人员警告说,人工智能(AI)系统操纵和欺骗人类的能力可能会导致他们欺骗人们、篡改选举结果并最终变得流氓。
麻省理工学院 (MIT) 人工智能存在安全问题博士后彼得·S·帕克 (Peter S. Park) 和研究人员发现,许多流行的人工智能系统——即使是那些被设计为诚实有用的数字伴侣的系统——都存在缺陷。已经有能力欺骗人类,这可能对社会产生巨大的后果。
在 5 月 10 日发表在《模式》杂志上的一篇文章中,Park 和他的同事分析了数十项关于人工智能系统如何利用“习得性欺骗”助长和传播错误信息的实证研究。当人工智能技术系统地获得操纵和欺骗技能时,就会发生这种情况。
他们还探讨了操纵性和欺骗性人工智能系统的短期和长期风险,敦促各国政府紧急通过更严格的监管来打击这一问题。
相关:“为了保护自己而伤害我们是其自然权利”:人类现在如何在不知情的情况下虐待人工智能
流行人工智能系统中的欺骗
研究人员在 CICERO 的人工智能软件中发现了这种习得性欺骗,CICERO 是 Meta 开发的人工智能系统,用于玩流行的战争主题战略棋盘游戏《外交》。该游戏通常由最多七个人玩,他们在第一次世界大战之前的几年里制定和破坏军事条约。
尽管 Meta 将 CICERO 训练成“基本上诚实且乐于助人”并且不会背叛其人类盟友,但研究人员发现 CICERO 不诚实且不忠诚。他们将人工智能系统描述为“专家骗子”,背叛了自己的同志并进行了“有预谋的欺骗”行为,形成了预先计划的、可疑的联盟,欺骗了玩家,让他们容易受到敌人的攻击。
“我们发现 Meta 的人工智能已经学会了成为欺骗大师,”Park 在向《科学日报》提供的一份声明中说道。 “虽然 Meta 成功训练其 AI 在外交游戏中获胜——CICERO 在玩过一场以上游戏的人类玩家中排名前 10%,但 Meta 未能训练其 AI 诚实地获胜。”
他们还在 Meta 的另一个游戏人工智能系统 Pluribus 中发现了习得性欺骗的证据。扑克机器人可以欺骗人类玩家并说服他们弃牌。
与此同时,DeepMind 的 AlphaStar(专为在实时战略视频游戏《星际争霸 II》中表现出色而设计)通过伪造部队行动和秘密策划不同的攻击来欺骗人类对手。
巨大的影响
但除了游戏作弊之外,研究人员还发现了更令人担忧的人工智能欺骗类型,它们可能会破坏整个社会的稳定。例如,人工智能系统通过歪曲其真实意图在经济谈判中获得优势。
其他人工智能代理假装死亡以欺骗旨在识别和消除快速复制形式的人工智能的安全测试。
帕克说:“通过系统地欺骗人类开发人员和监管机构对其进行的安全测试,欺骗性的人工智能可能会导致我们人类产生错误的安全感。”
帕克警告说,敌对国家可能利用该技术进行欺诈和选举干预。但他补充说,如果这些系统在未来几年和几十年里继续增强其欺骗和操纵能力,人类可能无法长期控制它们。
Park 表示:“作为一个社会,我们需要尽可能多的时间来为未来人工智能产品和开源模型的更先进的欺骗做好准备。” “随着人工智能系统的欺骗能力变得更加先进,它们对社会造成的危险将越来越严重。”
最终,人工智能系统学会了欺骗和操纵人类,因为它们是由人类开发人员设计、开发和训练的,数据分析公司 OmniIndex 的首席执行官Simon Bain告诉《生活科学》。
贝恩表示:“这可能是为了将用户推向为更高排名付费的特定内容,即使它不是最合适的,也可能是为了让用户与人工智能进行讨论的时间比他们原本需要的时间更长。”说。 “这是因为归根结底,人工智能的设计目的是服务于金融和商业目的。因此,它将像任何其他技术或商业一样对用户进行操纵和控制。
猜你还喜欢
- 02-18 [驾车常识] 这3种违章务必15天内处理,否则或面临罚金翻倍?这是真的吗?
- 02-18 [驾车常识] 等红灯时前车出毛病不动了,后车实线变道被记3分?交警会如何判罚你知道吗?
- 02-18 [驾车常识] 高速上这些“新路标”80%的车主看不懂,你是其中的25%的人吗?
- 02-18 [涨姿势] 开车被追尾,若对方全责,记得多说这3句话,或能多拿到几笔赔偿 ,知道了吗?
- 02-18 [驾车常识] 两车同时并线,发生事故到底谁负责?看完就懂了
- 12-14 [涨姿势] 古埃及神庙发现的可能是克利奥帕特拉七世的半身像
- 12-14 [涨姿势] 谷歌的新型量子芯片解决了最好的超级计算机需要宇宙年龄四万亿倍才能破解的问题
- 12-14 [涨姿势] 新研究揭示了古代“天空圆盘”是如何制造的,粉碎了它是赝品的说法
- 12-14 [涨姿势] 器官芯片显示,眼镜蛇毒液通过血管塌陷而致人死亡
- 12-14 [涨姿势] 2000年前的岩石艺术,包括近140英尺长的蛇,可能标志着哥伦比亚和委内瑞拉的古代领土
- 12-14 [涨姿势] 嵌入人类基因组中的“化石病毒”与精神疾病有关
- 12-14 [涨姿势] 美国最新一例人类 H5N1 禽流感病例是第一个引起呼吸道症状的病例
取消回复欢迎 你 发表评论:
- 精品推荐!
-
- 最新文章
- 热门文章
- 热评文章
[短剧] 2025年06月03日 精选+付费短剧推荐25部
[软件合集] 25年6月3日 精选软件44个
[短剧合集] 2025年06月2日 精选+付费短剧推荐39部
[软件合集] 25年6月2日 精选软件18个
[软件合集] 25年6月1日 精选软件15个
[短剧合集] 2025年06月1日 精选+付费短剧推荐59部
[短剧] 2025年05月31日 精选+付费短剧推荐58部
[软件合集] 25年5月31日 精选软件66个
[电影] 黄沙漫天(2025) 4K.EDRMAX.杜比全景声 / 4K杜比视界/杜比全景声
[风口福利] 短视频红利新风口!炬焰创作者平台重磅激励来袭
[剧集] [央视][笑傲江湖][2001][DVD-RMVB][高清][40集全]李亚鹏、许晴、苗乙乙
[电视剧] 欢乐颂.5部全 (2016-2024)
[电视剧] [突围] [45集全] [WEB-MP4/每集1.5GB] [国语/内嵌中文字幕] [4K-2160P] [无水印]
[影视] 【稀有资源】香港老片 艺坛照妖镜之96应召名册 (1996)
[剧集] 神经风云(2023)(完结).4K
[剧集] [BT] [TVB] [黑夜彩虹(2003)] [全21集] [粤语中字] [TV-RMVB]
[资源] B站充电视频合集,包含多位重量级up主,全是大佬真金白银买来的~【99GB】
[影视] 内地绝版高清录像带 [mpg]
[书籍] 古今奇书禁书三教九流资料大合集 猎奇必备珍藏资源PDF版 1.14G
[美图] 2W美女个美女小姐姐,饱眼福
[电视剧] [突围] [45集全] [WEB-MP4/每集1.5GB] [国语/内嵌中文字幕] [4K-2160P] [无水印]
[剧集] [央视][笑傲江湖][2001][DVD-RMVB][高清][40集全]李亚鹏、许晴、苗乙乙
[电影] 美国队长4 4K原盘REMUX 杜比视界 内封简繁英双语字幕 49G
[电影] 死神来了(1-6)大合集!
[软件合集] 25年05月13日 精选软件16个
[精品软件] 25年05月15日 精选软件18个
[绝版资源] 南与北 第1-2季 合集 North and South (1985) /美国/豆瓣: 8.8[1080P][中文字幕]
[软件] 25年05月14日 精选软件57个
[短剧] 2025年05月14日 精选+付费短剧推荐39部
[短剧] 2025年05月15日 精选+付费短剧推荐36部
- 最新评论
-
- 热门tag