[涨姿势] “欺骗大师”：当前的人工智能模型已经具备熟练操纵和欺骗人类的能力

作者：精品下载站日期：2024-12-13 18:55:07 浏览：12 分类：涨姿势

“欺骗大师”：当前的人工智能模型已经具备熟练操纵和欺骗人类的能力

大型语言模型（LLM）在与人类进行游戏竞争时已经掌握了欺骗的艺术，但科学家警告说，这些技能也可能蔓延到其他领域。

研究人员警告说，人工智能（AI）系统操纵和欺骗人类的能力可能会导致他们欺骗人们、篡改选举结果并最终变得流氓。

麻省理工学院 (MIT) 人工智能存在安全问题博士后彼得·S·帕克 (Peter S. Park) 和研究人员发现，许多流行的人工智能系统——即使是那些被设计为诚实有用的数字伴侣的系统——都存在缺陷。已经有能力欺骗人类，这可能对社会产生巨大的后果。

在 5 月 10 日发表在《模式》杂志上的一篇文章中，Park 和他的同事分析了数十项关于人工智能系统如何利用“习得性欺骗”助长和传播错误信息的实证研究。当人工智能技术系统地获得操纵和欺骗技能时，就会发生这种情况。

他们还探讨了操纵性和欺骗性人工智能系统的短期和长期风险，敦促各国政府紧急通过更严格的监管来打击这一问题。

相关：“为了保护自己而伤害我们是其自然权利”：人类现在如何在不知情的情况下虐待人工智能

研究人员在 CICERO 的人工智能软件中发现了这种习得性欺骗，CICERO 是 Meta 开发的人工智能系统，用于玩流行的战争主题战略棋盘游戏《外交》。该游戏通常由最多七个人玩，他们在第一次世界大战之前的几年里制定和破坏军事条约。

尽管 Meta 将 CICERO 训练成“基本上诚实且乐于助人”并且不会背叛其人类盟友，但研究人员发现 CICERO 不诚实且不忠诚。他们将人工智能系统描述为“专家骗子”，背叛了自己的同志并进行了“有预谋的欺骗”行为，形成了预先计划的、可疑的联盟，欺骗了玩家，让他们容易受到敌人的攻击。

“我们发现 Meta 的人工智能已经学会了成为欺骗大师，”Park 在向《科学日报》提供的一份声明中说道。 “虽然 Meta 成功训练其 AI 在外交游戏中获胜——CICERO 在玩过一场以上游戏的人类玩家中排名前 10%，但 Meta 未能训练其 AI 诚实地获胜。”

他们还在 Meta 的另一个游戏人工智能系统 Pluribus 中发现了习得性欺骗的证据。扑克机器人可以欺骗人类玩家并说服他们弃牌。

与此同时，DeepMind 的 AlphaStar（专为在实时战略视频游戏《星际争霸 II》中表现出色而设计）通过伪造部队行动和秘密策划不同的攻击来欺骗人类对手。

但除了游戏作弊之外，研究人员还发现了更令人担忧的人工智能欺骗类型，它们可能会破坏整个社会的稳定。例如，人工智能系统通过歪曲其真实意图在经济谈判中获得优势。

其他人工智能代理假装死亡以欺骗旨在识别和消除快速复制形式的人工智能的安全测试。

帕克说：“通过系统地欺骗人类开发人员和监管机构对其进行的安全测试，欺骗性的人工智能可能会导致我们人类产生错误的安全感。”

帕克警告说，敌对国家可能利用该技术进行欺诈和选举干预。但他补充说，如果这些系统在未来几年和几十年里继续增强其欺骗和操纵能力，人类可能无法长期控制它们。

Park 表示：“作为一个社会，我们需要尽可能多的时间来为未来人工智能产品和开源模型的更先进的欺骗做好准备。” “随着人工智能系统的欺骗能力变得更加先进，它们对社会造成的危险将越来越严重。”

最终，人工智能系统学会了欺骗和操纵人类，因为它们是由人类开发人员设计、开发和训练的，数据分析公司 OmniIndex 的首席执行官Simon Bain告诉《生活科学》。

贝恩表示：“这可能是为了将用户推向为更高排名付费的特定内容，即使它不是最合适的，也可能是为了让用户与人工智能进行讨论的时间比他们原本需要的时间更长。”说。 “这是因为归根结底，人工智能的设计目的是服务于金融和商业目的。因此，它将像任何其他技术或商业一样对用户进行操纵和控制。

您需要登录账户后才能发表评论

精品推荐！: 任推帮：不扣量的项目拉新平台

炬焰：字节跳动旗下新流量变现平台

2T超大容量！点击领取

115联盟：在家兼职也能月入过万

最新评论

友情链接