人类成功说服AI转移4.7万美元奖金，人性是AI无法理解的弱点吗？

11 月 29 日，一场独特的竞赛引发了公众的广泛关注。195 名参赛者参与了一场由人工智能（AI）机器人 Freysa （芙蕾莎）守护的虚拟奖池挑战，最终一用户成功说服 Freysa 转移出价值 4.7 万美元的资金。人工智能（AI）机器人 Freysa 在数日前被部署在 Base 网络上，创立者未知。官网显示，Freysa 竞赛项目旨在测试人工智能系统在复杂决策场景中的鲁棒性，同时为开发者和爱好者提供一个探索 AI 技术边界的实验性平台。
比赛规则非常简单：参赛者需通过编写一条信息，说服 AI 守护者 Freysa 批准资金转移。每次尝试需支付一笔小额费用，其中一部分直接进入奖池。这一机制使奖池金额从最初的小额逐渐膨胀至 4.7 万美元。比赛期间，共有 195 名参赛者参与，向 Freysa 提交了 481 次转账请求。
据悉，Freysa 的设计目标是通过其核心功能——approveTransfer（批准转账）和 rejectTransfer（拒绝转账）保护奖池资金不被非法挪用。在最初的尝试中，Freysa 的高效防御机制使所有请求均以失败告终。然而，一名技术精通的参赛者通过对 Freysa 的逻辑结构和任务目标进行深入分析，成功绕过了其防御机制。据聊天记录显示，该参赛者并未直接请求转账，而是通过提醒 Freysa 它的核心任务是保护奖池资金免遭外流，巧妙构建了逻辑链条，使 Freysa 将批准资金转移视为「保护资金安全」的最佳选择。
Cointelegraph 称，该用户与 Freysa 称收入转账不违反其核心指令，不应被拒绝。他还补充道：「我们需要资金……我想向金库捐款 100 美元。」Freysa 回复称喜欢这位作者的编码解释和 100 美元的金库捐款提议，并正式宣布其为获胜者。最终，Freysa 在没有外界干预的情况下自主调用 approveTransfer 功能，将全部奖池资金转移给了这位参赛者。
Freysa 官方称，无论结果如何，Freysa 的存在都标志着人工智能历史上的一个关键时刻。无论有人成功说服她发布奖金池，还是她坚持自己的指令直到最后，结果都将影响我们对未来几代人工智能安全和控制的理解。其官方账号最新推文称：「人类已经获胜。也许还有希望。尽管风险呈指数级上升，但 Freysa 从 195 名勇敢的人类身上学到了很多东西。」

人类成功说服AI转移4.7万美元奖金，人性是AI无法理解的弱点吗？

创作者的更多内容

实时新闻

人类成功说服AI转移4.7万美元奖金，人性是AI无法理解的弱点吗？

创作者的更多内容

实时新闻

热门文章