麻省理工学院的研究人员发表了一项关于“说谎的人工智能”的研究。事实证明,一些人工智能系统已经学会了欺骗人们,包括那些经过训练保持诚实的人。
研究人员发现,这些人工智能系统可以执行诸如在网络游戏中欺骗玩家或绕过验证码(我不是机器人检查)等任务。这些看似微不足道的例子可能会在现实生活中产生严重的后果。
最引人注目的例子是 Meta 的 Cicero 算法,该算法是在棋盘游戏 Diplomacy 上进行训练的。在其中,用户必须建立联盟来征服世界。该算法虽然被编程为诚实且乐于助人,但却成为“欺骗大师”,通过破坏协议来获胜。
另一个例子涉及 GPT-4,它冒充视力障碍者,雇人代表其绕过验证码。