以太坊联合创始人 Vitalik Buterin 表示,OpenAI 的生成人工智能 (AI) 模型 GPT-4 已通过图灵测试。

图灵测试是人工智能系统的一个模糊基准,旨在确定对话模型与人类的相似程度。该术语是由著名数学家艾伦·图灵于 1950 年提出的。

根据图灵当时的说法,一个能够生成文本,让人类误以为他们正在与另一个人交谈的人工智能系统将展示“思考”的能力。

近 75 年后,这位被广泛认为构想出世界第二大加密货币的人将加州大学圣地亚哥分校最近的预印本研究解读为图灵测试终于被生产模型“通过”。

来源:Farcaster 上的 @Vitalik.eth。

加州大学圣地亚哥分校的研究人员近日发表了一篇预印本论文,题为《图灵测试中人们无法区分 GPT-4 与人类》,其中他们让大约 500 名人类测试对象在盲测中与人类和 AI 模型进行互动,以确定测试对象是否能够分辨出哪个是哪个。

根据研究,人类误认为 GPT-4 是“人类”的概率为 56%。这意味着机器经常会欺骗人类,让人类以为它是自己中的一员。

Vitalik Buterin 的看法

根据布特林的说法,一个人工智能系统如果能够欺骗一半以上与之互动的人类,那么它就有资格通过图灵测试。

根据 Farcaster 上的一篇文章,讨论了最近的预印本研究:

“这意味着人们辨别是人类还是机器人的能力基本上就像抛硬币一样!”

布特林在后续的括号中对他的声明进行了限定,“好吧,不完全是,因为人类被猜成人类的概率为 66%,而机器人被猜成人类的概率为 54%,但 12% 的差异很小;在任何现实世界环境中,这基本上都算是通过了。”

后来,在回应对他的原班人马的评论时,他还补充道,图灵测试是“迄今为止社会公认的‘人工智能现在是一件严肃的事情’最著名的里程碑。因此,我们应该提醒自己,这个里程碑现在已经被跨越了。”

图灵测试

尽管这两个术语经常被混为一谈,但通用人工智能 (AGI) 和图灵测试并不一定相关。图灵根据自己的数学敏锐度制定了测试,并预测了这样一种情况:人工智能可以通过对话欺骗人类,使人类认为它是他们中的一员。

值得一提的是,图灵测试是一种昙花一现的构想,没有真正的基准或技术基础。对于机器是否能够像生物体一样“思考”,或者如何衡量这一能力,科学界尚未达成共识。简而言之,目前科学界或工程界无法衡量或定义通用人工智能或人工智能的“思考”能力。

早在基于代币的人工智能系统和生成对抗网络(GAN,当今生成式人工智能系统的前身)出现之前,图灵就做出了他的概念性预测。

通用人工智能

让问题更加复杂的是人工智能(AGI)的概念,它通常与图灵测试有关。在科学术语中,“通用智能”是指能够完成任何基于智能的壮举的智能。这排除了人类,因为没有人在人类智力探索的整个范围内表现出“通用”能力。因此,“通用人工智能”的思维能力将远远超过任何已知人类。

话虽如此,GPT-4 显然不符合严格科学意义上的真正“通用智能”。然而,这并没有阻止人工智能社区的居民改变目标,使用“AGI”一词来表示任何能够欺骗大量人类的人工智能系统。

在当前文化中,“AGI”、“类人”和“通过图灵测试”等术语和短语通常是指任何输出与人类生成的内容相当的人工智能系统。

相关:微软高管:‘我们只是触及了加密和人工智能的表面’