以太坊聯合創始人 Vitalik Buterin 表示,OpenAI 的生成人工智能 (AI) 模型 GPT-4 已通過圖靈測試。

圖靈測試是人工智能系統的一個模糊基準,旨在確定對話模型與人類的相似程度。該術語是由著名數學家艾倫·圖靈於 1950 年提出的。

根據圖靈當時的說法,一個能夠生成文本,讓人類誤以爲他們正在與另一個人交談的人工智能系統將展示“思考”的能力。

近 75 年後,這位被廣泛認爲構想出世界第二大加密貨幣的人將加州大學聖地亞哥分校最近的預印本研究解讀爲圖靈測試終於被生產模型“通過”。

來源:Farcaster 上的 @Vitalik.eth。

加州大學聖地亞哥分校的研究人員近日發表了一篇預印本論文,題爲《圖靈測試中人們無法區分 GPT-4 與人類》,其中他們讓大約 500 名人類測試對象在盲測中與人類和 AI 模型進行互動,以確定測試對象是否能夠分辨出哪個是哪個。

根據研究,人類誤認爲 GPT-4 是“人類”的概率爲 56%。這意味着機器經常會欺騙人類,讓人類以爲它是自己中的一員。

Vitalik Buterin 的看法

根據布特林的說法,一個人工智能系統如果能夠欺騙一半以上與之互動的人類,那麼它就有資格通過圖靈測試。

根據 Farcaster 上的一篇文章,討論了最近的預印本研究:

“這意味着人們辨別是人類還是機器人的能力基本上就像拋硬幣一樣!”

布特林在後續的括號中對他的聲明進行了限定,“好吧,不完全是,因爲人類被猜成人類的概率爲 66%,而機器人被猜成人類的概率爲 54%,但 12% 的差異很小;在任何現實世界環境中,這基本上都算是通過了。”

後來,在迴應對他的原班人馬的評論時,他還補充道,圖靈測試是“迄今爲止社會公認的‘人工智能現在是一件嚴肅的事情’最著名的里程碑。因此,我們應該提醒自己,這個里程碑現在已經被跨越了。”

圖靈測試

儘管這兩個術語經常被混爲一談,但通用人工智能 (AGI) 和圖靈測試並不一定相關。圖靈根據自己的數學敏銳度制定了測試,並預測了這樣一種情況:人工智能可以通過對話欺騙人類,使人類認爲它是他們中的一員。

值得一提的是,圖靈測試是一種曇花一現的構想,沒有真正的基準或技術基礎。對於機器是否能夠像生物體一樣“思考”,或者如何衡量這一能力,科學界尚未達成共識。簡而言之,目前科學界或工程界無法衡量或定義通用人工智能或人工智能的“思考”能力。

早在基於代幣的人工智能系統和生成對抗網絡(GAN,當今生成式人工智能系統的前身)出現之前,圖靈就做出了他的概念性預測。

通用人工智能

讓問題更加複雜的是人工智能(AGI)的概念,它通常與圖靈測試有關。在科學術語中,“通用智能”是指能夠完成任何基於智能的壯舉的智能。這排除了人類,因爲沒有人在人類智力探索的整個範圍內表現出“通用”能力。因此,“通用人工智能”的思維能力將遠遠超過任何已知人類。

話雖如此,GPT-4 顯然不符合嚴格科學意義上的真正“通用智能”。然而,這並沒有阻止人工智能社區的居民改變目標,使用“AGI”一詞來表示任何能夠欺騙大量人類的人工智能系統。

在當前文化中,“AGI”、“類人”和“通過圖靈測試”等術語和短語通常是指任何輸出與人類生成的內容相當的人工智能系統。

相關:微軟高管:‘我們只是觸及了加密和人工智能的表面’