2024 年 6 月 21 日,《連線》雜誌全球編輯總監凱蒂·德拉蒙德 (Katie Drummond) 參加了 CNBC 的“Squawk Box”,討論該雜誌最近對人工智能搜索初創公司 Perplexity 的深入調查。對話揭示了 Perplexity 運營中一些令人不安的方面,並提出了有關人工智能的未來及其對新聞業和信息準確性的影響的重要問題。

困惑的興起

Perplexity 迅速引起了科技界的關注,獲得了傑夫·貝佐斯等知名人士的大量投資,估值接近 10 億美元。然而,這種迅速崛起也帶來了不少爭議和質疑。Wired 的調查旨在剖析 Perplexity 的實際功能、運作方式以及搜索結果的有效性。

調查結果:機制不明確、反應不準確

德拉蒙德強調,《連線》調查的主要發現之一是 Perplexity 營運機制的模糊性。德拉蒙德聲稱,這家將自己定位為複雜搜尋工具的人工智慧新創公司經常提供的回應不僅不準確,而且可能具有誤導性。她說,用戶報告說收到的答案似乎缺乏邏輯綜合,嚴重依賴網路數據的基本聚合,而沒有進行更深入的分析或理解。

道德與法律問題:抓取和資料收集

調查的很大一部分集中在 Perplexity 如何收集數據。德拉蒙德解釋說,Perplexity 被發現在未經適當授權的情況下從《連線》母公司康泰納仕集團和其他出版商那裡竊取內容。儘管實施了 robots.txt 協定(一種用於防止機器人存取網站某些部分的標準),但 Perplexity 據稱使用未公開的 IP 位址來繞過這些限制。如果這是真的,就會引發人們對人工智慧公司應如何與新聞內容互動以及資料使用邊界的嚴重道德和法律擔憂。

人工智慧響應的偏見和質量

討論也涉及了 Perplexity 等人工智慧工具所提供的固有偏見和資訊品質。討論強調了「垃圾進,垃圾出」的問題。這個概念強調人工智慧輸出的好壞取決於它們接收到的輸入的好壞。 Perplexity 依賴易於存取的網路數據,而這些數據通常可能存在偏見或不準確,這意味著它的回應可以反映這些相同的問題。

德拉蒙德認為,目前獲得準確資訊的最佳方式是直接尋找來源——從信譽良好的媒體閱讀新聞報道,而不是依賴人工智慧聚合。這凸顯了人工智慧產業的一個根本挑戰:開發能夠識別高品質、準確資訊並優先處理大量不可靠的線上資訊來源的系統。

科技與新聞業之間的脫節

對話也深入探討了人工智慧對新聞業的更廣泛影響。德拉蒙德指出,科技業常常脫離支撐新聞和新聞業的價值觀和原則。她表示,在開發最先進、最有價值的人工智慧工具的競賽中,準確且符合道德的資訊傳播有時會造成附帶損害。

根據《Fast Company》馬克·沙利文的一篇文章稱,針對《連線》的指控,Perplexity 聯合創始人兼首席執行官Aravind Srinivas 表示,Perplexity 不僅依賴自己的網絡爬蟲,還使用第三方服務進行網絡爬蟲和索引。斯里尼瓦斯指出,《連線》所識別的網路爬蟲並非由 Perplexity 所有,而是由於保密協議而由未具名的第三方提供者擁有。

斯里尼瓦斯承認立即阻止第三方爬蟲訪問《連線》內容的複雜性,並表示:“這很複雜。”他也強調,1994 年制定的機器人排除協議並不是一個具有法律約束力的框架,並表示人工智慧的興起需要內容創作者和 Perplexity 等平台之間採取新形式的合作。

當《連線》雜誌證明 Perplexity 的答案引擎可以精確地解釋他們的文章(有時甚至不準確)時,進一步的批評出現了。一個值得注意的錯誤包括關於一名加州警察犯罪的虛假陳述。斯里尼瓦斯認為,這樣的結果很可能是由旨在引發此類反應的提示引起的,並強調普通用戶不會遇到這些問題。他承認該系統不能避免錯誤。

精選圖片來自Pixabay