據報道,在經歷了幾次與安全和微調相關的延遲之後,OpenAI 備受期待的 ChatGPT「高級語音模式」(AVM)現已在 alpha 版中向部分用戶開放。

AVM 功能早在 5 月就已發佈並進行了演示。它允許用戶透過技術到語音合成模組與 ChatGPT 人工智慧模型進行即時對話。

還記得雙工嗎?

熟悉這個概念的人可能還記得Google 2018 年宣佈其「Duplex」人工智慧服務將「很快」推出。在 IO 開發者活動上,該公司展示了一個人工智慧系統,該系統能夠代表您致電企業,與人類即時安排約會。

谷歌表示,其主要想法是讓人工智能足夠強大,能夠處理隨意對話並確認正確的信息。

Duplex 項目最終被關閉,但它的遺產顯然在 OpenAI 的 ChatGPT 中繼續存在。

高級語音模式

AVM 具有實時通信功能,試圖模仿人與人之間的對話。ChatGPT 以具有自然節奏的類似人類的聲音響應用戶查詢。用戶可以在聊天機器人說話時打斷它,根據演示,它可以跟蹤所說的內容。

該公司正在推出有限的 alpha 版功能,以繼續評估其功能和安全影響。雖然 5 月份的演示令人印象深刻,但也出現了一些小問題,不難想象這項技術可能會被濫用的情況。

OpenAI 表示,安全一直是公司最關心的問題。在 X 上宣佈推出該功能的帖子中,該公司寫道:

“我們與 100 多名外部紅隊成員一起測試了 GPT-4o 的語音功能,測試語言涵蓋 45 種。爲了保護人們的隱私,我們訓練模型只用四種預設的聲音說話,並構建了系統來屏蔽與這些聲音不同的輸出。我們還實施了防護措施來屏蔽對暴力或受版權保護內容的請求。”

OpenAI 表示,AVM 的定時推出已經開始,並將“滾動”添加更多用戶。該公司預計該功能將於秋季向所有 Plus 用戶開放。

相關:OpenAI 暫停被指模仿斯嘉麗·約翰遜的 ChatGPT 語音