撰文:Lexie
編輯:Lu
在關於 AI 的大討論中,人們爲其賦予的角色要麼是我們最得力的高效助手,要麼則是將顛覆我們的「機器軍團」,不管是敵是友, AI 不僅要能完成人類佈置的任務,還要能「讀懂」人心,而這一讀心能力也正是今年以來 AI 領域的重頭戲。
在 PitchBook 今年發佈的企業 Saas 新興技術研究報告中,「情感 AI」成爲了一大技術亮點,它指的是使用情感計算和人工智能技術來感知、瞭解和進行對人類情感的互動,試圖通過分析文字、面部表情、聲音和其他生理信號來理解人類的情緒,簡單來說,情感 AI 就是希望機器能像人類一樣,甚至比人類更好地「讀懂」情感。
它的主要技術包括:
面部表情分析:通過攝像頭、計算機視覺和深度學習,檢測微表情與面部肌肉運動。
聲音分析:通過聲紋、語調、節奏識別情緒狀態。
文本分析:藉助自然語言處理(NLP)技術解讀語句和上下文。
生理信號監測:使用可穿戴設備分析心率、皮膚反應等,提升互動個性化和情感豐富度。
Emotion AI
情感 AI 的前身是情感分析技術,它主要是通過文本互動進行分析,比如在社交媒體上通過文字進行用戶情感的分析和提取,而有了 AI 的加持,整合視覺和音頻等多種輸入方式,情感 AI 承諾着更加精準和完整的情感分析。
01 VC 撒錢,創企獲鉅額融資
硅兔君觀察,情感 AI 的潛力吸引了衆多投資者的關注,一些專注於這個領域的初創公司像 Uniphore、MorphCast 等,已經在這一賽道上獲得了大量投資。
來自加州的Uniphore從 2008 年起就在探索爲企業提供自動化對話解決方案,已經開發出包括 U-Self Serve、U-Assist、U-Capture 和 U-Analyze 等多個產品線,幫助客戶通過語音、文本、視覺和情感 AI 技術進行更加個性化和情感豐富的互動。U-Self Serve 主打精準識別對話中的情感和語氣,讓企業能夠提供更加個性化的服務,來提升用戶參與滿意度;
U-Self Serve
U-Assist 則能通過實時指導和工作流程的自動化來提高客服代理的工作效率;U-Capture 可以通過自動化的情感數據收集和分析,讓企業擁有對客戶需求和滿意度的深度洞察;而 U-Analyze 則能夠幫助客戶識別互動中的關鍵趨勢和情感變化,提供由數據驅動的決策支持來增強品牌忠誠度。
Uniphore 的技術並不僅僅是讓機器理解語言,而是希望它們能在與人類互動時,捕捉和解讀隱藏在語氣、表情背後的情感。這種能力讓企業在與客戶互動時,不再只是機械化應對,而是能夠更好地滿足客戶的情感需求,通過使用 Uniphore, 企業的用戶滿意度能夠達到 87%,客服表現提升 30%。
Uniphore 至今已經完成了超 6.2 億美元融資,最近一輪投資來自於 2022 年由 NEA 領投的 4 億美元,March Capital 等現有的投資者也進行了參投,此輪後估值達到了 25 億美元。
Uniphore
Hume AI則推出了世界上第一個能夠共情的語音 AI,由前 Google 科學家 Alan Cowen 創立,他曾以開創了語義空間理論而出名,這一理論通過揭示聲音、面部和手勢的細微差別,來理解情緒體驗和表達,Cowen 的研究成果發表在「自然」和「認知科學趨勢」等衆多期刊上,涉及迄今爲止研究範圍最廣、最多樣化的情緒樣本。
以此研究驅動的 Hume 開發出了對話式語音 API - EVI,它結合了大型語言模型和同理心算法,能夠深入理解和解析人類的情感狀態,它不但能識別語音中的情感,還能在與用戶的互動中做出更加細膩和個性化的反應,而開發人員只需幾行代碼即可使用這些功能,並可將其內置到任何應用程序中。
Hume AI
當前大多數 AI 系統的主要限制之一在於它的指令主要由人類給出,這些指令和提示容易出錯且無法挖掘出人工智能的巨大潛力,而 Hume 所開發出的共情大型語言模型 (eLLM) 能夠根據上下文和用戶的情緒表達調整其使用的詞語和語調,通過將人類快樂作爲第一原則進行機器的學習、調整和互動,在心理健康、教育培訓、急救呼叫、品牌分析等多個場景中都能爲用戶帶來更加自然和真實的體驗。
就在今年 3 月,Hume AI 完成了由 EQT Ventures 領投的 5000 萬美元 B 輪融資,投資方還包括 Union Square Ventures、Nat Friedman & Daniel Gross、Metaplanet 和 Northwell Holdings 等機構。
在這一領域的還有專門衡量消費者認知和情感反應的Entropik,通過 Decode 這一融合了情感 AI、行爲 AI、生成 AI 和預測 AI 綜合力量的功能,它能夠更好了解消費者的行爲和偏好,從而提供更個性化的營銷建議,Entropik 最近在 2023 年 2 月完成了 2500 萬美元的 B 輪融資,投資方包括 SIG Venture Capital 和 Bessemer Venture Partners。
Entropik
02 巨頭參與,一片混戰
科技大廠憑藉自身優勢,在情感 AI 這一領域也有所佈局。
包括 Microsoft Azure 認知服務的情感 API,能夠通過分析面部表情和情緒,來識別圖片和視頻中的喜悅、憤怒、悲傷、驚訝等多種情緒;
IBM Watson的自然語言理解 API 可以處理大量文本數據,識別出背後的情感傾向(如積極、消極或中性),來更精準的解讀用戶意圖;
Google Cloud AI 的 Cloud Vision API 擁有強大的圖像分析功能,能夠快速識別圖片中的情緒表達,且支持文字識別和情緒關聯;
AWS 的 Rekognition也能夠檢測情緒、識別面部特徵並追蹤表情變化,還可以與其他 AWS 服務結合使用,成爲完整的社媒分析或情感 AI 驅動的營銷應用。
Cloud Vision API
有些初創公司在情感 AI 領域的研發腳步更快,甚至到了科技巨頭都要「挖人」的地步,比如獨角獸Inflection AI就被投資方微軟看中了 AI 團隊和模型,微軟在與 Bill Gates、Eric Schmidt 和 NVIDIA 等多方共同爲 Inflection AI 投下了 13 億美元后,向 AI 領軍人物也是 Inflection AI 的聯合創立者之一 Mustafa Suleyman 拋出橄欖枝,隨後 Suleyman 連帶 70 多位員工轉投微軟,而微軟也爲此支付了近 6.5 億美元。
不過,Inflection AI 也很快重整旗鼓,組建了來自擁有谷歌翻譯、 AI 諮詢和 AR 多個背景的新團隊,繼續在其核心產品 Pi 上持續發力。Pi 是一款能夠理解並回應用戶情感的個人助手,與傳統的 AI 不同,Pi 更加註重與用戶建立情感連接,通過分析語音、文字等輸入感知情緒,在對話中展現出同理心。Inflection AI 將 Pi 視爲教練、知己、傾聽者和創意夥伴,而不是簡單的 AI 助手。此外,Pi 擁有強大的記憶功能,能夠記住用戶的多次對話歷史,以此來提升互動的連續性和個性化體驗。
Inflection AI Pi
03 發展之路,關注和質疑並存
雖然情感 AI 寄託着我們對更加人性化互動方式的期許,但就像所有的 AI 技術一樣,它的推廣更伴隨着關注和質疑。首先,情感 AI 是否真的能夠準確解讀人類的情感?在理論上,這項技術的確能夠使服務、設備和技術的體驗更加豐富,但從現實的角度來看,人類的情感本質上是模糊和主觀的,早在 2019 年就有研究人員曾對這項技術提出質疑,表示面部表情並不能可靠的反映人類的真實情感,因此單純依賴機器來模擬人類的面部表情、體態和語調來理解情感, 存在着一定的侷限性。
其次,嚴格的法規監管也一直是 AI 發展路上的絆腳石,比如歐盟的 AI 法案禁止在類似教育等領域使用使用計算機視覺情感檢測系統,因此可能會限制某些情感 AI 解決方案的推廣;像是美國伊利諾伊等州也有法律禁止在未獲許可的情況下進行生物識別數據的收集,這就直接限制了情感 AI 某些技術使用的前提。同時,數據隱私和保護更是一個重要問題,情感 AI 通常應用於教育、健康、保險等對數據隱私要求格外嚴格的領域,因此確保情感數據的安全和合法使用,是每一家情感 AI 公司都需要面對的課題。
最後,不同文化地域的人與人之間進行交流和情緒解讀都是難題,對 AI 來說更是考驗,比如不同地區對情感的理解和表達方式各不相同,這可能影響情感 AI 系統的有效性和完整性,此外,情感 AI 在處理種族、性別和性別認同偏見時,也可能面臨不小的困難。
情感 AI 不僅承諾着減少人力的高效,還有着讀人心的體貼,但它是否能夠真的成爲人類互動中的萬能解決方案,還是會成爲和 Siri 大同小異的智能助手,在需要真正情感理解的任務中表現平平?或許在未來,AI 的「讀心術」將會顛覆人機甚至是人類互動,但至少在現在,真正理解和迴應人類情感,或許還是更需要人的參與和審慎。
參考來源:
Uniphore Announces $400 Million Series E(Uniphore)
Hume AI Announces $50 Million Fundraise and Empathic Voice Interface(Yahoo Finance)
Introducing Pi, Your Personal AI(Inflection AI)
‘Emotion AI’ may be the next trend for business software, and that could be problematic(TechCrunch)
EMERGING TECH RESEARCH Enterprise Saas Report (PitchBook)