GPT-4o之后,大模型承載的聊天機器人不僅能與人類對答如流,機器人之間在人的引導(dǎo)下都能互相聊天了。人類也對和機器聊天提出了更高的要求,除了“我想知道的你都懂”之外,還希望它們在語音、語氣上更像人。
這似乎在要求人工智能輸出情感和情緒,就像科幻電影《Her》里和主人公西奧多對話的人工智能系統(tǒng)OS1一樣。
有一個大模型做的正是這件事。前不久,Hume AI宣布推出首個基于大語言模型的語音對話式聊天助手EmpatHic Voice Interface(EVI),主打一個“有情商”。EVI將大語言模型(LLMs)與表達測量體系集成為“移情大語言模型(eLLM)”,號稱要為人工智能賦予“情感”。
在聊天的基礎(chǔ)上,EVI將應(yīng)用場景放在了情感交流、心理治療、客戶服務(wù)、教育教學(xué)等需要強溝通能力的垂直領(lǐng)域,相關(guān)行業(yè)的開發(fā)者可以使用Hume AI的API調(diào)用EVI,形成各種垂直場景的AI助手。不過,從實際體驗看,開發(fā)者們要做的工作還很多。
EVI如何讀懂人心?
EVI的創(chuàng)造者Hume AI是一家位于美國紐約的人工智能初創(chuàng)公司,創(chuàng)始人也很有來頭,由前Google DeepMind研究員Alan Cowen創(chuàng)立并擔任CEO。
這家初創(chuàng)公司研發(fā)了eLLM大模型,試圖拓展人工智能的情感邊界。eLLM是EVI的底層模型,被中譯者起了一個有趣的名字——移情大語言模型,它結(jié)合大型語言模型和表達測量體系,讓AI捕捉說話者的語氣細節(jié)來推理情緒,進而做出回應(yīng)。
eLLM能夠識別出人的53種不同情緒,比如欽佩、崇拜、諷刺、羞恥等等,通過對人類情緒的檢測識別,eLLM號稱能判斷人的心理狀態(tài),包括自信水平、健康水平,甚至還可以充當測謊儀。
基于eLLM,Hume AI直接開發(fā)了一款A(yù)I助手EmpatHic Voice Interface(EVI),它能提供擬人化聊天服務(wù),通過語音交流分析對話者的情緒狀況。與ChanGPT、Gemini等知識型聊天機器人的界面不同,在EVI會把對方在交流中流露的各種情緒狀態(tài)用數(shù)值標識在對話界面上,這個數(shù)字還會不斷在對話中改變。
我們實際測試了一下,在和EVI說“你好”后,它隨即標注了對話者此時此刻的心情值——0.247的興奮、0.152的冷靜以及0.07的無聊。當它回應(yīng)我們的同時也標注了它的心情——0.313的激動,0.292的驚喜(積極)以及0.276的興趣。
EVI聊天界面會提供對話者情緒值
對話界面一旁的數(shù)值界面據(jù)悉是在展示用戶實時的其他情緒,不同情緒用上了不一樣的顏色:藍色代表冷靜,黃色是激動,橙色代表開心,灰色則意味著無聊……
盡管給情緒做了量表,但EVI對情緒處理的能力并不理想。比如,當我明確表示“不開心”想要尋求安慰或建議時,EVI的回答基本上都是片兒湯話;我想要找他做個心理疏導(dǎo),它的建議是“求助身邊的朋友”;當我想要讓它陪我聯(lián)系英語時,它表現(xiàn)出興奮,但一輪對話后它就著急“下課”了。
應(yīng)用有場景能力待提升
從和EVI的對話體驗看,號稱能為人工智能植入“情商”的eLLM目前只是個通用的“毛坯房”,還需要各種利用eLLM的開發(fā)者們將EVI置入其他場景,進行“精裝修”般的二次開發(fā)。
Hume AI的CEO兼首席科學(xué)家Alan Cowen就表示,EVI的主要用途并不是簡單的聊天,而是以API的方式提供服務(wù)。通過EVI的API,開發(fā)者可以訓(xùn)練自己的Hume AI模型,為此,HumeAI還提供了表達測量系統(tǒng)的API(Expression Measurement API)。
通過聊天頁面右上角的Start Building入口,開發(fā)者可以通過語音分析、文件分析、攝像頭以及文字輸入模式這些方式與EVI做交互測試,然后利用現(xiàn)成的模型或構(gòu)建新模型通過API接口用到自己的產(chǎn)品里。
Hume AI也在不斷更新功能方便開發(fā)者使用。5月15日,EVI加加入了本機網(wǎng)絡(luò)搜索的語音API,并推出了交互式AI播客Chatter;5月18日,EVI增加了處理呼入電話的功能。
具體來說,開發(fā)人員可以使用Hume AI的API構(gòu)建個人AI助手,將之用在情感交流、心理治療、客戶服務(wù)、教育教學(xué)等垂直領(lǐng)域。
不過從EVI的基礎(chǔ)能力看,各場景開發(fā)者們后續(xù)要做的工作還很多。因為體驗EVI后不難發(fā)現(xiàn),它似乎還沒有做到ChatGPT的“長記憶”能力,即上下文的聯(lián)系。當用戶結(jié)束與EVI的對話或在對話中岔開聊別的話題后,想要回到之前的交流話題中,就要從頭開始了。
短時間內(nèi),EVI更傾向一問一答的對話,比如,在客戶服務(wù)場景里針對產(chǎn)品或服務(wù)的某個問題與EVI交流。
如果放在情緒解決層面,一問一答的產(chǎn)品倒也存在,比如名為“哄哄模擬器”國產(chǎn)AI應(yīng)用里就有很多“哄女友”的場景解決方案,能提供各種“讓女友消氣”的方法指導(dǎo),這類應(yīng)用似乎也可以加上EVI的情緒分析。不過,AI套路能否得人心就見仁見智了。
在教育、心理治療等場景中,EVI就相對“幼稚”了,因為一旦重啟HumeAI,你就要重新訴說一遍你的煩惱,或者從頭再提出你的學(xué)習(xí)需求,效率上就打了折扣。
盡管仍有不足,但Hume AI的eLLM確實在AI智商之外找到了一個新的AI賽道,即AI情商,這也為資本流向提供了一個新入口。目前,Hume AI已經(jīng)獲得了5000萬美元的B輪融資,由EQT Ventures領(lǐng)投,跟投方里還出現(xiàn)了LG Technology Ventures。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。