昔日火爆一時(shí)的AlphaGo和李世石的“人機(jī)大戰(zhàn)”,AI的場(chǎng)景應(yīng)用已經(jīng)讓無數(shù)人大開眼界。而在人工智能應(yīng)用領(lǐng)域,AI語音對(duì)話堪稱前沿技術(shù),并依托背后海量搜索數(shù)據(jù)得以應(yīng)用。在極客公園2016奇點(diǎn)·創(chuàng)新者峰會(huì)上,研究AI對(duì)話技術(shù)多年的360搜索技術(shù)總監(jiān)魏少俊,與大家分享最新的技術(shù)成果。
“什么是AI技術(shù)?它和搜索對(duì)話有何不同?”
AI 對(duì)話是一種人機(jī)交互方式,人和機(jī)器展開人和人之間這種自然的交流。人們平時(shí)使用的搜索實(shí)際上就是一種人機(jī)的交流,當(dāng)在搜索框輸入查詢?cè)~,搜索引擎會(huì)分析你輸入的語義,判斷意圖,判斷最匹配你需求的結(jié)果,并向你推薦精準(zhǔn)答案,這就完成了一段和搜索引擎的對(duì)話。
搜索對(duì)話與 AI 對(duì)話存在很多不同,在搜索場(chǎng)景下,用戶對(duì)話輸入實(shí)際上是通過在搜索框中輸入一句話,一次性解答。而在 AI 場(chǎng)景下,用戶輸入更加口頭語化,口頭語比書面語更復(fù)雜,所以它的處理難度會(huì)更大。同時(shí),由于口頭語的碎片化特點(diǎn),很多時(shí)候需求在第一時(shí)間提出時(shí),可能不一定一次性把意圖都表達(dá)完整。
“AI 對(duì)話的三種方式”
第一種叫功能型交互、也叫命令型交互,表現(xiàn)為用戶向機(jī)器下達(dá)指令,例如:“幫我把燈打開”,在這種情景下,通?陬^表達(dá)的能力是有限,不會(huì)有太多復(fù)雜的指令內(nèi)容,這個(gè)是相對(duì)來說最容易實(shí)現(xiàn)的方式。
第二種叫內(nèi)容型交互,也叫知識(shí)型交互,例如向機(jī)器人下達(dá)指令說“給我講一個(gè)《小紅帽》的故事”,或詢問“北京到上海距離多遠(yuǎn)”。這個(gè)里面需要有海量的網(wǎng)頁抓取技術(shù),網(wǎng)頁篩選技術(shù)等等支撐這樣的應(yīng)用。
第三是開放型交互,也叫閑聊,用戶表達(dá)在非常龐大的語言空間上,甚至有些問題沒有答案。比如說一個(gè)用戶告訴你我今天摔倒了,這個(gè)時(shí)候沒有答案的,機(jī)器需要分析用戶表達(dá)的情感,然后適當(dāng)給出安慰。
歸納下來,在 AI 對(duì)話里面,我們 AI 對(duì)話引擎需要具備哪些能力。第一個(gè)是對(duì)用戶口頭表達(dá)的理解能力,第二是需要強(qiáng)大的知識(shí)庫在此基礎(chǔ)上的應(yīng)答能力。
“AI 對(duì)話需要哪些技術(shù)?”
AI 對(duì)話要求需需要的技術(shù)模塊一共有 4 個(gè)部分,第一部分是語音識(shí)別。語音識(shí)別相對(duì)來說目前技術(shù)比較成熟;第二部分是語義識(shí)別;第三塊是云計(jì)算,AI 需要龐大的計(jì)算支持;第四是我們基于 360 搜索大數(shù)據(jù)的海量語料訓(xùn)練。
語義識(shí)別需要用到基于上下文的自然語言理解技術(shù)。分為 5 個(gè)部分,第一部分是意圖識(shí)別,根據(jù)用戶輸入明確理解所要查詢的問題,或者對(duì)話意圖,然后在意圖基礎(chǔ)上做解答。
第二叫情感識(shí)別,識(shí)別對(duì)話里想表達(dá)的某種情感,在開放式聊天主要用到情感識(shí)別這個(gè)技術(shù),包括分析用戶是高興還是憤怒,或者悲傷等等,大概有 21 個(gè)情感。
第三個(gè)叫指代消解和省略恢復(fù),比如說用戶提起一個(gè)問題:“上海的天氣怎么樣?”這個(gè)時(shí)候機(jī)器回答,用戶再接著一句,“北京的呢?”這個(gè)時(shí)候用戶已經(jīng)把北京天氣怎么樣幾個(gè)字省略了,機(jī)器就需要結(jié)合上下文再做進(jìn)一步回答。
第四是意圖澄清,比如說用戶說想看藍(lán)蓮花,這個(gè)時(shí)候需要區(qū)分用到底是藍(lán)蓮花的圖片還是書籍,進(jìn)而發(fā)起詢問并進(jìn)一步確認(rèn)。
第五部分叫拒識(shí)判斷,如果用戶超出機(jī)器的范圍,如果用戶問的問題是涉及到一些反動(dòng)的,色情的問題,這個(gè)時(shí)候機(jī)器也不能夠回答。
“AI對(duì)話需要確認(rèn)對(duì)話邊界”
在應(yīng)答層面,存在一個(gè)叫“多輪對(duì)話”的技術(shù)。用戶意圖如果需要多次對(duì)話才能表述完整,機(jī)器要區(qū)分出這個(gè)意圖對(duì)話邊界,用戶表達(dá)意圖從哪句話開始到哪句話結(jié)束。通常來講我們判斷一個(gè)意圖起始的時(shí)候,我們基于當(dāng)前用戶表達(dá)這句話跟上一個(gè)意圖之間,也就是跟上一個(gè)多輪對(duì)話之間有沒有相關(guān)性,如果沒有相關(guān)性,我們認(rèn)為這是新的對(duì)話的開始。
用戶在多輪對(duì)話的時(shí)候,可能因?yàn)榭陬^表達(dá)失誤,導(dǎo)致對(duì)用戶的理解出現(xiàn)偏差,這個(gè)時(shí)候機(jī)器需要有一個(gè)糾錯(cuò)的機(jī)制,如果缺少一個(gè)機(jī)制,可能用戶在說完很長的,就某一個(gè)意圖進(jìn)行很長對(duì)話之后,可能對(duì)用戶的意圖視做一個(gè)新的意圖,這樣用戶體驗(yàn)非常糟糕。
所以在多輪對(duì)話里面需要一個(gè)智能的、能給用戶進(jìn)行一個(gè)確認(rèn)和感受的機(jī)制,比如當(dāng)用戶說了半天,到最后機(jī)器會(huì)重復(fù)表達(dá)問一下,您說的是這個(gè)意思嗎?如果用戶說是,多輪對(duì)話繼續(xù),如果不是,再重啟一個(gè)新的對(duì)話。
嘉賓介紹:
魏少俊
清華大學(xué)計(jì)算機(jī)專業(yè)碩士,現(xiàn)任360搜索技術(shù)總監(jiān),自然語言理解團(tuán)隊(duì)負(fù)責(zé)人;魏少俊在自然語言處理、內(nèi)容推薦、數(shù)據(jù)挖掘、搜索引擎等領(lǐng)域擁有十多年經(jīng)驗(yàn),加入360之前,魏少俊為百度移動(dòng)搜索團(tuán)隊(duì)總技術(shù)負(fù)責(zé)人。
來源:XXX(非中文科技資訊)的作品均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載請(qǐng)尊重版權(quán)保留出處,一切法律責(zé)任自負(fù)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
如發(fā)現(xiàn)本站文章存在問題,提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至news@citnews.com.cn。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。