在眾多人工智能大模型發(fā)布會上,自然語言處理(NLP)能力一直是各大科技廠商著重展示的要點之一,事實上,早在四年前行業(yè)內(nèi)的就已經(jīng)圍繞這顆人工智能“皇冠上的明珠”展開過激烈的討論……
彼時的人工智能還沒有今日的火熱,很多人對自然語言處理(NLP)的理解還停留在“Hi,Siri”和“小度小度”等智能對話機器人。能否實現(xiàn)與人流利對話也成為了人們判斷人工智能能力的一大重要手段。隨著ChatGPT、文心一言、360智腦等眾多大模型紛紛問世,讓大語言模型成為了人們關(guān)注的焦點,也讓人工智能的認識更加深入和全面。
大語言模型是聊天機器人嗎?
在大模型未出現(xiàn)時,聊天機器人的自然語言處理僅停留在對固定問題的固定回答上,甚至換一種問法都很難得到答案,甚至一些“智能語音客服”至今也只能聽懂一些預(yù)設(shè)問題,哪怕面對稍有變化的指令或問題,都很難為用戶提供被需要的解救辦法。
而具有大模型加持的聊天機器人在面對多樣化的問題已經(jīng)可以通過總結(jié)自身數(shù)據(jù)庫中的數(shù)據(jù)為使用者生成答案。有業(yè)內(nèi)人士對大模型之家表示,LLM當然不等價于Chatbot,不過現(xiàn)在的LLM很多都是用Chat數(shù)據(jù)指令調(diào)諧過的,Chat版本的LLM更適合用來構(gòu)建Chatbot,技術(shù)上不能劃等號。
聊天機器人是一種能夠與人進行自然對話的系統(tǒng),通常需要利用大語言模型來生成回復(fù)。為了讓大語言模型更適合用于聊天機器人,可以在聊天數(shù)據(jù)上進行額外的訓(xùn)練,使其學(xué)習(xí)到更多的對話技巧和知識。因此,雖然大語言模型和聊天機器人有一定的關(guān)聯(lián),但它們在技術(shù)上是不同的概念。
無界AI聯(lián)合創(chuàng)始人馬千里對大模型之家表示,聊天機器人是語言大模型的眾多功能或應(yīng)用之一。語言大模型不應(yīng)局限于聊天這一狹隘的場景。大模型不僅能夠?qū)崿F(xiàn)自然語言處理,還能通過各種插件功能,為使用者提供計算、文檔總結(jié)、工作相關(guān)問題解答等服務(wù)。
大模型之家認為,大語言模型和聊天機器人的不同概念源自于不同的目標、評價指標、數(shù)據(jù)類型、數(shù)據(jù)規(guī)模、用戶和場景。聊天機器人只是大語言模型的一個功能或應(yīng)用,而不是它的本質(zhì)。大模型的存在除了應(yīng)用在自然語言處理方面,更重要的是體現(xiàn)在生產(chǎn)中的意義,大語言模型還有很多其他的功能或應(yīng)用,比如音視頻生成、金融、法律咨詢等,這些都體現(xiàn)了大語言模型的能力和潛力。也是大語言模型商業(yè)化的重要方向。
大語言模型表現(xiàn)良莠不齊,根源在哪兒?
在大多數(shù)大模型發(fā)布會上,自然語言處理能力仍是被著重展示的部分,而對于使用者來說,聊天能力確實是判斷大模型強大與否的重要指標之一。事實上大語言模型的表現(xiàn)并未像市場中吹捧的那般天花亂墜。360集團創(chuàng)始人周鴻祎也于近期表示,誰能解決大模型“幻覺”問題,就相當于摘下了“皇冠上的明珠”。
很多人認為市場上大模型對話能力的參差不齊與大模型研發(fā)的技術(shù)水平有著直接關(guān)系,在繁多的技術(shù)當中,數(shù)據(jù)的質(zhì)量是影響大模型表現(xiàn)的關(guān)鍵技術(shù)因素,它決定了模型能否有效地學(xué)習(xí)和生成文本。數(shù)據(jù)質(zhì)量需要從數(shù)據(jù)的正確性、有效性、豐富性和代表性等方面來提高。這需要經(jīng)過數(shù)據(jù)清洗、標注、過濾和多樣化等方法,保證數(shù)據(jù)沒有錯誤或者矛盾,去除低質(zhì)量和垃圾數(shù)據(jù),涵蓋不同的主題、領(lǐng)域、風(fēng)格和觀點。提高數(shù)據(jù)質(zhì)量是影響大模型表現(xiàn)的關(guān)鍵技術(shù)因素,也是未來文本生成領(lǐng)域的重要研究方向。
行業(yè)領(lǐng)先人工智能企業(yè)「行者AI」對大模型之家表示:雖然如今大語言模型參數(shù)規(guī)模越來越大,涌現(xiàn)出的能力也越來越強,但它歸根結(jié)底仍然是一種概率統(tǒng)計模型,因此理論上來說,即使是目前最好的模型,仍然有一定概率輸出不佳的結(jié)果,只是這種概率較小而已。
而具體從技術(shù)上來說,大語言模型表現(xiàn)好壞受眾多因素影響,其一是訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量,模型本質(zhì)上是以訓(xùn)練數(shù)據(jù)為老師進行學(xué)習(xí),數(shù)據(jù)的質(zhì)量和數(shù)量直接決定模型的上限,數(shù)據(jù)質(zhì)量在某些方面的參差不齊可能會導(dǎo)致模型回答時有好有壞;其二是模型的架構(gòu)和訓(xùn)練策略,訓(xùn)練模型時選擇的不同模型架構(gòu)和訓(xùn)練策略會導(dǎo)致最終得到的模型性能有所差異。
當然,除技術(shù)之外,無界AI聯(lián)合創(chuàng)始人馬千里認為,大模型表現(xiàn)的好壞,人的“問題”也占很大一部分。他指出,大語言模型的效果同樣受到提問者輸入的影響。使用者需要輸入一個恰當?shù)奶崾菊Z后再提出問題。而問題的形式和方式會決定模型的回答質(zhì)量,因此不同的使用者可能獲得不同的體驗。其次,模型本身也在持續(xù)更新和優(yōu)化。由于部署在云端,為了保證安全性,它增加了對敏感內(nèi)容的審核機制,如果使用者詢問一些涉及危險信息的問題,大模型可能不會給出回答。
同時,大模型的本質(zhì)神經(jīng)網(wǎng)絡(luò)生成內(nèi)容的過程,數(shù)據(jù)、參數(shù)以及算法都具有一定的隨機性,能提高大模型的泛化能力和創(chuàng)造力,但也會導(dǎo)致大模型的不穩(wěn)定和不可預(yù)測。因此,使用者需要根據(jù)不同的數(shù)據(jù)和任務(wù),選擇合適的隨機操作和超參數(shù),以及監(jiān)控和評估大模型的表現(xiàn)。
在《人工智能大模型產(chǎn)業(yè)創(chuàng)新價值研究報告》中,大模型之家認為,大模型將引發(fā)數(shù)據(jù)的革命。數(shù)據(jù)的質(zhì)量以及數(shù)據(jù)清洗的工程化能力會顯著拉開大模型預(yù)訓(xùn)練階段的效果差距將成為決勝關(guān)鍵因素。同時大模型的發(fā)展將為數(shù)據(jù)相關(guān)產(chǎn)業(yè)和行業(yè)帶來多重機遇,包括數(shù)據(jù)分析和洞察力,數(shù)據(jù)清洗和預(yù)處理,數(shù)據(jù)驅(qū)動的創(chuàng)新,數(shù)據(jù)安全和隱私保護以及數(shù)據(jù)驅(qū)動的行業(yè)轉(zhuǎn)型等。
大模型是一種技術(shù),也是一種趨勢。決定大模型表現(xiàn)的也不止需要對數(shù)據(jù)質(zhì)量進行把控,模型可解釋性、安全性、創(chuàng)新性甚至使用者的操作都是必要考慮關(guān)鍵因素。除了聊天機器人,大模型能夠在不同的領(lǐng)域和任務(wù)中表現(xiàn)出優(yōu)秀的通用性和創(chuàng)造性,例如自然語言生成、圖像識別、語音合成等。此外,大模型的訓(xùn)練和應(yīng)用也依賴于高效的硬件和軟件支持,例如GPU、TPU等處理器,以及分布式并行的平臺和方法。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。