Bye Siri ! 大模型能做的可不止是聊天機器人

2023年08月08日 15:49:22 來源：大模型之家

　　在眾多人工智能大模型發(fā)布會上，自然語言處理(NLP)能力一直是各大科技廠商著重展示的要點之一，事實上，早在四年前行業(yè)內(nèi)的就已經(jīng)圍繞這顆人工智能“皇冠上的明珠”展開過激烈的討論……

　　彼時的人工智能還沒有今日的火熱，很多人對自然語言處理(NLP)的理解還停留在“Hi，Siri”和“小度小度”等智能對話機器人。能否實現(xiàn)與人流利對話也成為了人們判斷人工智能能力的一大重要手段。隨著ChatGPT、文心一言、360智腦等眾多大模型紛紛問世，讓大語言模型成為了人們關(guān)注的焦點，也讓人工智能的認識更加深入和全面。

　　大語言模型是聊天機器人嗎?

　　在大模型未出現(xiàn)時，聊天機器人的自然語言處理僅停留在對固定問題的固定回答上，甚至換一種問法都很難得到答案，甚至一些“智能語音客服”至今也只能聽懂一些預(yù)設(shè)問題，哪怕面對稍有變化的指令或問題，都很難為用戶提供被需要的解救辦法。

　　而具有大模型加持的聊天機器人在面對多樣化的問題已經(jīng)可以通過總結(jié)自身數(shù)據(jù)庫中的數(shù)據(jù)為使用者生成答案。有業(yè)內(nèi)人士對大模型之家表示，LLM當然不等價于Chatbot，不過現(xiàn)在的LLM很多都是用Chat數(shù)據(jù)指令調(diào)諧過的，Chat版本的LLM更適合用來構(gòu)建Chatbot，技術(shù)上不能劃等號。

　　聊天機器人是一種能夠與人進行自然對話的系統(tǒng)，通常需要利用大語言模型來生成回復(fù)。為了讓大語言模型更適合用于聊天機器人，可以在聊天數(shù)據(jù)上進行額外的訓(xùn)練，使其學(xué)習(xí)到更多的對話技巧和知識。因此，雖然大語言模型和聊天機器人有一定的關(guān)聯(lián)，但它們在技術(shù)上是不同的概念。

　　無界AI聯(lián)合創(chuàng)始人馬千里對大模型之家表示，聊天機器人是語言大模型的眾多功能或應(yīng)用之一。語言大模型不應(yīng)局限于聊天這一狹隘的場景。大模型不僅能夠?qū)崿F(xiàn)自然語言處理，還能通過各種插件功能，為使用者提供計算、文檔總結(jié)、工作相關(guān)問題解答等服務(wù)。

　　大模型之家認為，大語言模型和聊天機器人的不同概念源自于不同的目標、評價指標、數(shù)據(jù)類型、數(shù)據(jù)規(guī)模、用戶和場景。聊天機器人只是大語言模型的一個功能或應(yīng)用，而不是它的本質(zhì)。大模型的存在除了應(yīng)用在自然語言處理方面，更重要的是體現(xiàn)在生產(chǎn)中的意義，大語言模型還有很多其他的功能或應(yīng)用，比如音視頻生成、金融、法律咨詢等，這些都體現(xiàn)了大語言模型的能力和潛力。也是大語言模型商業(yè)化的重要方向。

　　大語言模型表現(xiàn)良莠不齊，根源在哪兒?

　　在大多數(shù)大模型發(fā)布會上，自然語言處理能力仍是被著重展示的部分，而對于使用者來說，聊天能力確實是判斷大模型強大與否的重要指標之一。事實上大語言模型的表現(xiàn)并未像市場中吹捧的那般天花亂墜。360集團創(chuàng)始人周鴻祎也于近期表示，誰能解決大模型“幻覺”問題，就相當于摘下了“皇冠上的明珠”。

　　很多人認為市場上大模型對話能力的參差不齊與大模型研發(fā)的技術(shù)水平有著直接關(guān)系，在繁多的技術(shù)當中，數(shù)據(jù)的質(zhì)量是影響大模型表現(xiàn)的關(guān)鍵技術(shù)因素，它決定了模型能否有效地學(xué)習(xí)和生成文本。數(shù)據(jù)質(zhì)量需要從數(shù)據(jù)的正確性、有效性、豐富性和代表性等方面來提高。這需要經(jīng)過數(shù)據(jù)清洗、標注、過濾和多樣化等方法，保證數(shù)據(jù)沒有錯誤或者矛盾，去除低質(zhì)量和垃圾數(shù)據(jù)，涵蓋不同的主題、領(lǐng)域、風(fēng)格和觀點。提高數(shù)據(jù)質(zhì)量是影響大模型表現(xiàn)的關(guān)鍵技術(shù)因素，也是未來文本生成領(lǐng)域的重要研究方向。

　　行業(yè)領(lǐng)先人工智能企業(yè)「行者AI」對大模型之家表示：雖然如今大語言模型參數(shù)規(guī)模越來越大，涌現(xiàn)出的能力也越來越強，但它歸根結(jié)底仍然是一種概率統(tǒng)計模型，因此理論上來說，即使是目前最好的模型，仍然有一定概率輸出不佳的結(jié)果，只是這種概率較小而已。

　　而具體從技術(shù)上來說，大語言模型表現(xiàn)好壞受眾多因素影響，其一是訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量，模型本質(zhì)上是以訓(xùn)練數(shù)據(jù)為老師進行學(xué)習(xí)，數(shù)據(jù)的質(zhì)量和數(shù)量直接決定模型的上限，數(shù)據(jù)質(zhì)量在某些方面的參差不齊可能會導(dǎo)致模型回答時有好有壞;其二是模型的架構(gòu)和訓(xùn)練策略，訓(xùn)練模型時選擇的不同模型架構(gòu)和訓(xùn)練策略會導(dǎo)致最終得到的模型性能有所差異。

　　當然，除技術(shù)之外，無界AI聯(lián)合創(chuàng)始人馬千里認為，大模型表現(xiàn)的好壞，人的“問題”也占很大一部分。他指出，大語言模型的效果同樣受到提問者輸入的影響。使用者需要輸入一個恰當?shù)奶崾菊Z后再提出問題。而問題的形式和方式會決定模型的回答質(zhì)量，因此不同的使用者可能獲得不同的體驗。其次，模型本身也在持續(xù)更新和優(yōu)化。由于部署在云端，為了保證安全性，它增加了對敏感內(nèi)容的審核機制，如果使用者詢問一些涉及危險信息的問題，大模型可能不會給出回答。

　　同時，大模型的本質(zhì)神經(jīng)網(wǎng)絡(luò)生成內(nèi)容的過程，數(shù)據(jù)、參數(shù)以及算法都具有一定的隨機性，能提高大模型的泛化能力和創(chuàng)造力，但也會導(dǎo)致大模型的不穩(wěn)定和不可預(yù)測。因此，使用者需要根據(jù)不同的數(shù)據(jù)和任務(wù)，選擇合適的隨機操作和超參數(shù)，以及監(jiān)控和評估大模型的表現(xiàn)。

　　在《人工智能大模型產(chǎn)業(yè)創(chuàng)新價值研究報告》中，大模型之家認為，大模型將引發(fā)數(shù)據(jù)的革命。數(shù)據(jù)的質(zhì)量以及數(shù)據(jù)清洗的工程化能力會顯著拉開大模型預(yù)訓(xùn)練階段的效果差距將成為決勝關(guān)鍵因素。同時大模型的發(fā)展將為數(shù)據(jù)相關(guān)產(chǎn)業(yè)和行業(yè)帶來多重機遇，包括數(shù)據(jù)分析和洞察力，數(shù)據(jù)清洗和預(yù)處理，數(shù)據(jù)驅(qū)動的創(chuàng)新，數(shù)據(jù)安全和隱私保護以及數(shù)據(jù)驅(qū)動的行業(yè)轉(zhuǎn)型等。

　　大模型是一種技術(shù)，也是一種趨勢。決定大模型表現(xiàn)的也不止需要對數(shù)據(jù)質(zhì)量進行把控，模型可解釋性、安全性、創(chuàng)新性甚至使用者的操作都是必要考慮關(guān)鍵因素。除了聊天機器人，大模型能夠在不同的領(lǐng)域和任務(wù)中表現(xiàn)出優(yōu)秀的通用性和創(chuàng)造性，例如自然語言生成、圖像識別、語音合成等。此外，大模型的訓(xùn)練和應(yīng)用也依賴于高效的硬件和軟件支持，例如GPU、TPU等處理器，以及分布式并行的平臺和方法。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風(fēng)險自擔。

[No. ]
分享到微信