2022年11月30日,ChatGPT發(fā)布,全世界對這一全新AI技術充滿好奇的人,開始闖入ChatGPT世界。
不過,在使用ChatGPT時,*步要先交出數(shù)據(jù)使用權。
即允許ChatGPT將我們與它對話過程中產生的數(shù)據(jù),用于它自己今后的模型優(yōu)化過程中。
或許你會覺得這沒什么所謂,畢竟在互聯(lián)網(wǎng)世界里,我們已經習慣了交出數(shù)據(jù),換取服務。
然而,相較于之前基于關鍵詞匹配的互聯(lián)網(wǎng)搜索技術,基于語料庫生成式的大模型技術天然擁有更高的“智慧”,這當然也包括在構建用戶畫像上。
何積豐院士最近就用這樣一個例子解釋了大模型可能出現(xiàn)的隱私安全問題:
在大模型收集到一個人足夠多的個人數(shù)據(jù)后,當一位黑客提示大模型為這個人作出用戶畫像時,它甚至可以寫出一本小說,詳細地描繪出這個人所有的靜態(tài)和動態(tài)信息。
基于大模型的黑客技術,細思極恐。
實際上,這并不是玩笑,在一些西方投資機構中,不少人已經開始通過這類技術,分析初創(chuàng)公司的創(chuàng)始團隊,以評估相應的項目是否值得投資。
正是有了以上種種神乎其神的超能力,我們更應該關注由之帶來的兩個問題:
1、大模型究竟為我們帶來了什么?
2、大模型對產業(yè)有怎樣的意義?
01AI的致命缺陷
2023年9月7日,美國《時代》周刊首次發(fā)布了全球百大AI人物(TIME100 AI),這將人工智能和大模型在全球關注度再次推向高潮。
而早在今年1月,美國另一本頗具影響力的商業(yè)雜志《財富》,更是旗幟鮮明地指出,大模型是人工智能的iPhone時刻。
毫無疑問,大模型的出現(xiàn),讓人工智能技術在2023年迎來拐點。
那么,大模型究竟為AI帶來了哪些關鍵改變?
這里我們需要引入一個作為比較對象的參照物,知識圖譜。
知識圖譜是過去十幾年構建人工智能推理能力、認知能力的基礎,也是傳統(tǒng)人工智能技術的重要范式。
在國內,復旦大學肖仰華教授是最早從事知識圖譜研究的人工智能專家之一,他指出:
知識圖譜是一種符號化的專業(yè)知識表達,大模型則是一種參數(shù)化的通用知識容器。
二者差別在哪里?
差別在于,后者可以提供對于「常識」的理解能力。
「常識」能力是人類定義的,也是人類擅長的一種經驗知識,以往的人工智能并不擅長處理「常識」問題,他們遇到「常識」問題,往往會變“笨”。
例如,當你問出如下問題:
如果你在爐子里放入木頭,然后再把引火物扔到爐子里,一般來說,你是在做什么?
答案顯然是你要在爐子里點火,現(xiàn)在的ChatGPT已經能夠很好地給出答案,甚至給出詳細的解釋。
然而,就在三年前,紐約大學心理學教授Gary Marcus(曾是Uber人工智能實驗室負責人)也曾向當時還很不成熟的GPT-2問過同樣的問題,GPT-2給出的答案是:嘔吐。
所以,在大模型出現(xiàn)之前,人工智能領域普遍流傳著這樣一個似玩笑又非玩笑的尷尬自嘲:
再聰明的AI,遇到「常識」問題,都會變得愚蠢不堪。
正如機器人的*形態(tài)是擁有雙手、雙腳,可以在人類定義的世界里執(zhí)行任務的人形機器人一樣,需要在人類世界里運轉的人工智能系統(tǒng),同樣需要有仿人的大腦。
在過往十幾年,甚至幾十年里,人工智能科學家都在思考如何模仿人類的神經系統(tǒng),雖然因此在CNN、RNN等神經網(wǎng)絡上取得了不少突破,但卻長期困于「常識」的漩渦。
現(xiàn)在的大模型其實做了另外一件事兒,另外一件模仿人類成長過程知識體系形成過程的事兒:
通過大量數(shù)據(jù)和參數(shù),花大力氣讓人工智能擁有「基礎認知」,而非「專業(yè)知識」。
這有點像是讓人工智能去經歷一個九年義務教育的折磨。
02突破認知瓶頸
人類對自己創(chuàng)造的社會文明的學習,是從痛苦的數(shù)理化公式開始。
雖然大部分人類最終沒有成為科學家,也沒有從事基礎科學研究,但這些基礎知識讓我們在之后的生活中擁有了「常識」,這為我們從事更具象化的工作打下了基礎。
所以,九年義務教育或許沒有肉眼可見的實際價值,但它為我們建立了對世界運轉規(guī)律的基本認知。
肖仰華教授在行業(yè)調研過程中曾遇到過另一個更具體的案例:
醫(yī)院里,醫(yī)生在為病人診斷病情時,80%的時間是在排除健康因素,只有20%的情況是需要醫(yī)生干預并給出診斷方案的。
也就是說,一位醫(yī)生要想做好自己的工作,首先要知道人類身體在健康情況下是一個怎樣的運轉狀態(tài),而不僅僅要知道生病時是什么樣。
要理解疾病,首先要理解什么是健康。
這反映出來的其實是,「常識」是認知的前提,是人類世界的底層邏輯。
在大模型出現(xiàn)之前,人工智能專家要想為某個行業(yè)研發(fā)智能化解決方案,首先要把這個行業(yè)中所有數(shù)據(jù)收集起來,從而構建一個行業(yè)數(shù)據(jù)驅動的智能化解決方案。
此前只會下圍棋,但卻轟動了全世界的AlphaGo,就是通過這種模式訓練而來。
不過,那時,有人在嘗試走另一條路。
2015年年底,OpenAI創(chuàng)始人奧特曼帶著一群人工智能領域最聰明的人,用大量資源和萬億級參數(shù),開始訓練人工智能看起來不怎么厲害的「常識」理解能力。
他們花了7年時間,耗費巨資、巨量時間,為人工智能補了一個九年義務教育。
這時,AI有了理解傳統(tǒng)人工智能模型學習的“大學課程”背后的“為什么”的基礎。
奧特曼和他的團隊——世界上最聰明的一群人,花了大量的時間和精力做了很多不討巧、其他人不愿意做的事兒。
這才有了大模型,有了2022年年底發(fā)布的ChatGPT,有了人工智能突破認知瓶頸的2023。
如非大模型,人工智能很可能會在2023年在資本的失望情緒下,再次進入低潮。
03補修“專業(yè)課”
大模型來了,通用人工智能來了,AI和人一樣有了認知世界的基礎知識了,是不是就能*解決所有行業(yè)問題了?
其實,不然。
大模型讓人工智能擁有了「常識」的同時,也帶來了一個與生俱來的嚴重問題是:“幻覺”現(xiàn)象,也就是我們在使用ChatGPT這類大模型過程中,它總是會“胡說八道”。
大模型之所以被稱為生成式AI,是因為它基于訓練數(shù)據(jù),有了一定的創(chuàng)造性,這樣的創(chuàng)造性,在具體某一個垂直行業(yè)中,表現(xiàn)為對先驗知識缺乏足夠的“忠誠度”。
如果在醫(yī)療、工業(yè)等行業(yè)領域中,大模型遇到了一個它沒有學習到的知識,或者是一個開放性的問題,它發(fā)揮了自己的創(chuàng)造力,由此帶來的后果將難以想象。
在垂直行業(yè)場景中,引入人工智能技術,首先需要它是一個可控、可編輯、可解釋、可防護的模型,這是基于知識圖譜的傳統(tǒng)人工智能模型的特性,也是為什么這類模型會先發(fā)展起來的一個主要原因。
但是如果不懂樂理,終究難成大師級音樂家。
當傳統(tǒng)人工智能模型最終遇到瓶頸,人們發(fā)現(xiàn)大模型才是正道時,如何讓“創(chuàng)造力有余,專業(yè)力不足”的大模型擁有進入產業(yè)時所必須的,這些它本不擅長的能力,就成了如今的關鍵。
肖仰華認為,通用大模型向行業(yè)大模型的適配、優(yōu)化,今天才剛剛開始,無論是從數(shù)據(jù)、知識、訓練,還是模型架構、評估體系、生態(tài)建設上,我們都還有很長的路要走。
例如,在長文本的理解能力、長短期記憶能力,甚至金融領域最基本的數(shù)學量綱、數(shù)量推理上,現(xiàn)在的大模型都還無法很好地做出正確的理解。
不過,我們能看到的是,在大模型發(fā)布還不到一年的時間里,各行各業(yè)都已經迫不及待地嘗試將大模型引入各自領域中。
具體在進入垂直領域時,大模型往往會將需要執(zhí)行的任務分解為三個子任務:提示、生成、評估,當下大模型最擅長的,仍然是生成子任務。
因而,學術界和產業(yè)界都在為大模型補課,希望可以通過與數(shù)據(jù)庫、知識圖譜這些相關技術的協(xié)同,提升大模型的專業(yè)能力。
例如,通過知識圖譜來做提示和評估,緩解大模型的“幻覺”問題。
大模型欠下的專業(yè)課,都需要再修一遍,這其中,與專業(yè)能力更強的知識圖譜這類技術進行協(xié)同應用,不失為一條不錯的捷徑。
04像云計算一樣顛覆產業(yè)
在ChatGPT問世之前,沒有多少人相信大模型,就像云計算在國內問世時,不少互聯(lián)網(wǎng)大佬都曾質疑過云計算一樣。
在ChatGPT問世后,大模型成了人工智能技術的拐點。
甚至在ChatGPT問世不到一年的時間里,各行各業(yè)都展開了對大模型在垂直行業(yè)里的應用探索,商業(yè)模式更清晰的行業(yè)大模型也成了一大競爭焦點。
來自全球知名咨詢機構麥肯錫的預測數(shù)據(jù)顯示,生成式AI將為全球帶來至少9萬億美元的經濟價值增量。
在這9萬億美元的經濟增量中,排在前三的產業(yè)分別是高科技、零售、金融,預計產生的經濟增量分別為2000億美元-4600億美元之間。
即便是在農業(yè)這樣被視為最傳統(tǒng)的產業(yè)中,也將帶來至少400億美元的經濟增量。
過去三十年里,全球GDP增長主引擎已經由就業(yè)人口轉向生產力,而在過去十年里,生產力增速不斷放緩導致了全球經濟減速。
誰來挽救全球經濟?
麥肯錫中國區(qū)主席倪以理認為,生成式AI是其中關鍵。
他指出,在過去很長一段時間里,自動化始終無法替代的諸如互動、決策類工作,生成式AI帶來了新的替代可能。
此外,作為擅長用數(shù)據(jù)表達趨勢的咨詢機構,麥肯錫還給出了生成式AI對自動化的加速量化效果——當前半數(shù)工作被自動化取代的時間,相較之前預測提前了10年。
這意味著,雖然大模型才剛開始從通用大模型轉向專用大模型,但大模型將會像云計算一樣顛覆產業(yè)。
這種顛覆,或許比人們想象的要來得更快。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。