CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型
  • 首頁 > 云計算頻道 > 大模型

    行業(yè)大模型 卷卷更健康

    2023年06月15日 18:07:56   來源:微信公眾號:數(shù)智前線

      無論是巨頭,還是有點規(guī)模的企業(yè),都在做行業(yè)大模型,未來幾個月將迎來密集發(fā)布期。但不得不正視的一個現(xiàn)實時,大多其實都還停留在講概念、講技術(shù)、進行內(nèi)部測試或項目定制的階段。

      本周,一位互聯(lián)網(wǎng)人士分享了一個小故事——幾天前,他曾遇見一幫創(chuàng)業(yè)青年,在交流的過程中,對方告訴他,他們搜集了一大堆修車相關(guān)的案例和知識,想問問他能不能提供通用大模型的能力基礎(chǔ),來幫助他們?nèi)ビ?xùn)練一個修車行業(yè)的大模型出來,以便讓中國1000萬修車工都能擁有20年老師傅的功力。

      “這是一個典型的行業(yè)的能力。”在他看來,今天有太多垂直領(lǐng)域,其實是ChatGPT等通用大模型解決不了的,例如面對修車問題,他們都只能泛泛而談,“未來大模型這個產(chǎn)業(yè)怎么發(fā)展,我覺得還得往垂直化、產(chǎn)業(yè)化、企業(yè)化,甚至個人化發(fā)展”。

      實際上,相關(guān)企業(yè)都已摩拳擦掌;ヂ(lián)網(wǎng)大廠百度、阿里紛紛官宣伙伴計劃和工具鏈,聲稱要讓每一個行業(yè)都能夠用上自己的大模型。各行各業(yè)的龍頭企業(yè)、創(chuàng)業(yè)公司,同樣馬力十足。金融、教育、醫(yī)療、自動駕駛、智能物流、安防等多個領(lǐng)域的行業(yè)公司都已相繼傳出要推行業(yè)大模型的消息。

      “全國都在大煉行業(yè)大模型”, “現(xiàn)在只要是上市公司或規(guī)模稍微大一點的企業(yè),他們都會有。”相關(guān)推出行業(yè)大模型的企業(yè)的多位員工告訴數(shù)智前線。“預(yù)計幾個月后,行業(yè)大模型將會迎來一波密集發(fā)布的小高潮。”多位業(yè)界人士稱。

      大模型的戰(zhàn)事,已經(jīng)開始從通用大模型,迅速卷向面向垂直領(lǐng)域的行業(yè)大模型。

      01  行業(yè)大模型卷起來了

      “現(xiàn)在我們?nèi)ジ蛻粽,很多客戶也不太了解什么是行業(yè)大模型,但是一上來就說,我需要你們的行業(yè)大模型。”百度智能云AI平臺副總經(jīng)理李景秋告訴數(shù)智前線。

      她最近和很多企業(yè)進行過溝通,發(fā)現(xiàn)一般會存在兩種情況,一種需要的是SFT(有監(jiān)督精調(diào))的大模型,只需基于工具鏈去標(biāo)注幾百到幾千或者上萬條數(shù)據(jù),就已經(jīng)能達到企業(yè)需要的效果。但還有一種,一定需要構(gòu)建行業(yè)的預(yù)訓(xùn)練模型才能解決,也即打造一個行業(yè)大模型。

      李景秋發(fā)現(xiàn),尤其是教育、金融、能源方向,很多有行業(yè)數(shù)據(jù)和場景積累的龍頭企業(yè)都希望和大廠合作,構(gòu)建行業(yè)大模型,并進一步孵化行業(yè)應(yīng)用,廣泛去服務(wù)上下游相關(guān)企業(yè)。

      行業(yè)大模型的重大意義在于,通用大模型雖然具備涌現(xiàn)的能力,但如果原始數(shù)據(jù)里一點行業(yè)數(shù)據(jù)都沒有,那它對行業(yè)理解還是會存在局限性,而一旦存在知識上的局限性,行業(yè)大模型一定會有需求。“而且國內(nèi)的數(shù)據(jù)生態(tài)沒有那么開放,每個企業(yè)都有大量沉默的行業(yè)數(shù)據(jù),這些數(shù)據(jù)的價值,要通過行業(yè)大模型才能激活并發(fā)揮出來。”李景秋解釋稱。

      中科深智CTO宋健認為,不管是從一些行業(yè)對專業(yè)知識的要求,還是從安全性、成本和效率問題來看,行業(yè)大模型都是必然存在的。“尤其對我們數(shù)字人領(lǐng)域來講,實時性非常關(guān)鍵,用戶問的問題它要在一秒以內(nèi)能回答,這個是通用大模型達不到的。”

      但生成式AI大模型的確為數(shù)字人這個行業(yè)帶來了巨大的想象空間。宋健透露,之前,一套好用或者可以達標(biāo)的數(shù)字人后端對話系統(tǒng),對他們來說一直是道難題,數(shù)字人一般只能做到有一套簡單的問答系統(tǒng),很難滿足用戶需求。例如在電商直播間,用戶能問的問題和問法基本是被限制的,一旦說法發(fā)生變化,后端的問答系統(tǒng)可能就無法匹配。但大模型強大的語義理解能力為這個問題提供了解決方案,讓用戶可以從“和一個很傻的白癡在聊天”,進化到“可能跟一個比較聰明的正常人在聊天”。

      “這個區(qū)別是非常大的。”宋健告訴數(shù)智前線,這也是他們?yōu)槭裁磸?月份開始做相關(guān)準(zhǔn)備,并在5月正式推出面向虛擬人這一垂直領(lǐng)域的行業(yè)大模型——數(shù)智姜尚的原因。中科深智是國內(nèi)一家虛擬人公司,有數(shù)據(jù)顯示,其虛擬主播產(chǎn)品已服務(wù)超2000家客戶,占據(jù)主流電商平臺虛擬主播近70%的份額。

      無獨有偶,大量的行業(yè)企業(yè)也已經(jīng)開始行動。

      今年6月初舉行的2023國際通信展上,中國移動在展臺上,展出了他們的“九天”行業(yè)大模型在網(wǎng)絡(luò)運維領(lǐng)域的應(yīng)用,F(xiàn)場工作人員演示,在有多個線頭交錯的一臺電信設(shè)備中,行業(yè)大模型可以識別幾百個插線接口的情況,從而讓運維人員可快速進行光纖線纜的接插。同時,中國移動也正在研發(fā)和內(nèi)測的一個客服的行業(yè)模型,未來可能會對外提供,帶頭人是中國移動首席科學(xué)家馮俊蘭。后者自2013年9月加入移動以來,就創(chuàng)建并帶領(lǐng)了中國移動人工智能團隊 “九天”,至今已近10年。

      而在此前的5月29日,中國聯(lián)通研究院副院長、首席科學(xué)家唐雄燕也曾向外透露,中國聯(lián)通正在打造一個通用的、可適用于各網(wǎng)絡(luò)體系的通信大模型。中國電信更是早在4月底召開的2023云生態(tài)大會上就表示,天翼云正在自研預(yù)訓(xùn)練大模型,并已進入內(nèi)部測試階段,將在近期適當(dāng)時候面向市場發(fā)布。

      安防行業(yè)的企業(yè)們同樣動作頻頻。前不久的2023安博會上,AI大模型的身影堪稱“扎堆涌現(xiàn)”。據(jù)不完全統(tǒng)計,現(xiàn)場至少有包括商湯科技、宇視科技、360智慧生活、熵基科技、聯(lián)匯科技、算能等在內(nèi)的6家不同賽道的頭部企業(yè),都展示了自己的通用或行業(yè)大模型,及相關(guān)的應(yīng)用Demo。

      安防行業(yè)“海大宇”三巨頭中的宇視科技在5月推了宇視AIoT行業(yè)大模型“梧桐”,并在此次安博會上展示了該行業(yè)大模型在Vlog等場景的應(yīng)用。它可將景區(qū)專業(yè)設(shè)備抓拍的游客游覽視頻,自動生成vlog,配上文字和表情包。

      多模態(tài)生物識別企業(yè)熵基科技設(shè)了一個自研大模型及技術(shù)專區(qū),專門展示自己涵蓋了140億、70億、13億等多個參數(shù)規(guī)模版本在內(nèi)的BioCV大模型矩陣;人工智能企業(yè)聯(lián)匯科技也用了大量筆墨介紹自己百億級參數(shù)的視覺語言大模型OmModel,并表示下半年還會有一個V3(OmModel V3 )版本的發(fā)布;算力提供商算能則專門用了一個位置,來展示其與算法合作伙伴千視通合作推出的AI大模型訓(xùn)推一體機,并將應(yīng)用場景定位在了智慧網(wǎng)點、智慧職場、智慧巡檢、風(fēng)控監(jiān)督。

      而在金融領(lǐng)域,包括中國農(nóng)業(yè)銀行、江蘇銀行、度小滿、奇富科技等都宣布推出了行業(yè)大模型。教育領(lǐng)域傳出過要推行業(yè)大模型的也不在少數(shù),包括網(wǎng)易有道、學(xué)而思、淘云科技、孩子王等。6月11日,中公教育也宣布要與新華網(wǎng)聯(lián)合推出全三維數(shù)智人及職業(yè)教育行業(yè)大模型。

      自動駕駛、醫(yī)療、房產(chǎn)經(jīng)紀(jì)、智能物聯(lián)等多個領(lǐng)域也相繼有行業(yè)大模型涌出。4月,毫末智行宣布發(fā)布全球*自動駕駛生成式大模型DriveGPT;5月,我愛我家宣布聯(lián)合第四范式推出行業(yè)*房產(chǎn)經(jīng)紀(jì)大模型1.0版本,深信服也將自己自研的安全GPT大模型進行了首秀;同月底,互聯(lián)網(wǎng)醫(yī)療公司醫(yī)聯(lián)發(fā)布自研的醫(yī)療大語言模型MedGPT……

      一場行業(yè)大模型熱潮正在快速到來。

      02  用開源還是自研?

      當(dāng)市場在短短幾個月內(nèi),迅速涌現(xiàn)出大量通用大模型和行業(yè)大模型時,一些變化也在悄然發(fā)生。

      "GPT的API調(diào)用成本在3月份之后下降到了1/10,更重要的是,開源業(yè)界在過去幾個月里變得特別繁榮。”云蝠智能創(chuàng)始人魏佳星告訴數(shù)智前線,大量開源大模型的出現(xiàn),讓他們在打造面向智能客服領(lǐng)域的行業(yè)大模型時有了幾種不同的路徑選擇方案——要么自研,要么基于開源大模型進行微調(diào),又或是采用閉源但接口價格不貴的大模型。

      在對比了市場上的各類開源和閉源大模型的使用效果及成本后,云蝠智能最終采用了“自研小模型+開源大模型+垂直語料”的路徑,于近期上線了10億參數(shù)的NLP神鶴大模型,可支持問法自動擴寫,大幅提高智能客服回復(fù)邏輯的完善度。其中,自研小模型主要負責(zé)核心的匹配邏輯,清華系公司智譜AI的ChatGLM-6B開源大模型則用于支撐小模型完成不了的邊緣部分工作,例如對問題相似度算法進行支撐。

      也有不少公司選擇“幾條腿一起走路”。

      “百度文心一言,以及其他的一些模型,我們也都在用,只是用的地方不太一樣。”中科深智CTO宋健告訴數(shù)智前線,在一些實時性、專業(yè)性以及數(shù)據(jù)安全性等要求較高的場景,例如虛擬助播,他們一般會用上自己自研行業(yè)大模型,但在一些通用場景,也會用到文心一言或其他大模型。

      “這并不矛盾,這些大的互聯(lián)網(wǎng)公司的千億級通用大模型還是有它的優(yōu)勢的,我們并不會把所有的需求都在我們自己的模型上去滿足。”宋健說。在他看來,在這個各種商業(yè)模型剛推出不久,尚未十分成熟的階段,很多企業(yè)都會去考慮“還有沒有其他選擇”。

      熵基科技的一位人士也告訴數(shù)智前線,他們目前的行業(yè)大模型打造路徑,既有自研的,也會基于開源大模型進行微調(diào),二者“互相借鑒”。

      值得一提的是,多位業(yè)內(nèi)人士均認為,在當(dāng)下的情況下,出于對成本、進入門檻和速度等的考慮,開源大概率會成為接下來一個非常關(guān)鍵的領(lǐng)域。一方面,從事大模型開源的可能會越來越多;另一方面,在開源大模型的基礎(chǔ)上去調(diào)試自己的東西,也會成為一個主流。

      “我覺得90%以上的在未來都會用開源模型。”一位業(yè)內(nèi)資深人士表示,這就像當(dāng)初的Web服務(wù)器、數(shù)據(jù)庫等互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,最后在市場上留下來的,除了少量私有,其余絕大部分場景用的都是開源的。

      “但就現(xiàn)階段而言,你也不能對某個大模型依賴過重,畢竟戰(zhàn)局還沒有最后確認下來。”魏佳星強調(diào),這就好比10年前安卓、塞班、黑莓等一堆底層操作系統(tǒng)廠商在干架,一旦某家企業(yè)對某個操作系統(tǒng)過于依賴,后期它的方案又長期跟不上迭代,這家企業(yè)就會吃虧。

      在他看來,基于開源大模型做行業(yè)大模型的企業(yè),在盡可能跟市場上這些開源大模型結(jié)合的同時,又要解耦。他舉例稱,云蝠智能的行業(yè)大模型雖然與GLM是對接的,但都是用的提示詞的形式來對接,耦合度很低的,“我隨便換一個模型,一下就能換掉”。

      上述熵基科技的人士也透露,他們自研的大模型參數(shù)目前會相對小一點,但其會將基于開源大模型微調(diào)的模型作為老師或參照物,在對比學(xué)習(xí)中持續(xù)進步,避免對開源大模型形成過度依賴,且最終落到產(chǎn)品里面的,都會是他們的自研大模型。

      在終局到來之前,行業(yè)大模型市場的玩家們都需要在謹(jǐn)慎中前行。

      03  故事剛剛開始

      搞行業(yè)大模型的玩家一個接著一個,但就目前來看,大多其實都還停留在講概念、講技術(shù)、進行內(nèi)部測試或項目定制的階段。

      上述熵基科技的人士告訴數(shù)智前線,他們目前在探索落地上都還是項目制的,比如他們正和一家醫(yī)院一起,用自研大模型,做一個導(dǎo)診臺的問詢機器人,但現(xiàn)在具體的成熟產(chǎn)品還沒有,“還在測”。而在2023安博會上,數(shù)智前線發(fā)現(xiàn),現(xiàn)場強調(diào)了自己的大模型能力的企業(yè),也大多只展示了他們的大模型技術(shù)或相關(guān)應(yīng)用場景的Demo。

      一位互聯(lián)網(wǎng)大廠資深人士也透露,他們目前基本上都還在項目定制階段,著重在提煉需求,積累數(shù)據(jù)。

      百度智能云AI平臺副總經(jīng)理李景秋則表示,現(xiàn)在來找到他們做行業(yè)大模型的,都是行業(yè)內(nèi)的龍頭,百度雖然在19年就和浦發(fā)銀行、國家電網(wǎng)一起推出了金融、能源行業(yè)大模型(非生成式),且目前已有11個行業(yè)大模型(非生成式)的輸出,但具體到最新的生成式行業(yè)大模型的應(yīng)用落地上,還得等幾個月時間,預(yù)計會在今年之內(nèi)實現(xiàn)。

      一個毋庸置疑的事實是,即使離落地還有一段距離,但大家的確都在奔著這一方向去努力。畢竟,國內(nèi)絕大部分企業(yè)的一大特色正是需要*時間考慮落地問題,將做的東西盡快變現(xiàn)。而大模型也只有跟用戶的場景去進行大量結(jié)合,才能不斷自我進化、修正和完善。正如科大訊飛董事長劉慶峰在6月9日的一場發(fā)布會上的斷言,在大模型領(lǐng)域,“誰能在具備社會剛需的應(yīng)用場景落地,誰就能*形成自我造血的良性循環(huán)。”

      “我們首先要把目前已經(jīng)達到的能力,盡快去落地,其次則是在語言模型的基礎(chǔ)上去做多模態(tài)的擴充。”宋健告訴數(shù)智前線,這是他們現(xiàn)階段*先級要解決的兩大問題。為此,他們最近已經(jīng)在將一款基于自研大模型的產(chǎn)品——虛擬助播進行市場推廣。據(jù)介紹,基于自有大語言模型GenSense數(shù)智姜尚,虛擬助播將可以與主播及評論區(qū)進行順暢對話,并保證快速抓屏回答問題、反饋低延時和高識別準(zhǔn)確率。

      不過,宋健也發(fā)現(xiàn),在行業(yè)大模型落地的過程中,仍然有不少困難和挑戰(zhàn)需要去解決。其中最關(guān)鍵的就在于,當(dāng)把大模型的能力落到某個實際場景的應(yīng)用產(chǎn)品上時,由于沒有參照,其實是并不好判斷具體該如何用這些模型的,“還是要做非常多的方法的革新,以及處理方式的變化”。

      例如在將虛擬助播這個產(chǎn)品用到電商直播場景時,由于每個直播間并不一樣,賣的產(chǎn)品品類也不盡相同,進而導(dǎo)致促銷方式也大為不同,因此往往需要精確挖掘每個直播間的需求,探索在成本可控的情況下,如何更好地讓不同直播間的數(shù)據(jù)和語言大模型去做結(jié)合。“是利用微調(diào),還是用外部數(shù)據(jù),又或是通過插件的方式進行,這些東西在不同場景下,用法其實是不一樣的,得到的結(jié)果也不一樣。”宋健解釋說。

      他判斷,在今年下半年,大部分的行業(yè)企業(yè)可能都會將主要的時間花在如何把大模型用下去上,反而是大模型本身怎么煉制這些東西不再是重點。

      當(dāng)然,行業(yè)大模型的故事其實才剛剛開始。各行各業(yè)的玩家們,都對它寄予了不小的期望。

      宋健所在的數(shù)字人行業(yè),寄希望于大模型能夠讓數(shù)字人成功邁入下一階段,即變得具有成長性、全面?zhèn)性化,而不是像以前一樣“千篇一律”。而魏佳星認為,大模型短期內(nèi)有望提高智能客戶的智能度,并提高增強其事后的BI能力,長期則有可能形成完全基于生成式的AI智能客服。更多的人,希望它能賦能工業(yè)質(zhì)檢、醫(yī)療導(dǎo)診、教學(xué)等諸多更廣泛的場景。

      “但從邏輯上講,行業(yè)大模型一定會是在精度相對較低、容錯率較高的行業(yè)先引用,再到精度要求高的地方去。”魏佳星表示。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。