合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機器也能說人話了?
  • 首頁 > 云計算頻道 > 大模型

    垂直行業(yè)大模型“封神”背后,AI數(shù)據(jù)服務(wù)走入“深水區(qū)”

    2023年09月26日 17:57:46   來源:智能相對論

      由ChatGPT掀起的這股大模型浪潮,從通用領(lǐng)域席卷垂直領(lǐng)域,F(xiàn)階段,越來越多的行業(yè)都在開發(fā)專用垂直細(xì)分賽道的大模型產(chǎn)品,以加速AI應(yīng)用的場景化落地進程。

      譬如,在電商領(lǐng)域,平臺和商家正在利用大模型重塑各個零售環(huán)節(jié)。如智能導(dǎo)購,可基于消費者的海量消費數(shù)據(jù)為其提供商品推薦、商品挑選攻略、行程建議等。同時,大模型還能理解海量商品的詳情數(shù)據(jù),快速生成電商運營需要的商品主圖、營銷海報、詳情頁等等。

      除此之外,電商垂類大模型在智能客服、供應(yīng)鏈優(yōu)化等場景上也都能基于海量數(shù)據(jù)的深度學(xué)習(xí),快速掌握特定的售前售后話術(shù)、供應(yīng)鏈訂單處理等,全方位革新電商領(lǐng)域的零售模式和消費體驗。

      隨著應(yīng)用成果的落地,垂直行業(yè)大模型的價值正在釋放,數(shù)字生產(chǎn)力持續(xù)提升。而作為人工智能三駕馬車之一的數(shù)據(jù)要素也在這個時刻被提上新的戰(zhàn)略高度——不難發(fā)現(xiàn),垂直行業(yè)大模型的價值釋放離不開海量數(shù)據(jù)的支持。對應(yīng)的,上游的AI數(shù)據(jù)服務(wù)商已經(jīng)針對數(shù)據(jù)層面提出了新的解決方案。在2023年中國國際服務(wù)貿(mào)易交易會期間,國內(nèi)頭部AI數(shù)據(jù)服務(wù)廠商云測數(shù)據(jù)在去年發(fā)布的“AI工程化的數(shù)據(jù)解決方案”基礎(chǔ)上全面升級,重點面向垂直行業(yè)大模型提出了全生命周期的AI數(shù)據(jù)解決方案,為大模型應(yīng)用落地提供關(guān)鍵支撐。

      以大模型應(yīng)用為支點,在大量市場場景需求的撬動下,人工智能產(chǎn)業(yè)鏈上下游的板塊正在迎來全新變革,數(shù)據(jù)層面的升級已經(jīng)躍然紙上。

      大模型應(yīng)用“封神”的背后,是什么樣的AI數(shù)據(jù)服務(wù)在支持?

      大模型的爆發(fā)加速了人工智能的應(yīng)用進程,同時也對整個算法產(chǎn)業(yè)鏈帶來了新的挑戰(zhàn)。在數(shù)據(jù)層面,過去生產(chǎn)數(shù)據(jù)、收集數(shù)據(jù)、加工數(shù)據(jù)、存儲數(shù)據(jù)等流程就不再適用當(dāng)前的市場需求,或者說無法高效地、很好地解決新出現(xiàn)的問題。

      下游的AI應(yīng)用融入大模型技術(shù)進行全新升級,上游的AI數(shù)據(jù)服務(wù)也同樣面臨著變革。那么,什么樣的AI數(shù)據(jù)服務(wù)才是垂直行業(yè)大模型場景下需要的、適用的?

      一、標(biāo)準(zhǔn)化

      垂直行業(yè)大模型技術(shù)成果涌現(xiàn)的背后,對應(yīng)是AI數(shù)據(jù)需求大幅增長。如何滿足大幅增長的場景化數(shù)據(jù)需求,首要不是盲目擴大數(shù)據(jù)生產(chǎn),而是提高AI數(shù)據(jù)的通用性、易用性,也就是標(biāo)準(zhǔn)化的問題,避免AI數(shù)據(jù)服務(wù)做“無用功”,保證數(shù)據(jù)的真實、有效、易用是滿足垂直行業(yè)大模型爆發(fā)式增長需求的關(guān)鍵。

      譬如,在智能網(wǎng)聯(lián)汽車行業(yè),《智能網(wǎng)聯(lián)汽車激光雷達點云數(shù)據(jù)標(biāo)注要求及方法》(T/CSAE 213-2021)、《智能網(wǎng)聯(lián)汽車場景數(shù)據(jù)圖像標(biāo)注要求與方法》(T/CSAE 212-2021)等團體標(biāo)準(zhǔn)的發(fā)布,就為智能網(wǎng)聯(lián)汽車的研發(fā)和測試提供了一套切實可行的場景數(shù)據(jù)點云標(biāo)注方法,很好地推動了智能網(wǎng)聯(lián)汽車的研發(fā)和測試。

      其中最直觀的感受則在于,過去AI數(shù)據(jù)服務(wù)行業(yè)各企業(yè)對圖像標(biāo)注的要求與方法都各不相同,標(biāo)注結(jié)果文件各異,嚴(yán)重影響后續(xù)數(shù)據(jù)的統(tǒng)一使用。隨著相關(guān)標(biāo)準(zhǔn)的發(fā)布,對標(biāo)注流程和標(biāo)注結(jié)果的保存形式都進行了規(guī)范,進而提升標(biāo)注數(shù)據(jù)的通用性。

      而在這個過程中,行業(yè)TOP地位的廠商往往都是標(biāo)準(zhǔn)的引領(lǐng)者,促使其在接下來的市場規(guī)范中獲得了更大的話語權(quán)和主動權(quán)。譬如,以上智能網(wǎng)聯(lián)汽車場景數(shù)據(jù)的兩大標(biāo)準(zhǔn),背后都有云測數(shù)據(jù)的參與。

      這家頭部AI數(shù)據(jù)服務(wù)商在參與標(biāo)準(zhǔn)制定,為行業(yè)攻陷自家經(jīng)驗和技術(shù)能力的同時,也更快、更好地掌握了數(shù)據(jù)標(biāo)注相關(guān)場景的標(biāo)準(zhǔn)化,并應(yīng)用到自家的產(chǎn)品和解決方案中。其中,基于對行業(yè)標(biāo)準(zhǔn)化的理解,云測數(shù)據(jù)發(fā)布的面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案不僅能提供大規(guī)模感知數(shù)據(jù)能力,還能智駕企業(yè)減少數(shù)據(jù)采集周期,提升數(shù)據(jù)標(biāo)注效率,降本增效,助力相關(guān)企業(yè)在數(shù)據(jù)層面實現(xiàn)研發(fā)領(lǐng)跑。

      二、工程化

      隨著大模型技術(shù)的融入,人工智能應(yīng)用進程正持續(xù)加速,而在供給端,AI數(shù)據(jù)服務(wù)也面臨著數(shù)據(jù)生產(chǎn)、收集、處理、加工、存儲等全生命周期流程的升級,從而才能滿足AI數(shù)據(jù)的大幅度增長需求。簡單來說,對應(yīng)AI工程化的大趨勢,AI數(shù)據(jù)服務(wù)也迎來了工程化的深度升級。

      這里,云測數(shù)據(jù)發(fā)布的“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”呈現(xiàn)出來的結(jié)果就是一條相對清晰的路徑——通過豐富的數(shù)據(jù)標(biāo)注工具、成熟的API集成能力、高效的數(shù)據(jù)閉環(huán),加上人員管理及項目管理體系以及安全交付軟硬件支持的方式,云測數(shù)據(jù)在保證數(shù)據(jù)隱私安全的環(huán)境下,對垂直行業(yè)大模型所需的海量數(shù)據(jù)實現(xiàn)了全生命周期管理。

      更直觀來說,對應(yīng)AI數(shù)據(jù)服務(wù)的各個流程環(huán)節(jié),云測數(shù)據(jù)都能提供對應(yīng)的工具、技術(shù)能力、管理體系,好似成熟的制造生產(chǎn)線一般,一步步地完成數(shù)據(jù)從無到有的生產(chǎn),從粗糙到精細(xì)的加工等目標(biāo),以供下游的垂直行業(yè)大模型用于預(yù)訓(xùn)練。

      以基礎(chǔ)的數(shù)據(jù)標(biāo)注為例,云測數(shù)據(jù)目前提供了相對全面的平臺工具模塊,包括了點云融合跟蹤、OCR文字轉(zhuǎn)寫、視頻標(biāo)注、語音轉(zhuǎn)寫、語音切割、文本判斷、文本生成等等,充分滿足行業(yè)垂直大模型的多模態(tài)數(shù)據(jù)標(biāo)注需求。

      三、場景化

      今年以來,市場的焦點從通用大模型轉(zhuǎn)向了垂直行業(yè)大模型,其背后是對技術(shù)應(yīng)用落地的追求,同時也釋放了一個足以撬動整條人工智能產(chǎn)業(yè)鏈的趨勢——場景化。在AI數(shù)據(jù)服務(wù)領(lǐng)域,廠商不再盲目追求廣泛的海量數(shù)據(jù),而是針對某一特定領(lǐng)域或場景的有效數(shù)據(jù)。

      場景的聚焦是加速垂直行業(yè)大模型落地的關(guān)鍵,同時也意味著更高要求的AI數(shù)據(jù)服務(wù)。以智能網(wǎng)聯(lián)汽車為例,云測數(shù)據(jù)為其提供的AI數(shù)據(jù)解決方案目前就包括三部分,分別為基礎(chǔ)數(shù)據(jù)庫、定制化數(shù)據(jù)采集和標(biāo)注服務(wù)以及包括數(shù)據(jù)采集標(biāo)注、數(shù)據(jù)管理的全方位數(shù)據(jù)工具鏈。

      簡單來說,隨著場景化趨勢的發(fā)展,AI數(shù)據(jù)服務(wù)的定制化將越來越深入,不僅要針對某一特定行業(yè)或場景提供專業(yè)服務(wù),還有可能聚焦某一公司或某一技術(shù)模塊提供高度定制化數(shù)據(jù)服務(wù)。

      同時,基于場景化的AI數(shù)據(jù)需求也遠超常規(guī),隨著行業(yè)大模型的持續(xù)升級,場景的細(xì)分也會越來越精細(xì),對應(yīng)的數(shù)據(jù)需求更加嚴(yán)格。在與「智能相對論」的交流中,云測數(shù)據(jù)總經(jīng)理賈宇航就提到,在智能網(wǎng)聯(lián)汽車領(lǐng)域,為滿足相關(guān)場景的豐富性,云測數(shù)據(jù)可以需要提供包含數(shù)據(jù)采集、數(shù)據(jù)生產(chǎn)、平臺工具在內(nèi)的AI數(shù)據(jù)服務(wù),從而滿足相關(guān)大模型的預(yù)訓(xùn)練需求。

      總的來說,對應(yīng)人工智能產(chǎn)業(yè)鏈上下游的關(guān)系,AI數(shù)據(jù)服務(wù)需要服務(wù)于垂直行業(yè)大模型的需求,F(xiàn)階段,垂直行業(yè)大模型加速落地,需要更多、更有效、更精準(zhǔn)的場景數(shù)據(jù),AI數(shù)據(jù)服務(wù)的升級有跡可循。

      AI數(shù)據(jù)服務(wù)走入“深水區(qū)”,頭部廠商如何繼續(xù)保持引領(lǐng)?

      市場趨勢的變化往往最先被行業(yè)TOP廠商所感知和反饋。在AI數(shù)據(jù)服務(wù)領(lǐng)域,云測數(shù)據(jù)提出“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”,站在下半年垂直行業(yè)大模型進一步爆發(fā)的節(jié)點上將繼續(xù)引領(lǐng)AI數(shù)據(jù)服務(wù)行業(yè)。

      那么,只是純粹的進場快,就能實現(xiàn)行業(yè)引領(lǐng)嗎?顯然不是。

      結(jié)合垂直行業(yè)大模型發(fā)展的市場需求,云測數(shù)據(jù)的“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”所呈現(xiàn)出來的更關(guān)鍵的價值在于其背后三大思維。

      一、聚焦賽道,重視價值回歸

      垂直行業(yè)大模型的爆發(fā)式增長讓“百模大戰(zhàn)”愈演愈烈,各行各業(yè)都在做相應(yīng)的大模型產(chǎn)品,呈現(xiàn)出來的市場機會很多,但是對應(yīng)的AI數(shù)據(jù)服務(wù)需求也在升級。這就意味著不能用通用思維來做垂直行業(yè)大模型的AI數(shù)據(jù)服務(wù),也很難有能力把所有行業(yè)都覆蓋。

      那么,在這個過程,廠商就需要有所取舍。目前,云測數(shù)據(jù)“面向垂直行業(yè)大模型AI數(shù)據(jù)服務(wù)解決方案”主要落地在零售電商、金融保險、智能網(wǎng)聯(lián)汽車等領(lǐng)域。而這些都是云測數(shù)據(jù)從創(chuàng)立之初就聚焦深耕的行業(yè),具備相應(yīng)的數(shù)據(jù)積累、行業(yè)知識、項目經(jīng)驗以及客戶資源等。

      在云測數(shù)據(jù)總經(jīng)理賈宇航看來,云測數(shù)據(jù)做垂直行業(yè)大模型的AI數(shù)據(jù)服務(wù),首要的關(guān)鍵點是價值考量。

      一方面,要做就先做有積累、有基礎(chǔ)的領(lǐng)域——基于這個思路,云測數(shù)據(jù)在提供場景化數(shù)據(jù)采集方案的同時,也會在微調(diào)任務(wù)后對應(yīng)行業(yè)需求提供專業(yè)的評測體系和服務(wù),讓AI數(shù)據(jù)服務(wù)更有價值。

      另一方面,盡管垂直行業(yè)大模型很火,但商業(yè)化落地程度仍具有局限性。對于云測數(shù)據(jù)而言,結(jié)合過去的服務(wù)經(jīng)驗、項目經(jīng)驗篩選有市場需求的領(lǐng)域深耕,是對企業(yè)自身發(fā)展的負(fù)責(zé),避免在過熱的市場環(huán)境中迷失自我,失去發(fā)展價值。

      二、縱橫升級,強化基本功

      垂直行業(yè)大模型應(yīng)用落地是一個縱橫能力協(xié)同的過程。云測數(shù)據(jù)總經(jīng)理賈宇航將這一過程理解為“搭積木”,橫向強化底座能力,有一個穩(wěn)定的基礎(chǔ),縱向深耕場景化,對應(yīng)不同的行業(yè)進行微調(diào)、優(yōu)化,給出專業(yè)的解決方案。

      具體來看,云測數(shù)據(jù)基于AI工程化的數(shù)據(jù)服務(wù)升級,在橫向上就構(gòu)建了一套包括數(shù)據(jù)可視化、擴展工具模塊、數(shù)據(jù)權(quán)限管理體系等在內(nèi)的AI數(shù)據(jù)服務(wù)解決方案,應(yīng)對大模型預(yù)訓(xùn)練本身所需要的數(shù)據(jù)需求。

      縱向上則針對不同的場景,基于行業(yè)理解提供專精解決方案,比如對應(yīng)智能網(wǎng)聯(lián)汽車研發(fā)與測試所需要的車外環(huán)境感知、車內(nèi)智能座艙、人體動作識別等,滿足垂直行業(yè)大模型的進階需求。

      三、堅守底線,規(guī)避行業(yè)敏感點

      且不說數(shù)據(jù)領(lǐng)域本身就敏感,作為建立在海量數(shù)據(jù)之上的垂直行業(yè)大模型應(yīng)用對數(shù)據(jù)的需求就非常嚴(yán)格,數(shù)據(jù)安全是一方面,數(shù)據(jù)的獨特性、權(quán)威性、有效性則是另一方面。

      對此,云測數(shù)據(jù)作為行業(yè)TOP企業(yè)始終將數(shù)據(jù)隱私安全放在業(yè)務(wù)開展的首位。云測數(shù)據(jù)總經(jīng)理賈宇航表示,為了確保垂直行業(yè)大模型用于訓(xùn)練的數(shù)據(jù)合法合規(guī),云測數(shù)據(jù)都會與企業(yè)客戶簽訂數(shù)據(jù)授權(quán)協(xié)議。同時,云測數(shù)據(jù)在過去多年的發(fā)展中也會建立具備自由版權(quán)的數(shù)據(jù)集,以幫助更多行業(yè)客戶去獲取更多的高質(zhì)量數(shù)據(jù)。此外,云測數(shù)據(jù)更是一家滿足ISO27001和ISO27701標(biāo)準(zhǔn)的AI數(shù)據(jù)服務(wù)廠商,并先后獲得ISO9001、ISO20000、CMMI3等相關(guān)認(rèn)證。

      結(jié)語

      AI數(shù)據(jù)作為生產(chǎn)資料,是推動整個AI行業(yè)發(fā)展的必要一環(huán),也是人工智能商業(yè)化的主要驅(qū)動力之一。換句話來說,高質(zhì)量的數(shù)據(jù)決定了AI的落地程度也不為過。云測數(shù)據(jù)總經(jīng)理賈宇航曾提出類似的觀點。

      而垂直行業(yè)大模型的爆發(fā)式增長,也就意味著AI數(shù)據(jù)需求的澎湃發(fā)展。圍繞高質(zhì)量數(shù)據(jù)為需求,垂直行業(yè)大模型的落地才有真正意義的基礎(chǔ)。這是AI數(shù)據(jù)服務(wù)廠商的機會,也是人工智能產(chǎn)業(yè)突破發(fā)展的關(guān)鍵。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。