• 首頁 > 企業(yè)IT頻道 > 大數(shù)據(jù)

    數(shù)據(jù)治理,是時候打破刻板印象了

    2024年09月24日 13:27:01   來源:數(shù)智前線

      降低數(shù)據(jù)治理門檻,降低企業(yè)用好數(shù)據(jù)資產(chǎn)的門檻,讓企業(yè)數(shù)據(jù)消費更便捷。

      文|徐鑫 游勇

      過去,數(shù)據(jù)中臺面臨一些挑戰(zhàn)和誤解。由于動輒投入成百上千萬元,數(shù)據(jù)中臺曾給人留下了又貴又重的印象。高昂的建設成本,成了數(shù)據(jù)量不大的中小企業(yè)的攔路虎,但同時,這些企業(yè)對數(shù)據(jù)建設和治理有旺盛需求。

      更大的問題在于,狂飆猛進的技術演進對企業(yè)數(shù)據(jù)治理框架的可擴展性提出了新的挑戰(zhàn)。Gartner報告就指出,到2028年,50%構建于2023年之前的中國數(shù)據(jù)分析和AI平臺,也將因為與生態(tài)系統(tǒng)脫鉤而過時。數(shù)據(jù)建設領域正呼喚一場革新。

      日前,阿里巴巴集團副總裁、瓴羊CEO朋新宇在云棲大會瓴羊Data×AI專場論壇中指出,企業(yè)要擁抱AI時代,需要完成場景解構、業(yè)務重構。其中,數(shù)據(jù)基礎設施領域也正在迎來一波重構浪潮。

      針對行業(yè)里數(shù)據(jù)治理高成本和難擴展等建設難題,瓴羊Dataphin產(chǎn)品全面升級,新推出的敏捷版用以解決企業(yè)數(shù)據(jù)量不大但需構建數(shù)據(jù)的場景問題,Dataphin可演進擴展的數(shù)據(jù)架構體系為企業(yè)數(shù)據(jù)治理預留發(fā)展空間,基于大模型打造的DataAgent更是為企業(yè)用好數(shù)據(jù)資產(chǎn)提供了便利。

      01

      數(shù)據(jù)治理正當時

      數(shù)據(jù)建設和治理,最為人熟知的概念可能就是數(shù)據(jù)中臺。

      幾年前,大數(shù)據(jù)浪潮席卷全球,各行各業(yè)的先鋒企業(yè)都十分重視挖掘企業(yè)的數(shù)據(jù)價值。2017年時,《經(jīng)濟學人》還在一篇封面文章提及,數(shù)據(jù)已取代石油,成為世界最有價值的資源。

      當時,一批積攢了大量數(shù)據(jù)的先鋒企業(yè)率先意識到,要打破企業(yè)內(nèi)的數(shù)據(jù)孤島,集中管理、統(tǒng)一處理企業(yè)內(nèi)部數(shù)據(jù)的重要性,“數(shù)據(jù)中臺”概念應時而出,阿里作為數(shù)據(jù)中臺理念的提出者也率先在企業(yè)內(nèi)建設數(shù)據(jù)中臺并面向企業(yè)提供產(chǎn)品和服務。一批傳統(tǒng)行業(yè)的龍頭企業(yè),也從戰(zhàn)略布局、積極求變的角度,將數(shù)據(jù)中臺建設作為整合內(nèi)部海量數(shù)據(jù)資產(chǎn),充分發(fā)揮數(shù)據(jù)價值的重要抓手。

      也由于先期入局者自身的數(shù)據(jù)復雜度高,規(guī)模體量大,在數(shù)據(jù)治理和建設時,投入巨大,建設周期也比較長。這使得行業(yè)內(nèi)也產(chǎn)生過一些爭議,比如一位行業(yè)內(nèi)人士就曾觀察,數(shù)據(jù)中臺投入大,效果難量化,在一般規(guī)模的企業(yè)難落地。

      今年Gartner在《中國數(shù)據(jù)分析及人工智能成熟度周期》報告里就把“數(shù)據(jù)中臺”概念列為逐步過時的技術發(fā)展區(qū)間。

      不過,行業(yè)資深人士認為,不能僅從產(chǎn)品和工具的層面來理解“數(shù)據(jù)中臺”,也不能僅從概念熱度來看“數(shù)據(jù)中臺”的價值。

      “數(shù)據(jù)中臺更是一種理念和模式,它意味著,對一家企業(yè)來說,數(shù)據(jù)資產(chǎn)是企業(yè)資產(chǎn)的重要組成部分。對于這一重要資產(chǎn),企業(yè)需要有一種方式,把數(shù)據(jù)整合,統(tǒng)一清洗、加工和治理,從而形成便于利用的數(shù)據(jù)資產(chǎn)。”上述人士說。

      Gartner在報告里也提到,當下的技術浪潮下,圍繞著數(shù)據(jù)集成、元數(shù)據(jù)管理和數(shù)據(jù)質量等技術能力建設相關的“數(shù)據(jù)基建”正處于快速上升期,它將是企業(yè)內(nèi)數(shù)據(jù)分析和AI應用的可復用基座。“數(shù)據(jù)中臺”所代表的理念仍然在引領行業(yè)發(fā)展,同時技術層面也在繼續(xù)高速演進。

      另外,國家政策層面推進數(shù)據(jù)要素市場化,也在讓廣大企業(yè)加速構建更全面的數(shù)據(jù)治理和應用能力。

      今年1月1日,《企業(yè)數(shù)據(jù)資源相關會計處理暫行規(guī)定》(以下簡稱《暫行規(guī)定》)正式實施,上市公司的數(shù)據(jù)資源作為新增會計科目列示在資產(chǎn)負債表下,構成股東權益的一部分。據(jù)中國證券報統(tǒng)計,截止今年8月31日,39家上市公司披露數(shù)據(jù)入表相關情況,總金額達到13.57億元。對不少企業(yè)而言,如何實現(xiàn)全域的數(shù)據(jù)治理,構建數(shù)據(jù)資產(chǎn),甚至成為一道必答題。

      業(yè)界的共識是,這些走在前列的企業(yè),之所以能率先實現(xiàn)數(shù)據(jù)資產(chǎn)入表,與它們對數(shù)據(jù)治理工作的長期且持續(xù)的重視密不可分。

      在宏觀政策和科技浪潮的推動下,以數(shù)據(jù)驅動業(yè)務發(fā)展的理念日益深入人心,越來越多的企業(yè)意識到了數(shù)據(jù)治理平臺和數(shù)據(jù)資產(chǎn)建設的重要性。

      在這股浪潮里,中小企業(yè)的需求也已經(jīng)不容小覷。比如瓴羊副總裁王賽就看到,中小型企業(yè)有強烈的數(shù)據(jù)治理及數(shù)據(jù)資產(chǎn)建設的需求。“企業(yè)的數(shù)據(jù)量相比龍頭企業(yè)們可能不是很大,但有復雜度和多樣性,這些企業(yè)需要把這些數(shù)據(jù)做一些輕度的治理。”

      但這些企業(yè)的數(shù)據(jù)治理之路面臨不少問題。“中小企業(yè)大數(shù)據(jù)相關的人才儲備可能不足,也沒有太多的預算投入到數(shù)據(jù)治理領域。”一位資深人士認為,許多企業(yè)還對數(shù)據(jù)資產(chǎn)建設和數(shù)據(jù)治理的認知也有所欠缺。

      基于這些痛點,瓴羊把基于阿里巴巴內(nèi)部數(shù)據(jù)治理的經(jīng)驗,加之服務外部大型企業(yè)客戶打造推出的智能數(shù)據(jù)建設與治理平臺Dataphin,進行了輕量化改造,推出Dataphin敏捷版。

      在新推出的Dataphin敏捷版中,產(chǎn)品的架構變得更輕量,能夠幫助中小型企業(yè)更低成本地啟動數(shù)據(jù)治理。以對操作人員的要求為例,Dataphin的敏捷版能兼容關系型數(shù)據(jù)庫,企業(yè)的數(shù)據(jù)管理人才無需掌握大數(shù)據(jù)前沿技術,只需掌握SQL就能操作,后續(xù)的運維難度也很小,大大降低了數(shù)據(jù)治理的人才門檻。

      “企業(yè)最低只需要投入三臺硬件設備,投資僅二三十萬元就能基于Dataphin敏捷版,啟動數(shù)據(jù)治理工作。”瓴羊數(shù)據(jù)系統(tǒng)產(chǎn)品線總經(jīng)理董芳英告訴數(shù)智前線。這也意味著,相比于之前功能強大、架構復雜的Dataphin版本,廣大中小企業(yè)現(xiàn)在多了一個選擇。

      02

      數(shù)據(jù)治理,如何兼顧當前和長遠

      當數(shù)據(jù)量較小的企業(yè),在開啟數(shù)據(jù)治理工作后,都會考慮一個問題:隨著業(yè)務發(fā)展,數(shù)據(jù)量變得龐大之后,是否需要重新更換一套系統(tǒng)?是否會給未來的數(shù)據(jù)治理留下麻煩?

      比如國內(nèi)一家頭部零售企業(yè),這些年遇到了“成長的煩惱”。由于業(yè)務布局廣泛,企業(yè)數(shù)據(jù)需求的復雜程度和處理難度變得極高。

      此前,他們基于業(yè)務的實際需求,構建了許多不同功能的業(yè)務應用系統(tǒng)。但由于企業(yè)發(fā)展多品牌多渠道,數(shù)據(jù)量變得極為龐大。同時,不同的業(yè)務數(shù)據(jù)在不同的系統(tǒng)里,存在數(shù)十個獨立的數(shù)據(jù)煙囪。另外,不同的業(yè)務線的數(shù)據(jù)定義還不一樣,數(shù)據(jù)治理的難度變得極大。

      之所以出現(xiàn)這種情況,與企業(yè)缺乏長期的數(shù)據(jù)治理視角有關,此前的數(shù)據(jù)架構都是從孤立的業(yè)務需求出發(fā)。這家企業(yè)的數(shù)據(jù)負責人也把數(shù)據(jù)中臺建設當成了一項長期工作,為此他們還形成了未來三到五年的規(guī)劃,來建設企業(yè)的數(shù)據(jù)中臺。

      無獨有偶,另一家消費金融企業(yè)的數(shù)據(jù)負責人也察覺到了數(shù)據(jù)治理的建設思路需要發(fā)生變化,“之前更重視產(chǎn)生了什么數(shù)據(jù),哪些業(yè)務流程是可以數(shù)字化的,以及數(shù)據(jù)合規(guī)問題”,但他發(fā)現(xiàn)往后看5年,隨著企業(yè)數(shù)據(jù)量越來越大,傳統(tǒng)的數(shù)倉建設思路已經(jīng)不能再支撐企業(yè)的存數(shù)、管數(shù)、用數(shù)的需求。

      這也是不少企業(yè)在數(shù)據(jù)治理中的共性問題——數(shù)據(jù)架構如何為未來的發(fā)展預留出空間,從而滿足未來更多更復雜的數(shù)據(jù)治理需求。

      基于這一行業(yè)普遍痛點,瓴羊的Dataphin產(chǎn)品創(chuàng)新性推出了數(shù)據(jù)系統(tǒng)的全新架構。這套架構的一個核心特點是可擴展、可演進。

      簡單來說,小企業(yè)可以基于自身的考量,在早期選擇輕量化且低成本的Dataphin敏捷版產(chǎn)品。而隨著企業(yè)的規(guī)模擴大,企業(yè)可以擴展底層的算力引擎,自如地向上升級,平滑演進,滿足未來的數(shù)據(jù)治理需求和企業(yè)業(yè)務發(fā)展需要。而這得益于Dataphin敏捷版和原生版本之間采用了同一套底層架構。

      這有利于滿足企業(yè)數(shù)據(jù)規(guī)模擴大后更復雜的數(shù)據(jù)治理需求。從敏捷版升級到Dataphin智能研發(fā)版后,底層的數(shù)據(jù)庫可從關系型擴展為交互式、MPP類數(shù)據(jù)庫,比如StarRocks、ClickHouse、Hologres、Lindorm、Impala等分析能力更強,算力更強的數(shù)據(jù)庫等,從而支撐起更多維的數(shù)據(jù)調度和運維等治理任務。

      而隨著企業(yè)規(guī)模的進一步擴大,企業(yè)底層的數(shù)據(jù)支撐還能進一步升級成大數(shù)據(jù)引擎,甚至可擴展支持湖倉一體。“小型、中型和大型,我們都在一套部署結構之下,可以幫助企業(yè)無縫升級。”王賽說。

      這考慮到了企業(yè)數(shù)據(jù)治理的長期發(fā)展特性,企業(yè)可以自如地基于自身的數(shù)據(jù)規(guī)模和治理要求,選擇合適的產(chǎn)品。

      另外,在數(shù)據(jù)治理和運營領域,企業(yè)還面臨另一大問題,朋新宇將之界定為個性化和和性價比之間的矛盾。大企業(yè)基于自身的業(yè)務需求,往往追求私有化部署,但這也意味著更高成本。而標準化的云產(chǎn)品明顯更便宜,但也失去了個性化配置的能力。

      針對這個問題,瓴羊Dataphin的解題思路是,在傳統(tǒng)的公共云租戶模式和私有化部署之外,給企業(yè)提供“半托管”模式,既能獨享可控的環(huán)境,又能享受公共云的彈性調度。

      比如,一些集團型企業(yè),不同的業(yè)務模塊或者子業(yè)務的數(shù)據(jù)處理要求不一樣。一些財務類、會員類的數(shù)據(jù)要求本地運行計算,另外一些安全敏感性不高的數(shù)據(jù)可以上云,與云上業(yè)務聯(lián)動及數(shù)據(jù)處理。

      這類企業(yè)就適合半托管模式,相比公共云模式的“租公寓”式服務,和獨立物理部署的“造別墅”式服務,半托管類似于“租獨棟別墅”,既能滿足這些希望提升數(shù)據(jù)處理能力,具有個性化定制需求,但同時考量經(jīng)濟性的企業(yè)的需求。

      總體而言,在數(shù)據(jù)治理和數(shù)據(jù)運營領域,Dataphin正基于阿里巴巴集團多年數(shù)據(jù)治理的系統(tǒng)化建設經(jīng)驗,為大中小不同規(guī)模的企業(yè),提供橫跨多類引擎,適應多種環(huán)境要求的,可擴展可升級的產(chǎn)品。

      數(shù)據(jù)治理領域,企業(yè)正迎來按需采購、自如升級的新階段。

      03

      AI時代,如何讓數(shù)據(jù)真正用起來

      董芳英看過很多數(shù)據(jù)治理平臺的項目,她發(fā)現(xiàn)一個規(guī)律,如果對方是一個純IT團隊,沒有數(shù)據(jù)資產(chǎn)運營的理念,這類項目的成功率往往不會很高。

      數(shù)據(jù)如果只存儲在數(shù)據(jù)庫里,只會成為成本和負擔。“我們刻在骨子里的理念就是數(shù)據(jù)構建好之后,一定要把數(shù)據(jù)用起來。”董芳英告訴數(shù)智前線。所以,瓴羊非常強調資產(chǎn)運營,光把數(shù)據(jù)聚合在一起還不夠,還要讓數(shù)據(jù)更好地用起來。

      而要讓企業(yè)用好數(shù)據(jù),客觀存在著一個巨大的鴻溝。董芳英發(fā)現(xiàn),表面看企業(yè)有數(shù)據(jù),業(yè)務有問題,把二者匹配就解決了問題,但兩者如何連接起來面臨巨大的考驗。

      對業(yè)務人員而言,理解業(yè)務和理解數(shù)據(jù)是兩碼事。很多時候業(yè)務人員缺乏數(shù)據(jù)思維,數(shù)據(jù)獲取依然要求助于數(shù)據(jù)專家,這面臨著大量的溝通和時間成本。

      而在具體的獲取數(shù)據(jù)環(huán)節(jié),數(shù)據(jù)團隊壓力也很大。他們經(jīng)常會面臨大量的關于數(shù)據(jù)在哪里、數(shù)據(jù)是什么意思、該如何使用、在哪里使用的咨詢。并且,要在海量的數(shù)據(jù)資產(chǎn)中找到想要的數(shù)據(jù),也并不容易。

      這反映出,企業(yè)用數(shù)需求,不止是從Chatbot中獲得一個具體的數(shù)據(jù)結果,還涉及到基于業(yè)務去找到和使用好內(nèi)部的數(shù)據(jù)資產(chǎn)的需求。董芳英提到一個具體的例子,她經(jīng)常碰到客戶提這樣的問題:企業(yè)的商機轉化率低,有什么樣的數(shù)據(jù)能解決問題?

      解決問題的核心在業(yè)務流程里,先回到業(yè)務中,問題涉及哪些人員和組織,涉及哪些流程,這樣才有可能給用戶有價值的指導,而不是就數(shù)據(jù)返回一個數(shù)據(jù)結果。

      從這一痛點出發(fā),瓴羊今年推出業(yè)內(nèi)首個數(shù)據(jù)資產(chǎn)智能體——Dataphin·DataAgent,在大模型的加持下,用戶能自定義專屬的Agent,業(yè)務人員能更便捷實現(xiàn)從問題到思路、數(shù)據(jù)、用法的全鏈路自助化操作。

      “未來每個人都有一個專屬的數(shù)據(jù)助手。”王賽說,它不只是工具層面幫用戶取數(shù),還能幫助連接業(yè)務,輸入問題后直接給到數(shù)據(jù)視角的內(nèi)容。

      某一家頭部乳業(yè)品牌的數(shù)據(jù)中臺已經(jīng)建設多年,形成了超過20個數(shù)據(jù)域,上千指標,幾百用戶標簽和近百個應用。但目前業(yè)務的需求總是通過數(shù)據(jù)工程師人工滿足,業(yè)務人員覺得響應慢,而工程師又被壓得喘不過氣來,F(xiàn)在通過Dataphin的智能DataAgent,每次都能快速找到資產(chǎn),研發(fā)效率翻倍。

      這個過程里,Dataphin·DataAgent的三大能力也展露無遺。首先是基于全域的數(shù)據(jù)資產(chǎn),可以快速便捷幫助企業(yè)構建向量數(shù)據(jù)庫,完成知識庫的搭建;其次是,基于對知識庫的理解,提供了不少輔助工具和元素化的交互能力,加速智能體的設計和編排;再次,數(shù)據(jù)智能體一鍵發(fā)布,能幫助企業(yè)更方便去消費數(shù)據(jù)。

      DataAgent平臺背后,瓴羊還提供了一整套解決方案,底層是基于Dataphin的全域資產(chǎn),這也是區(qū)別一般智能Agent之處。模型能力上,接入了通義千問模型,用戶還可基于百煉平臺按需求選擇其他模型。

      大模型升級后,效果也非常明顯。以前在數(shù)據(jù)資產(chǎn)平臺搜索,只能進行關鍵詞關聯(lián),現(xiàn)在通過Dataphin·DataAgent不僅僅可以把相關數(shù)據(jù)一并列出,還能基于業(yè)務需求,挖掘數(shù)據(jù)資產(chǎn),把關鍵數(shù)據(jù)信息一目了然呈現(xiàn)。

      從降低中小企業(yè)啟動數(shù)據(jù)治理的門檻,到降低企業(yè)兼具個性化和性價比的前提下用好數(shù)據(jù)資產(chǎn)的門檻,到基于DataAgent智能體更便捷地消費和使用數(shù)據(jù),瓴羊的數(shù)據(jù)產(chǎn)品和服務正在重構企業(yè)數(shù)據(jù)服務的價值。

      文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    唯品會雙11銷量前十品牌中有7個國貨品牌

    11月11日,據(jù)網(wǎng)經(jīng)社數(shù)字零售臺(DR.100EC.CN)數(shù)據(jù)顯示,秋冬服飾仍是雙11的C位,女士針織衫、女士外套、女士羽絨服等位居服飾消費前列,女士夾克銷量同比增長72%,女士棉衣、女士羊毛衫銷量同比增長50%以上。男士外套銷量同比增長30%以上。

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。