合合信息啟信產業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產量突破 100 萬輛,到 2027 年建成萬億級產業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或將停產沖上熱搜!閑魚相關搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術邂逅千年色彩美學!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領域三星新專利探索AR技術新應用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機器也能說人話了?
  • 首頁 > 企業(yè)IT頻道 > 軟件即服務

    火山引擎數(shù)智平臺VeDI發(fā)布 字節(jié)跳動羅旋談企業(yè)數(shù)據(jù)實踐

    2022年09月06日 15:01:29   來源:中文科技資訊

      9月2日,火山引擎V-Tech數(shù)據(jù)智能科技峰會召開,峰會上新一代企業(yè)級數(shù)據(jù)產品火山引擎數(shù)智平臺VeDI正式發(fā)布。

      字節(jié)跳動數(shù)據(jù)平臺負責人羅旋表示:“增長,源于每個人做的每一次正確的決策,從戰(zhàn)略、管理到執(zhí)行。而決策是否正確,在沒有數(shù)據(jù)驅動的情況下,更像是一種玄學。數(shù)據(jù)驅動能夠讓決策方法變得更科學,而更科學的決策也就會無限趨近于正確。”

      本文根據(jù)羅旋演講內容整理。

      字節(jié)跳動的數(shù)據(jù)文化、工具與組織

      大家好,我是羅旋,負責字節(jié)跳動數(shù)據(jù)平臺。

      首先我們來看一個,經常被問到的問題:字節(jié)跳動的增長,是如何實現(xiàn)的?相信大家也都看過網(wǎng)上很多分析文章,也有些自己的判斷,有說運氣好的,有說戰(zhàn)略決勝的,有說賽道選的好,也有說網(wǎng)狀組織結構先進的……這些可能都對,但也比較局部。今天我想從數(shù)據(jù)驅動角度來解釋一下這件事情。

      一,數(shù)據(jù)文化提升意識。

      字節(jié)跳動是一家非常注重數(shù)據(jù)的公司,甚至連一開始給“今日頭條”這個APP取名也是靠A/B測試。可以說,字節(jié)跳動是一家數(shù)據(jù)驅動的“數(shù)字原生”公司。作為一家把數(shù)據(jù)驅動作為文化基因的公司,字節(jié)跳動在各個角色、層級,從CEO、高管、中層管理者,到一線員工,都非常廣泛、細致地使用、依賴數(shù)據(jù)。對數(shù)據(jù)的依賴和應用程度,都是業(yè)界比較領先的。

    1.png

      從高管的視角來看,很多宏觀層面問題需要被解決,如公司的經營狀況如何,收支狀況怎么樣,團隊是否健壯,組織是太肥了還是太瘦了,宏觀經濟形勢如何,公司策略是否要隨之調整……而在字節(jié)跳動,這樣的信息,都必須用數(shù)據(jù)指標,來描述和支撐,我們會把它們分類整理,承載到管理駕駛艙上。從覆蓋面和精細度來說,我們有上千個數(shù)據(jù)指標,使用頻度也很高,每天都有大量訪問。甚至有管理層手繪設計圖,來討論這些數(shù)據(jù)應該如何組織,數(shù)據(jù)產品應該如何交互。

      最高決策層往下,就是各業(yè)務的中層管理者們。他們除了關心某個業(yè)務板塊的進展是否良好,有哪些待突破點等業(yè)務問題之外,也有很重的團隊日常管理工作。很多企業(yè),都會用數(shù)據(jù)來監(jiān)測各項業(yè)務指標。但在是字節(jié)跳動,我們不僅監(jiān)測業(yè)務指標數(shù)據(jù),還把數(shù)據(jù)驅動用在日常管理工作中。比如,目標制定、OKR追蹤管理、周報周會的進展同步、組織效率等等,這些都有大量的指標來刻畫,并使用各種數(shù)據(jù)產品來跟進、追蹤、對齊。

      對一線同學來說,場景就更廣泛多元了。每個月直接使用數(shù)據(jù)產品的一線同學就超過10萬,字節(jié)一共只有十幾萬員工,這還不包括間接使用數(shù)據(jù)服務的情況。在日常的開會討論中,幾乎不可能出現(xiàn)一個會,存在沒有數(shù)據(jù)的情況,否則會被挑戰(zhàn)得很厲害。而在不同場景下,使用的精細度也非常高,甚至會有一些意想不到的地方。舉個例子,比如,在劣質內容的治理上,我們不只是用數(shù)據(jù)快速分析識別哪些是劣質內容,在對這些內容的處罰中,也會用A/B測試來進行判斷,以選擇更有效的處罰策略。

      二,數(shù)據(jù)工具推動執(zhí)行。

      通過剛剛的幾個case,大家可能對字節(jié)的數(shù)據(jù)驅動文化有了一定的感知。但光靠意念是不夠的,文化的落地需要有稱手的工具。

    2.png

      那字節(jié)跳動的同學們,用什么工具呢?這個是字節(jié)跳動數(shù)據(jù)平臺的產品架構圖。我們整體分成數(shù)據(jù)引擎層、數(shù)據(jù)建設管理層、數(shù)據(jù)分析應用層以及解決方案層。數(shù)據(jù)產品架構覆蓋了數(shù)據(jù)全生命周期的整條鏈路。如果快速總結一下,我們整體數(shù)據(jù)產品的特點,可以用兩個詞來概括,那就是敏捷和易用。

      敏捷方面,簡單來說就是更快、更靈活。

      快的方面,我們讓數(shù)據(jù)的各個環(huán)節(jié)都變快,不論是采集加工還是消費分析。比如,我們能實現(xiàn)海量數(shù)據(jù)的實時寫入、實時分析;十億級的數(shù)據(jù)的查詢可以做到亞秒級響應;搭建的實時數(shù)倉,能給正在直播的賣家們以數(shù)據(jù)反饋,讓他們及時調整自己的策略,抓住轉瞬即逝的機會。

      靈活方面,主要體現(xiàn)在數(shù)據(jù)處理模式、使用姿勢的靈活性上。我們能讓一線同學基于明細數(shù)據(jù)自助分析,而不用預定義指標;支持定制化,而不僅是固化的數(shù)據(jù)標簽。因此當我們做數(shù)據(jù)治理時,就可以自定義目標,分階段定優(yōu)先級,采用對應治理規(guī)則等等。

      易用方面主要體現(xiàn)在下面的三個方向:

      門檻低。沒有任何技術背景的同學可以無代碼搭建數(shù)據(jù)門戶,沒有統(tǒng)計學背景的運營也能開啟AB實驗。

      上手快。不會SQL也沒關系,只要你知道自己想要哪些指標,對數(shù)據(jù)元信息有了解,5分鐘就能搭建分析圖表。

      協(xié)同廣。數(shù)據(jù)產品之間,數(shù)據(jù)產品和飛書、日歷、業(yè)務系統(tǒng)等多產品之間的無縫聯(lián)通,也讓大家更方便看數(shù)據(jù),用數(shù)據(jù)。

      如果再回過頭來想想,為什么會是這兩個特點?其實也很好理解。因為更易用的產品,才能被用得更廣泛,才能讓公司的每個員工都用起來;更敏捷的產品,才能被用得更深入,才能夠,在直播這樣要求非常實時的場景,在數(shù)據(jù)需求非常多變的情況下,也都能支持。

      只有數(shù)據(jù)被用得又廣又深,數(shù)據(jù)驅動的文化,才能有效落地。

      三,高效組織撬動飛輪。

      文化提升意識,工具落地執(zhí)行,是不是就夠了?對于業(yè)務復雜程度高,或者業(yè)務規(guī)模大的企業(yè)來說,好的組織模式是一個杠桿,能夠更大程度撬動數(shù)據(jù)與業(yè)務這兩個飛輪互相驅動。那什么算好的組織模式呢?我們的選擇是中臺+BP的模式。當業(yè)務非常復雜,又存在多個形態(tài)差異大的業(yè)務時,完全通用共性的產品有時不夠貼近業(yè)務場景。這個時候我們用數(shù)據(jù)BP模式來解決,數(shù)據(jù)BP是一個更深入業(yè)務線的角色,類似于HRBP跟業(yè)務的深度協(xié)同關系。數(shù)據(jù)BP會根據(jù)不同業(yè)務特點,靈活組合數(shù)據(jù)中臺的產品技術能力,來解決更具體的業(yè)務問題。這非常類似于ToB場景中的解決方案角色,能站在客戶和實際業(yè)務痛點的視角看問題,從而規(guī)避了過于側重中臺和技術視角的風險。如果要做類比理解的話,中臺+BP的模式,非常類似于“中央廚房 + 終端餐廳”的關系。

      上面講了我們在文化、在工具和在組織上的實踐案例和經驗。再回到最初的問題,談談我們對增長的理解。我們認為:增長,源于每個人做的每一次正確的決策,從戰(zhàn)略、管理到執(zhí)行。而決策是否正確,在沒有數(shù)據(jù)驅動的情況下,更像是一種玄學。數(shù)據(jù)驅動能夠讓決策方法變得更科學,而更科學的決策也就會無限趨近于正確。字節(jié)跳動從第一天就相信數(shù)據(jù)驅動科學決策的重要性,多年來也一直堅定不移地在實踐。當然,我們承認,一定有其它重要的因素也在影響著業(yè)務發(fā)展,比如宏觀經濟形勢,賽道趨勢等等。但數(shù)據(jù)驅動的文化,趁手的工具,高效的組織,這些一定會是增長的關鍵決定因素。

      火山引擎數(shù)據(jù)智能平臺VeDI

      講完了對數(shù)據(jù)驅動的理解和字節(jié)跳動的實踐經驗,我們來看看火山引擎數(shù)智平臺;鹕揭鏀(shù)據(jù)智能平臺VeDI,是我們對字節(jié)跳動數(shù)據(jù)經驗的復刻。這個“智”,除了通常大家所理解的自動化、智能化之外,我們更想強調的是,融入產品的經驗“智慧”。這也是字節(jié)十年來在數(shù)據(jù)領域的積累沉淀。我們希望把成功服務過抖音等諸多成功業(yè)務的經驗拿出來,通過火山引擎服務更多外部企業(yè)。

    3.png

      上圖是我們整體火山引擎數(shù)智平臺的產品家族圖譜?梢钥吹秸w分成PaaS和SaaS兩部分,我們提供了覆蓋數(shù)據(jù)全生命周期的產品服務,與內部產品完全對應。

      PaaS層主要分為數(shù)據(jù)引擎和數(shù)據(jù)研發(fā)治理。分析引擎主要解決的是如何實現(xiàn)海量數(shù)據(jù)下既快又穩(wěn)還省的問題,這里面有湖倉一體分析服務的LAS,有開源大數(shù)據(jù)平臺的EMR,有提供極致分析性能的云原生數(shù)據(jù)倉庫ByteHouse。數(shù)據(jù)研發(fā)治理DataLeap,提供的是數(shù)據(jù)集成、開發(fā)、運維、資產管理等能力。而在字節(jié)的數(shù)據(jù)經驗中,數(shù)據(jù)治理是其中比較有特色的一環(huán)。我們倡導分布式數(shù)據(jù)治理,提供工具,將治理過程做系統(tǒng)化抽象,讓它更流程化、自動化。同時,我們沉淀下來50多條治理規(guī)則,能讓各業(yè)務方依據(jù)不同業(yè)務的不同階段的優(yōu)先級,進行目標的自定義和自治,更大程度提升數(shù)據(jù)治理的適配性和效率。SaaS產品是我們這次重點升級的系列,目的是更大程度地將數(shù)據(jù)驅動融入到業(yè)務環(huán)節(jié)中去。我們提供了更具有場景化的模板,產品間協(xié)同性也顯著增強。

      接下來,我會重點圍繞場景化和協(xié)同性這兩個特性,來發(fā)布我們升級后的產品。

      一,場景更豐富。

      我們在面對客戶的時候,經常會被問到一些問題:“我這個行業(yè)指標體系要怎么構建?數(shù)據(jù)可以有很多,但哪些是我這個場景下最關鍵最需要采集的?” 在DataFinder4.0中,我們特別發(fā)布“場景模板”來解決這類問題。我們在產品中預置了針對不同行業(yè)的核心場景模板,用戶可以自由選擇,一鍵生成看板。生成的看板則可直接用于對應的場景,滿足日常業(yè)務指標跟蹤或特定業(yè)務目標的分析等需求。

    4.png

      上圖展示的就是目前預置在DataFinder里各行業(yè)一些典型場景模板。我們在服務內外部業(yè)務過程中,積累的分析經驗和方法論,都抽象在這些場景模板中。

      二,協(xié)同更融合。

      協(xié)同性方面,首先讓我們來看一個ABI產品DataWind跟飛書協(xié)同的案例。本次升級后的DataWind,會在多個方面與飛書高度協(xié)同。我們目前可實現(xiàn):

      通過飛書機器人,一鍵訂閱數(shù)據(jù)報告,數(shù)據(jù)實時觸達,定期掌握數(shù)據(jù)動態(tài);

      當出現(xiàn)關鍵數(shù)據(jù)波動時,及時向負責對象推送異動報警信息;

      針對有疑問的數(shù)據(jù),不但可以實時評論,還可以一鍵拉群,對數(shù)據(jù)問題進行討論和歸因分析;

      分析后的BI圖表,可以嵌入回飛書云文檔中,做分析報告,總結沉淀。

      對于數(shù)據(jù)量不大的場景來說,也可直接使用飛書表格作為數(shù)據(jù)集,接入DataWind分析。例如:某企業(yè)區(qū)域經理要做經銷商管理,經銷商們可以通過飛書表格同步數(shù)據(jù);而區(qū)域經理則跳轉到Datawind進行多維度交叉分析,并且將分析結果制作成圖表;同時,在有數(shù)據(jù)權限精細控制的前提下,將分析圖表,分發(fā)到飛書群或是云文檔中。DataWind跟飛書的聯(lián)動,僅僅是其中一個例子。它代表了數(shù)據(jù)產品與協(xié)作辦公產品的打通,這也是將數(shù)據(jù)驅動的邊界,不斷向業(yè)務深處推進。

      而我們在對外的產品協(xié)同性上會更激進一些,不僅是飛書,主流辦公協(xié)同工具都能集成使用。除了與協(xié)作平臺之間的聯(lián)通拓展之外,火山引擎數(shù)智平臺內產品與產品間的協(xié)同也更絲滑。以營銷套件內的產品為例,協(xié)同具備以下特點:

      數(shù)據(jù)共通:底層數(shù)據(jù)源統(tǒng)一采集、統(tǒng)一存儲、統(tǒng)一格式,多方產品共用;

      標簽聯(lián)動:VeCDP內創(chuàng)建標簽之后,Datawind中將自動生成標簽結果數(shù)據(jù)集,用戶可以直接進行分析,GMP、Finder也都能直接用;

      體驗同步:不同產品中的數(shù)據(jù)看板可互相嵌入嵌出,比如DataFinder和DataWind;不同數(shù)據(jù)產品中,創(chuàng)建的群體也可以互相同步,比如DataWind和VeCDP;

      設計統(tǒng)一:套件產品整體設計風格統(tǒng)一,以保障不出現(xiàn)產品設計體驗上的割裂感。

      如果把這些能力用一個實際的場景串起來,大家可能更容易體會。某業(yè)務負責人早上醒來,在體內數(shù)據(jù)驅動基因的驅使下,打開手機飛書?戳艘谎圩约河嗛咲ataWind看板卡片,發(fā)現(xiàn)昨天某活動的營收數(shù)據(jù),顯著低于了預期目標。于是他立即一鍵拉群,并@了相應負責人。拉群之后,活動對應的負責人、分析師、數(shù)據(jù)研發(fā)同學等不同的角色都在群里了。大家點擊指標跳轉到DataWind里,通過使用DataWind內置的智能歸因算法發(fā)現(xiàn)渠道因素的影響最大。做出這一步,也是最初步的診斷結論的時候,時間只過去了不到10分鐘。

      接下來,還要做更詳細的診斷分析,看看不同渠道的轉化情況。而DataFinder其實更擅長解決渠道分析的問題,通過預嵌入DataWind的DataFinder看板,大家查看了不同渠道下的轉化漏斗對比,發(fā)現(xiàn)A渠道的人群跳失率太高了,基本上頁面點一下就馬上走了,說明這個渠道的投放都打了水漂。那該怎么補救呢?大家挑選了轉化率較好的B渠道,將他們的數(shù)據(jù)回流到VeCDP中,并建立了畫像標簽,并基于此對原來投放的目標群體畫像做了修正,使得其更精細化。

      下一步就是投放,用VeCDP剛生成的畫像標簽和人群包,在抖音廣告體系內做比之前更精準的定向投放。此時問題又來了,用什么樣的文案素材更好呢?通過DataTester,大家針對不同的人群,灰度測試選出了更適合,轉化率更高的素材。當正式投放開始后,DataFinder又可以繼續(xù)用來分析投放效果了。此外,還能針對引流過來的新用戶,通過GMP進行私域的push或者短信,提升私域用戶的活躍度。這就是一個企業(yè)如何利用火山引擎數(shù)智平臺,實現(xiàn)的數(shù)據(jù)驅動科學決策,進而解決業(yè)務問題的例子。有時候,它可能只是從小小的數(shù)據(jù)異常開始,但卻能貫穿了企業(yè)從上到下的各個角色和環(huán)節(jié)。

    5.png

      在整個火山引擎數(shù)智平臺能力升級的背后,有我們一整套的數(shù)據(jù)技術能力在支撐。今天,我們也將首次對外發(fā)布火山引擎數(shù)智平臺的技術棧,讓大家全方面了解火山引擎數(shù)智平臺從數(shù)據(jù)引擎到數(shù)據(jù)管理以及數(shù)據(jù)應用上端到端的全鏈路數(shù)據(jù)能力。

      這些技術能力,除了通過剛剛介紹的商業(yè)產品對外服務,也會通過部分開源的形式來對企業(yè)提供技術上的幫助。在字節(jié)數(shù)據(jù)平臺發(fā)展的過程中,我們也享受過開源社區(qū)帶來的便利,所以我們也將自己在實踐中自研比較成熟的系統(tǒng)開源出來,回饋給廣泛開發(fā)者。目前,我們即將開源的幾個項目包括數(shù)據(jù)集成項目BitSail和數(shù)據(jù)分析引擎ByConity開源項目等,預計年內就會發(fā)布,大家敬請期待。

      最后,讓我們簡單回顧一下。今天主要分享了字節(jié)跳動的數(shù)據(jù)經驗以及我們如何把它復刻在火山引擎并升級迭代的。我們認為,所謂的數(shù)據(jù)驅動不是有數(shù)據(jù)就可以驅動,還需要文化理念,精良工具產品,合理的組織;數(shù)據(jù)產品除了產品技術能力之外,還需要有被驗證過的經驗智慧的沉淀。火山引擎數(shù)智平臺VeDI,就沉淀了字節(jié)跳動在數(shù)據(jù)驅動方面的經驗智慧。期望它能夠幫助大家深入業(yè)務,讓每一次業(yè)務決策更科學,從而驅動業(yè)務的發(fā)展。

      謝謝大家!

      編輯:楊艷

      

    [No. S051]
    分享到微信

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。