2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機(jī)器也能說人話了?阿里國際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團(tuán)隊(duì)煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄
  • 首頁 > 企業(yè)IT頻道 > 解決方案

    數(shù)據(jù)分析慢?火山引擎ByteHouse發(fā)布六大場景性能提升方案

    2024年08月06日 18:39:24   來源:Citnews中文科技資訊

      性能在數(shù)據(jù)分析中至關(guān)重要,它直接決定數(shù)據(jù)處理的效率與及時(shí)性,進(jìn)一步對數(shù)據(jù)驅(qū)動(dòng)的企業(yè)決策造成影響。

      舉個(gè)例子來看,某個(gè)大型電商公司每天產(chǎn)生海量的交易數(shù)據(jù),數(shù)據(jù)分析團(tuán)隊(duì)需要通過這些數(shù)據(jù)了解客戶的購買行為、熱門商品、銷售趨勢等,來制定營銷策略和優(yōu)化運(yùn)營。當(dāng)分析團(tuán)隊(duì)獲取過去一個(gè)月的銷售數(shù)據(jù)報(bào)告時(shí),由于數(shù)據(jù)量龐大,系統(tǒng)處理速度緩慢,需要幾十分鐘到幾小時(shí)才能得出結(jié)果。而在某些促銷活動(dòng)期間,如果不能及時(shí)獲取最新的銷售數(shù)據(jù)來評估活動(dòng)效果,就無法及時(shí)調(diào)整策略,錯(cuò)失營銷機(jī)會(huì)。

      隨著數(shù)字化轉(zhuǎn)型的深入,不僅僅是電商領(lǐng)域,各行業(yè)都需要基于實(shí)時(shí)數(shù)據(jù)做出關(guān)鍵決策。而對企業(yè)底層數(shù)據(jù)系統(tǒng)來說,在處理復(fù)雜的數(shù)據(jù)分析任務(wù),如多維度的關(guān)聯(lián)分析或數(shù)據(jù)挖掘時(shí),可能出現(xiàn)延遲、崩潰、錯(cuò)誤等問題,導(dǎo)致數(shù)據(jù)不準(zhǔn)確、不完整、時(shí)效性差。

      作為火山引擎推出的一款OLAP產(chǎn)品,ByteHouse具備原生的高性能優(yōu)勢,廣泛應(yīng)用于字節(jié)跳動(dòng)和外部企業(yè)的數(shù)據(jù)分析場景。早在2022年2月,ByteHouse在字節(jié)跳動(dòng)的部署規(guī)模已超1萬8000臺(tái),單集群超2400臺(tái)。針對數(shù)據(jù)分析中常見的實(shí)時(shí)吞吐慢、BI報(bào)表慢、在線/離線分析慢等情況,ByteHouse推出六大場景的性能提升方案,進(jìn)一步提升OLAP性能,助力企業(yè)更快速、更準(zhǔn)確實(shí)施決策。

    圖片1.png

      第一,在實(shí)時(shí)吞吐的場景中,首先,ByteHouse支持 Upsert的部分列更新能力,確保每秒百萬數(shù)據(jù)入庫前提下的落盤即更新。其次,基于自研uniqueMergeTree引擎,ByteHouse為數(shù)據(jù)寫入即去重提供性能保障,特別是滿足了 IoT 場景下的高性能訴求。此外,ByteHouse自研的 Flink Connector 能更好對接 Flink,為數(shù)據(jù)寫入建立更高效、流暢的通路。以某暢銷游戲公司的實(shí)踐舉例,該公司每秒需要寫入 220 萬條游戲平臺(tái)日志數(shù)據(jù),相當(dāng)于每秒寫入約 4GB 數(shù)據(jù),而在ByteHouse的支持下,該公司的底層數(shù)據(jù)引擎能很好滿足以上訴求,且性能實(shí)現(xiàn)線性增長。

      第二,在BI報(bào)表分析場景中,數(shù)據(jù)分析師、運(yùn)營團(tuán)隊(duì)等經(jīng)常會(huì)遇到報(bào)表生成慢、指標(biāo)平臺(tái)響應(yīng)慢、管理駕駛艙顯示速度慢等問題。一方面,ByteHouse通過增強(qiáng)MV物化視圖和Projection功能,實(shí)現(xiàn)對復(fù)雜查詢、計(jì)算邏輯的預(yù)聚合,提升應(yīng)用層的性能表現(xiàn),另一方面基于Query Cache來緩存數(shù)據(jù)和復(fù)雜查詢中的結(jié)果集。在某娛樂型公司的應(yīng)用實(shí)踐中,ByteHouse支撐該公司每天15億數(shù)據(jù)記錄,每秒6萬TPS峰值,使報(bào)表時(shí)效性從過去的 T+1 方式直接壓縮到分鐘級(jí),甚至秒級(jí)。

      第三,在在線、離線復(fù)雜分析場景中,ByteHouse則針對CBO、RBO等進(jìn)行自研優(yōu)化器增強(qiáng)。此外,對于Runtime Filter 這一對大關(guān)聯(lián)場景性能提升有關(guān)鍵影響的技術(shù),ByteHouse自研分布式緩存能夠進(jìn)一步解決分離架構(gòu)帶來的性能損失問題。

      第四,在湖倉聯(lián)邦分析場景中,ByteHouse基于 Native Reader 技術(shù)壓縮 IO 訪問路徑,提升外表訪問性能。通過進(jìn)一步與優(yōu)化器進(jìn)行融合,ByteHouse能持續(xù)提高湖倉分析速度。

      第五,在人群圈選與行為分析場景中,ByteHouse 具備 BitEngine/BitMap64/BitMap indexDe 等自研引擎和增強(qiáng)功能,通過與增長分析DataFinder、客戶數(shù)據(jù)平臺(tái)VeCDP等應(yīng)用緊密結(jié)合,ByteHouse針對業(yè)務(wù)場景開發(fā)了大量內(nèi)置分析函數(shù),如留存分析、路徑分析等。即使在 10 億級(jí)的用戶圈選的場景下, P99 響應(yīng)時(shí)間也能達(dá)到秒級(jí)到毫秒級(jí)。

      第六,在以圖搜圖場景中,ByteHouse推出了Vector引擎,即向量檢索能力。通過支持多種向量檢索算法以及高效的執(zhí)行鏈路,ByteHouse可以支撐極大規(guī)模向量檢索場景,達(dá)到毫秒級(jí)的查詢延遲。在某輿情監(jiān)測企業(yè)的實(shí)踐中,行業(yè)相關(guān)產(chǎn)品的查詢效率在幾秒到十多秒之間,而優(yōu)化后的ByteHouse只需150-200 毫秒內(nèi),就能從大規(guī)模數(shù)據(jù)中查找出近似的 1000 張圖片,并完成相似度評分。

      在整體性能數(shù)據(jù)上,通過使用SSB、TPC-H 和 TPC-DS 三種數(shù)據(jù)集進(jìn)行性能測試,并以性能著稱的某開源OLAP為基準(zhǔn)測試產(chǎn)品,ByteHouse在不同查詢項(xiàng)上都有顯著的性能提升。以TPC-H 數(shù)據(jù)集舉例,在相同硬件和軟件環(huán)境下, ByteHouse 查詢效率高于本次基準(zhǔn)測試產(chǎn)品幾十倍。

      目前,ByteHouse應(yīng)用于互聯(lián)網(wǎng)、游戲、金融、汽車、氣象等領(lǐng)域,持續(xù)為企業(yè)提供極致的數(shù)據(jù)分析能力,助推數(shù)智化轉(zhuǎn)型升級(jí)。(作者:唐明)

      

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。