中國(guó)品牌,讓東南亞感受“消費(fèi)升級(jí)”小紅書(shū)本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國(guó) 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺(tái)合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫(huà)像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車(chē)產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋(píng)果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚(yú)相關(guān)搜索量暴漲384%2024 vivo開(kāi)發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開(kāi)發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷(xiāo)量及銷(xiāo)售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專(zhuān)利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 首頁(yè) > 3C消費(fèi)頻道 > 辦公設(shè)備

    在辦公筆記本玩轉(zhuǎn)基于星型模型的自助探索分析

    2017年12月13日 10:11:09   來(lái)源:中國(guó)網(wǎng)

      概要:

      在DELL燃7000筆記本電腦上(i5-7200u),對(duì)億級(jí)事實(shí)表&維度表的探索式分析,平均響應(yīng)性能從11.9秒優(yōu)化到8.9秒,提升程度約25%,這一切歸功于Smartbi+Vertica的高性能自助分析解決方案!

      難點(diǎn):

      星型模型又稱(chēng)Star-schema,是一種數(shù)據(jù)庫(kù)的建模(組織數(shù)據(jù))的方式,它與三范模型3-NF的知名度等高。由于這類(lèi)模型都是以“事實(shí)表”為核心,圍繞幾個(gè)維度表,所以非常形象的被稱(chēng)為“星型”。

      在沒(méi)有犧牲空間換時(shí)間(OLAP)的數(shù)據(jù)分析場(chǎng)景下,這樣的建模方式非常有利于數(shù)據(jù)更新,因?yàn)榫S護(hù)事實(shí)表的增量以及事實(shí)表和維度表的數(shù)據(jù)一致性比較快速,或者說(shuō)ETL的時(shí)間窗口比較小。但其對(duì)于查詢類(lèi)型的分析應(yīng)用,卻需要消耗大量的“關(guān)聯(lián)”運(yùn)算,對(duì)CPU來(lái)說(shuō)是比較操作,因此在很多大數(shù)據(jù)量的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,往往其查詢性能并不好。

      更具挑戰(zhàn)的是,在需要提供自助探索的分析平臺(tái)上(比如Smartbi的透視分析以及Tableau等),業(yè)務(wù)人員無(wú)法預(yù)料的會(huì)動(dòng)態(tài)生成各種查詢請(qǐng)求,從技術(shù)的角度說(shuō)就是SQL沒(méi)有規(guī)律,任何字段都可能是where條件、group分組以及計(jì)算字段,這就導(dǎo)致索引等傳統(tǒng)DBA的手段毫無(wú)用武之地。

      干貨

      關(guān)注過(guò)Smartbi公眾號(hào)的同學(xué)可能知道,Smartbi在7月份與Vertica進(jìn)行了戰(zhàn)略合作,基于這個(gè)新一代列式MPP數(shù)據(jù)庫(kù)發(fā)布了“高性能自助分析解決方案“,在隨后9月的workshop中提供了1個(gè)億級(jí)的星型數(shù)據(jù)模型和22個(gè)性能測(cè)試案例。

      我在本人筆記本電腦對(duì)V201709版星型模型做了性能測(cè)試,平均響應(yīng)時(shí)間為11.9秒,個(gè)人感受只能是差強(qiáng)人意。22個(gè)測(cè)試案例的結(jié)果如下,單位為秒:

      筆記本電腦型號(hào)燃7000,配置如下,只不過(guò)操作系統(tǒng)為了安裝Vertica改成了linux:

      這個(gè)配置和價(jià)位是非常親民的吧,尤其這顆CPU在牙膏廠(Intel)的產(chǎn)品里根本排不上號(hào)。

      言歸正傳,最近本人研究了一下Smartbi的這個(gè)星型數(shù)據(jù)模型,對(duì)其做了2項(xiàng)調(diào)整工作,第一是將3個(gè)維度表的關(guān)聯(lián)字段改成了整型(當(dāng)然首先是在維度表增加了車(chē)型、姓名、城市的整數(shù)編號(hào),其次是在事實(shí)表增加這3個(gè)字段),第二是對(duì)事實(shí)表按年份進(jìn)行了分區(qū)。

      同樣按照22個(gè)案例進(jìn)行了測(cè)試,就得到了25%的性能提升,達(dá)到8.9秒,結(jié)果棒棒的!

      具體來(lái)說(shuō),前3個(gè)測(cè)試案例是對(duì)事實(shí)表3個(gè)字段的分組求和,不涉及任何優(yōu)化的內(nèi)容,所以沒(méi)有什么改變,甚至由于隨機(jī)性的誤差還有一些下降。從第四個(gè)開(kāi)始,2個(gè)優(yōu)化手段開(kāi)始發(fā)揮作用,平均提升更大(30%)。

      既然此次優(yōu)化用了2個(gè)手段,那么它們各自有多大貢獻(xiàn)呢?(原諒本人懶得重新測(cè))

      將測(cè)試案例的三類(lèi)對(duì)比來(lái)看,因?yàn)?rdquo;同比計(jì)算“和”條件匯總“都用到年份作為條件,我們暫且可以認(rèn)為它們更能體現(xiàn)按年做分區(qū)的優(yōu)化作用,這里它們分別提升了27%和32%,比普通的全表匯總提升的21%更有效果,就認(rèn)為有5%-10%的提升吧。

      另外從這個(gè)圖可以看到,以前同比計(jì)算的平均性能比全表匯總明顯要慢,但優(yōu)化后基本差不多了,都在11秒左右。而按年條件匯總的平均性能從6秒提升到4秒,真的是非常優(yōu)秀了!

      總結(jié)

      只有用列式數(shù)據(jù)庫(kù),才可能降低大數(shù)據(jù)量分析對(duì)IO的硬性要求,使得采用筆記本做數(shù)據(jù)分析成為可能。但能把1億數(shù)據(jù)量的星型模型玩轉(zhuǎn)自助分析的,目前也就是Smartbi+Vertica,最后給Smartbi透視分析的同環(huán)比計(jì)算、分組字段和自由鉆取點(diǎn)個(gè)贊,以后有空再繼續(xù)挑戰(zhàn)這個(gè)任務(wù)!

      寫(xiě)在最后:該優(yōu)化的模型已經(jīng)被Smartbi采納,用于后續(xù)的workshop活動(dòng)!

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。