大模型時(shí)代,數(shù)據(jù)庫的變化走到了哪?
“搭積木”、“‘自動(dòng)駕駛’”、“三層解耦”,這些形象的標(biāo)簽成了1月17日阿里云開發(fā)者生態(tài)大會(huì)當(dāng)天最出圈的詞匯。
會(huì)上,一名小學(xué)生受邀上臺(tái)演示了數(shù)據(jù)庫查詢的場(chǎng)景。一種“全民編程”的氣氛向現(xiàn)場(chǎng)觀眾席卷而來。而讓個(gè)人開發(fā)者和企業(yè)用戶都可以像“搭積木”一樣開發(fā)和管理數(shù)據(jù)庫,這也正是阿里云在2024年甚至更長(zhǎng)時(shí)間里的新愿景。
而AI,正是其中的關(guān)鍵武器。
從IBM小型機(jī),到Oracle“統(tǒng)治”時(shí)代,再到以AWS、GCP等云數(shù)據(jù)庫巨頭引領(lǐng)的新時(shí)代,全球數(shù)據(jù)庫行業(yè)交錯(cuò)發(fā)展了40年之久。而在最近的十年時(shí)間里,國(guó)產(chǎn)數(shù)據(jù)庫成為新的弄潮兒。
2023年底,一張亮眼的成績(jī)單新鮮出爐。阿里云瑤池?cái)?shù)據(jù)庫入選Gartner云數(shù)據(jù)庫魔力象限,并連續(xù)4年蟬聯(lián)“領(lǐng)導(dǎo)者”地位。
而與之對(duì)應(yīng)的一個(gè)事實(shí)是,在國(guó)內(nèi)云計(jì)算行業(yè)增速放緩的背景下,入選企業(yè)只有阿里云一家。放眼國(guó)際,IBM、SAP等傳統(tǒng)商業(yè)數(shù)據(jù)庫廠商,均跌出“領(lǐng)導(dǎo)者”象限。
云數(shù)據(jù)庫正是其中的主角。實(shí)際上,在不少數(shù)據(jù)庫企業(yè)的眼中,云數(shù)據(jù)庫都被視為一個(gè)國(guó)內(nèi)數(shù)據(jù)庫行業(yè)換道超車的機(jī)會(huì)。其中不僅包括公有云大勢(shì)所趨的推動(dòng),更重要的是云數(shù)據(jù)庫所涉及到的底層創(chuàng)新,如存算分離和軟硬一體技術(shù)等等,也正在成為數(shù)據(jù)庫行業(yè)的新潮流。
2023年,據(jù)墨天輪統(tǒng)計(jì),云數(shù)據(jù)庫占國(guó)內(nèi)數(shù)據(jù)庫總數(shù)的20%。而早在2021年,中國(guó)信通院就做出相關(guān)預(yù)測(cè)。“80%的企業(yè)都認(rèn)為云數(shù)據(jù)庫是未來數(shù)據(jù)庫行業(yè)的發(fā)展方向。”
在大模型一路“狂飆”的今天,云數(shù)據(jù)庫又來到了超車關(guān)口。
一、從傳統(tǒng)數(shù)據(jù)庫到云數(shù)據(jù)庫的“新需求面”
在很長(zhǎng)一段時(shí)間里,業(yè)務(wù)高峰期間的流量指數(shù)級(jí)增長(zhǎng)都是企業(yè)最怕遇到的問題,比如雙十一期間的淘寶和春運(yùn)期間的12306等等。這已經(jīng)成為一種行業(yè)共識(shí)。
而在流量爆表的另一面,業(yè)務(wù)也對(duì)數(shù)據(jù)庫,尤其是傳統(tǒng)數(shù)據(jù)庫提出了極高的要求,包括存儲(chǔ)、計(jì)算等一系列環(huán)節(jié)都成為不少企業(yè)難以解決的問題。
根據(jù)一組不完全數(shù)據(jù)統(tǒng)計(jì),在過去幾年里,有超過70%的新型企業(yè)都因海量數(shù)據(jù)的挑戰(zhàn)而對(duì)業(yè)務(wù)產(chǎn)生了影響。
天貓雙十一是最常見的例子。每年雙十一大促的,入駐天貓的商家都深知一個(gè)“爆款規(guī)則”,即提前幾周乃止一個(gè)月對(duì)企業(yè)自身數(shù)據(jù)庫計(jì)算能力和存儲(chǔ)量做臨時(shí)升配。
但盡管如此,在雙十一流量高峰期間,客戶的數(shù)據(jù)庫還是會(huì)出現(xiàn)了問題。具體來看,由于傳統(tǒng)數(shù)據(jù)庫需要進(jìn)行定期運(yùn)維,而這種運(yùn)維升級(jí)所需要的時(shí)間是6-8個(gè)小時(shí)。在此期間,不僅企業(yè)需要支付高昂的運(yùn)維成本,更嚴(yán)重的情況則是由于資源沖突導(dǎo)致的升配失敗。
在零售之外,中國(guó)聯(lián)通這類的大型企業(yè)也在面臨同樣的問題。
與互聯(lián)網(wǎng)業(yè)務(wù)不同的是,互聯(lián)網(wǎng)業(yè)務(wù)交易量大,但速度快。而聯(lián)通業(yè)務(wù)的特點(diǎn)則是會(huì)遇到多種需求,業(yè)務(wù)鏈條極長(zhǎng)。
比如看似十分簡(jiǎn)單的選手機(jī)號(hào)的業(yè)務(wù),一整條鏈條需要涉及到手機(jī)號(hào)碼選擇、套餐選擇、開網(wǎng),以及實(shí)名校驗(yàn)和反電信詐騙各種校驗(yàn)。
這種業(yè)務(wù)復(fù)雜、鏈條冗長(zhǎng)的場(chǎng)景,對(duì)聯(lián)通內(nèi)部的IT系統(tǒng)是一個(gè)極大的考驗(yàn),其不論是運(yùn)維還是維護(hù),都需要保持業(yè)務(wù)無感知以及絕對(duì)的安全,否則一旦出現(xiàn)問題將影響每個(gè)用戶的日常生活。在這些之外,更要注意成本。因此,同樣地,留給其內(nèi)部數(shù)據(jù)庫管理的難度極大。
實(shí)際上,不論是電商企業(yè),還是如中國(guó)聯(lián)通這樣的大型運(yùn)營(yíng)商,傳統(tǒng)數(shù)據(jù)庫高企的成本和業(yè)務(wù)對(duì)彈性的運(yùn)維需求也恰在成為采用云數(shù)據(jù)庫的最強(qiáng)推動(dòng)力。因此,極低的運(yùn)營(yíng)成本和彈性存儲(chǔ)、計(jì)算便成為了對(duì)數(shù)據(jù)庫企業(yè)的剛性需求。
根據(jù)不完全統(tǒng)計(jì),在面對(duì)業(yè)務(wù)高峰帶來的峰值時(shí),云數(shù)據(jù)庫的最大優(yōu)勢(shì)便是可以為企業(yè)提供彈性擴(kuò)縮容能力。在這種彈性場(chǎng)景下,云原生數(shù)據(jù)庫PolarDB的成本僅為傳統(tǒng)商業(yè)數(shù)據(jù)庫的十分之一。
另外,在廠商的幫助下,云原生數(shù)據(jù)庫可以做到開箱即用,服務(wù)商提供從安裝、部署到運(yùn)維的全流程服務(wù),基于云端的運(yùn)維和彈性存儲(chǔ)計(jì)算等進(jìn)一步降低企業(yè)的運(yùn)營(yíng)和使用成本。
根據(jù)中國(guó)信通院報(bào)告顯示,2022年中國(guó)公有云數(shù)據(jù)庫市場(chǎng)規(guī)模為219.15億元,較2021年增速51.6%,而本地部署的增速為14.4%。
二、解耦、AI、積木:
從彈性運(yùn)維到智能運(yùn)維
而在這個(gè)確定性的趨勢(shì)之下,阿里云又向前了一步。
1月17日,阿里云PolarDB開發(fā)者大會(huì)上發(fā)布了“三層分離”的新版本,基于智能決策實(shí)現(xiàn)查詢性能10倍提升、節(jié)省50%數(shù)據(jù)庫成本。
而這里的“三層解耦/三層分離”則是阿里云的特殊標(biāo)簽。
此前,在過去40多年的數(shù)據(jù)庫行業(yè)發(fā)展中,一個(gè)極為普遍的情況是數(shù)據(jù)庫的計(jì)算與內(nèi)存都是綁定在一起的,也就是俗稱的存算一體。其中部分?jǐn)?shù)據(jù)庫可以做到計(jì)算和存儲(chǔ)資源進(jìn)行解耦,不過沒有數(shù)據(jù)庫能做到計(jì)算和內(nèi)存的解耦。
但對(duì)于數(shù)據(jù)庫而言,計(jì)算、內(nèi)存和存儲(chǔ)資源全部綁定在一起,這種強(qiáng)耦合性會(huì)極大地限制數(shù)據(jù)庫的彈性能力,很難進(jìn)行跨機(jī)遷移。
而放在現(xiàn)實(shí)生活中,最常見的例子是在淘寶雙十一流量高峰,如果計(jì)算和內(nèi)存無法進(jìn)行分離,最直接的影響一方面是企業(yè)的數(shù)據(jù)庫部署和運(yùn)營(yíng)成本十分高昂,另一方面則是對(duì)企業(yè)的計(jì)算資源造成極大的浪費(fèi)。
這也是阿里云“三層解耦”方案的價(jià)值之處。
這種強(qiáng)解耦不僅帶來的是運(yùn)維和成本上的彈性,更在產(chǎn)品體驗(yàn)層面被強(qiáng)化。“未來,個(gè)人開發(fā)者和企業(yè)用戶可以像‘搭積木’一樣開發(fā)和管理數(shù)據(jù)庫。”阿里云數(shù)據(jù)庫產(chǎn)品事業(yè)部負(fù)責(zé)人李飛飛表示。
實(shí)際上,所謂的“搭積木”,其核心邏輯在于,在統(tǒng)一源數(shù)據(jù)管理和保證多租戶隔離的前提下,企業(yè)可以自主調(diào)用搭配阿里云數(shù)據(jù)庫的產(chǎn)品組組件,包括計(jì)算單元、存儲(chǔ)引擎、向量引擎能力等等,滿足業(yè)務(wù)對(duì)數(shù)據(jù)庫的精準(zhǔn)需求,而對(duì)阿里云而言,則是真正從原子化的層面滿足企業(yè)自身需求。
從具體效果來看,“搭積木”的體現(xiàn),一方面是剛剛提到的極致彈性,另一個(gè)則是強(qiáng)Severless能力。
對(duì)Severless化的一個(gè)通俗解釋是,其更像一種按需付費(fèi)的交付方式,用戶不需要擔(dān)心數(shù)據(jù)庫的存儲(chǔ)、計(jì)算等資源問題,也無需進(jìn)行配置和維護(hù)、更新,可以大幅節(jié)省在服務(wù)上花費(fèi)的時(shí)間和資源。
對(duì)企業(yè)而言,其只需要將重心放到本身的業(yè)務(wù)邏輯即可。
早在2017年,Serverless就在國(guó)內(nèi)落地,也正是在這一年阿里云推出Serverless平臺(tái)。后來,隨著Serverless平臺(tái)逐漸深化,“像搭積木一樣簡(jiǎn)易”這樣的愿景也開始一點(diǎn)點(diǎn)落地。
而在其中,AI是非常重要的價(jià)值工具。“在大模型時(shí)代,誰能夠讓整個(gè)端到端的流程更簡(jiǎn)單、更易用,誰就會(huì)在市場(chǎng)上占據(jù)先發(fā)優(yōu)勢(shì)。”李飛飛表示。
更客觀來看,不論是彈性運(yùn)維,還是Serverless,其本身都是對(duì)數(shù)據(jù)庫產(chǎn)品力和使用體驗(yàn)的進(jìn)一層深化,而如今在大模型的加持下,數(shù)據(jù)庫的產(chǎn)品力將更為強(qiáng)大。
除了已有的向量引擎等數(shù)據(jù)庫底層進(jìn)化之外,李飛飛告訴我們,在數(shù)據(jù)庫的智能運(yùn)維方面,阿里云通過AI大模型能力,可以對(duì)企業(yè)內(nèi)部的業(yè)務(wù)數(shù)據(jù)進(jìn)行智能監(jiān)控,再加上AI的智能分析能力,在一定程度上減少數(shù)據(jù)庫維護(hù)、更新等人工成本。
再比如在數(shù)據(jù)庫產(chǎn)品的服務(wù)層面,基于大模型可以對(duì)工單進(jìn)行更為高效的管理,如今,這項(xiàng)能力已經(jīng)在阿里云數(shù)據(jù)庫團(tuán)隊(duì)內(nèi)部使用。
“數(shù)據(jù)庫和大模型結(jié)合的想象力很豐富,包括原有的BI,商業(yè)數(shù)據(jù)分析過等過去企業(yè)內(nèi)部基于數(shù)據(jù)的動(dòng)作,未來仍然會(huì)存在,但是會(huì)基于大模型的場(chǎng)景進(jìn)行,這個(gè)想象力也是無窮的。”
三、2024,走到數(shù)據(jù)庫的關(guān)口
實(shí)際上,我們?cè)賮砜催@個(gè)命題:即大模型究竟能為數(shù)據(jù)庫做些什么?
繼2023年,大模型“狂飆”了一年后,關(guān)于這樣的討論在持續(xù)發(fā)酵。甚至幾乎所有大廠都All in AI來做大模型。
但就目前而言,與大模型結(jié)合更多可落地的場(chǎng)景在于上層應(yīng)用,如AI Agent,或者與SaaS工具層的結(jié)合。而對(duì)于底層的數(shù)據(jù)庫而言,大模型對(duì)數(shù)據(jù)庫行業(yè)造成的潛在影響則在于智能化。
從大模型與數(shù)據(jù)庫的本質(zhì)進(jìn)行分析,大模型需要依托海量的數(shù)據(jù)來訓(xùn)練、學(xué)習(xí),而數(shù)據(jù)庫的作用則是進(jìn)行存儲(chǔ)、篩選和處理數(shù)據(jù)。
因此,兩者碰撞在一起的想象力,則可以通過可視化工具,來進(jìn)行配合,比如通過大模型進(jìn)行數(shù)據(jù)的收集、標(biāo)簽管理、數(shù)據(jù)資產(chǎn)沉淀,再利用AI大模型能力進(jìn)行數(shù)據(jù)智能分析,并以清晰可視化的方式,實(shí)現(xiàn)真正的數(shù)據(jù)和業(yè)務(wù)結(jié)合。
這也是目前企業(yè)里較為常見的需求,即將數(shù)據(jù)庫與AI和BI相結(jié)合的方向。
而從這些視角來理解,其實(shí)不難看出對(duì)當(dāng)下而言,數(shù)據(jù)庫行業(yè)正在堅(jiān)定地發(fā)生一些變化。
首先,站在更大的行業(yè)視角,在云數(shù)據(jù)庫成為新趨勢(shì)的背景下,云數(shù)據(jù)庫成為了國(guó)產(chǎn)數(shù)據(jù)庫企業(yè)換道超車的新機(jī)會(huì)。而在此基礎(chǔ)上,像阿里云所推出的“三層解耦”和“搭積木”理念,再加上AI加持的智能運(yùn)維能力,也更是加速了云數(shù)據(jù)庫替代傳統(tǒng)商業(yè)數(shù)據(jù)庫的趨勢(shì)。
在過去2023年,整個(gè)數(shù)據(jù)庫市場(chǎng)已經(jīng)站上了數(shù)字路口的開始。從去年Gartner發(fā)布的云數(shù)據(jù)庫魔力象限就可以發(fā)現(xiàn),IBM、SAP等傳統(tǒng)商業(yè)數(shù)據(jù)庫廠商,均跌出“領(lǐng)導(dǎo)者”象限。
而從過往的歷史趨勢(shì)來看,一直以來在數(shù)據(jù)庫行業(yè)具有“統(tǒng)治者”地位的Oracle也在云計(jì)算時(shí)代由于戰(zhàn)略判斷失誤而失去了其原本的霸主地位。
而另一組根據(jù)信通院的統(tǒng)計(jì)則是,目前國(guó)內(nèi)數(shù)據(jù)庫有接近300家公司,這里面包括OLTP、OLAP、NoSQL等類型,已經(jīng)被大量應(yīng)用在企業(yè)業(yè)務(wù)中。
李飛飛告訴我們,未來堅(jiān)持傳統(tǒng)軟件思維模式的數(shù)據(jù)庫企業(yè)會(huì)越來越艱難。“堅(jiān)持云原生化、一體化、平臺(tái)化和智能化,才是數(shù)據(jù)庫的下一個(gè)方向和未來。”
云原生化意味著企業(yè)從購(gòu)買資源向購(gòu)買能力轉(zhuǎn)變,加速數(shù)據(jù)業(yè)務(wù)上云。其中“三層解耦”和Serverless能力便是最好的體現(xiàn)。
平臺(tái)化對(duì)應(yīng)的是基于平臺(tái)來提供一站式的能力和解決方案,比如通過提供標(biāo)準(zhǔn)的API接口體系來減少業(yè)務(wù)煙囪。
一體化則是聚焦客戶的業(yè)務(wù)場(chǎng)景,通過多產(chǎn)品一體化的體驗(yàn),來簡(jiǎn)化開發(fā)、管理和運(yùn)維,避免數(shù)據(jù)搬遷。如處理分析一體化、離在線一體化、集中分布一體化、多模處理一體化。
最后,智能化便是結(jié)合AI提升運(yùn)維效率和查詢效率等等。而放在未來的大模型時(shí)代,智能化的想象力和應(yīng)用力也將會(huì)越來越豐富。
不難看出,2024年數(shù)據(jù)庫行業(yè)在AI的推動(dòng)下,既定的云端進(jìn)化速度正在加速。而伴隨著市場(chǎng)和企業(yè)對(duì)于云數(shù)據(jù)庫需求的越發(fā)增加,中國(guó)數(shù)據(jù)庫廠商正在成為一股不可忽視的力量。
“核心還是持續(xù)為客戶創(chuàng)造更大的價(jià)值,這是阿里云數(shù)據(jù)庫和PolarDB產(chǎn)品的根本使命。”李飛飛說道。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。