據中國信通院發布的《資料庫發展研究報告(2023年)》中數據顯示,2022年,中國資料庫市場規模約403.6億元,占全球7.2%。
中國國產資料庫起步並不算早,作為中國首款雲原生資料庫,阿里雲PolarDB資料庫則是始於阿里內部網際網路業務高速發展和去「IOE」化。
在此之前,阿里是通過將傳統資料庫直接搬到雲上來解決電商業務突發的波峰波谷峰值變動帶來的挑戰,然而,這種方式無法完全解決上述業務發展過程中遇到的挑戰。
PolarDB的出現,也就成了必然。
自2017年開啟公測以來,阿里雲PolarDB資料庫經歷了商業化、雲原生化、Serveless化,也正在經歷著如今的智能化。
1月17日,在首屆阿里雲PolarDB開發者大會上,阿里雲再次發布PolarDB「三層分離」新版本,這一基於智能決策的新版本,實現了查詢性能的10倍提升,成本也節省了50%。
而智能化,也正在成為阿里雲PolarDB的關鍵詞。
資料庫和「搭積木」
2017年9月21日,阿里雲自研資料庫PolarDB正式對外發布。
「從PolarDB誕生的那一天起,中國資料庫就進入到了以雲原生為核心的新的資料庫發展階段,」阿里雲資料庫產品事業部負責人李飛飛在大會上如是說。
之所以說雲原生資料庫具有開創性,是因為它為資料庫帶來了關鍵性能的提升,諸如一體化的數據處理能力、極致的穩定性和彈性、友好的用戶體驗,以及TCO的大幅度提升。
有了這些特性的加持,PolarDB也得以很好地完成了歷年來為天貓雙十一保駕護航的重任。
而天貓雙十一,是全球每年最大的流量洪峰,TPS峰值紀錄高達1.4億次/秒,訂單峰值高達58.3萬筆/秒。
正是在經過這樣淬鍊後,PolarDB從支撐阿里內部電商業務開始,到支持起阿里本地生活、高德地圖等越來越多的關鍵業務。
對外,PolarDB在2018年開始走上了商業化道路。
據阿里官方公布數據顯示,目前PolarDB全網部署CPU核數已經超過100萬核,在全球超過80個可用區實現了資料庫實例部署,擁有超過10000家企業用戶。
另一份來自IDC的統計數據顯示,阿里雲PolarDB已經連續4年穩居中國關係型資料庫市場份額第一,其中,在公有雲市場份額更是超過了40%。
在擁有如此多用戶,尤其是PolarDB提供的技術、專屬引擎也越來越多後,阿里雲PolarDB研發團隊開始思考另一個問題——如何讓PolarDB的使用變得更簡單、更易用。
於是,阿里雲PolarDB研發團隊引入了「搭積木」的說法,阿里雲PolarDB MySQL產品部負責人楊辛軍解釋稱,「我們就是要把每一個資源、每一個引擎作為一塊『積木』,這樣,客戶就可以像買東西一樣來選他需要的『積木』,從而適配自己的場景。」
為此,阿里雲在本次大會上推出了資料庫場景體驗館、訓練營,並且對外發布了PolarDB「三層分離」新版本。
阿里云為什麼要做三層分離架構?
楊辛軍解釋稱,「我們原來CPU和存儲是掛載在一起的,CPU和存儲資源的使用往往很難做到完全平衡,因而,我們將存儲單獨分離出來,在PolarDB新版本中形成了三層分離架構。」
簡單易用,是阿里雲PolarDB基於用戶思維的一個重要發展方向,而談到技術發展方向,李飛飛稱,PolarDB將會向著「四化」演講——雲原生化、平台化、一體化和智能化。
其中,尤以智能化最為關鍵。
資料庫的智能化新趨勢
「資料庫和智能化結合,是接下來一個非常重要的發展方向。」李飛飛在會後接受媒體採訪時如是說。
具體而言,李飛飛從三個方面解釋了資料庫智能化的趨勢:
第一,在PolarDB已經具備的NL2SQL、NL2BI的能力上進一步延伸,就可以在資料庫內部實現結合大模型的一站式使用體驗。
大模型在落地過程中,進行推理時採用的是RAG框架,對於大多數企業和開發者而言,這一框架使用起來會有一定的挑戰性,如何簡化大模型的使用,就成了一個關鍵問題。
第二,基於大模型的深度AI推理會變得越來越重要。
這樣的需求對資料庫提出了更高的要求,如今,阿里雲PolarDB與通義千問大模型的對接工作也在緊鑼密鼓的展開中,我們也會更加深度地使用智能化分析能力。
第三,我們需要通過技術創新來支撐資料庫智能化。
例如,我們現在有專屬的向量資料庫,但是我認為除了專屬的向量資料庫,主流資料庫同樣需要增加對向量數據類型的支持,我們PolarDB在支持向量數據類型,也在做CPU、GPU等異構硬體的推理優化。
第四,資料庫智能化運維。
自動駕駛汽車本質上是一個實時調參的系統,這方面,資料庫智能化運維和自動駕駛汽車一樣。我們PolarDB在推出三層架構後,內存資源池、存儲資源池、計算資源池如何根據業務負載動態進行分配,分布式資料庫架構如何做好分布式的資源分配等,將會越來越多地藉助AI的力量。
實際上,就在大會現場,阿里雲還邀請到了一位年僅11歲的小開發者,用一句大白話就能生成專業的SQL語言,還可獲得可視化的數據分析結果。
在此之前,這位小開發者並沒有太多的資料庫知識基礎。
這也正是資料庫與智能化結合後的魅力所在。