2025 TDBC 大會歸來...
原創近日,參加了由信通院舉辦的 2025 TDBC 大會,作為年度數據庫行業重要會議之一,個人也全程參與了此次大會。會上除了發布數據庫產業圖譜、數據庫研究報告外,還吸引來自行業、產業界的很多老師做了專題分享。內容很多,本文摘取點滴,從市場、趨勢、技術、實踐等多角度,談談我的一些理解。
1. 行業趨勢篇
1)市場規模增長與云端差異
從發布的數據庫行業研究報告來看,國內數據庫市場仍然保持了高速發展態勢,雖然增速有所減緩。其實從全球來看,中國的數據庫市場還遠遠與其地位不符,相信未來會有更大的市場空間。從環境來看,無疑云還是占據了增長的主要部分,本地部署形態增長緩慢。
圖片
2)企業洗牌,行業加速收斂
從數據庫企業數量來看,正在經歷快速收斂的態勢。其實近期從很多第三方機構也都獲得了類似的信息,國內數據庫企業快速減少。隨著如國測名單等政策引導相繼出臺,市場用腳做出了自己的選擇。只有那些有實力、肯投入、成規模的企業能夠最終活下來。從社會資源集約化配置來看,這也是最優的一種選擇。避免國內企業的低層次內圈,鼓勵通過市場化手段完成產業重塑。不過對于用戶來說,這也預示著一些風險。
圖片
3)AI 正在塑造下一代數據庫
數據庫行業正在AI驅動下,即將進入一個新的階段。從下圖最新的Gartner分析報告來看,與AI+Data相關技術正處于快速上升階段。AI的到來對數據庫提出了更多的需求,包括向量多模、智能自治、數據治理等。數據庫正在經歷一場變革...
圖片
Data 與 AI在未來將更加深入的融合,作為數據的載體,數據庫也將提升到數據底座層面(現有所提的AI-Ready,正是這一能力的表現)。數據庫正在快速外展它的能力,更好地適應 AI 時代對數據底座的要求。
圖片
4)信創+AI,經歷現在與未來
從數據庫發展來看,如下圖所示經歷了幾個階段。目前我們正處于一個交叉的階段,一方面以國產信創升級為代表,這幾年開始步入關鍵期(如下下圖),國產數據庫很多也都吃到了紅利;另一方面是AI技術的發展與應用,近一兩年開始進入活躍期,正開始影響了數據庫行業的整體發展。如果說前者代表著現在,那么后者就預示了未來。國產數據庫正以信創為起點,打下基礎,為后續AI時代真正帶來做好準備。
圖片
圖片
2. 產品技術篇
1).AI 重塑數據庫企業產品
從數據庫企業來說,規劃產品的AI能力成為必然,但是各家的投入程度不同。下面幾張圖是幾家數據庫企業的AI產品能力。有些僅從AI for DB層面,從外圍工具入手嘗試使用;有些則從內核入手,快速植入了AI能力,甚至在上層開始支持AI應用。后者已經不能理解是簡單的數據庫了,可以說是數據智能平臺。目前這一領域還是在快速發展之中,各家企業也都在嘗試多種可能,有點類似“軍備競賽”的感覺,可以很初級,但是不能沒有。
圖片
圖片
圖片
2)AI 賦能企業數據庫使用
從甲方用戶來講,AI 更多是賦能數據庫的使用。無論是之前的數據庫使用者、開發者,都可以從AI中受益。特別是一些較大的數據庫甲方,可以嘗試自建數據庫智能運維體、智能開發平臺等。
圖片
圖片
圖片
圖片
3)一體化/融合成為共識
此次大會上,很多數據庫廠商都不約而同提到了融合或一體化的理念,但各家的定義有所區別。有的是架構一體化,包含從單機、主備、共享與分布式;有的是模型一體化,提供多模數據存儲與統一訪問;有的是計算一體化,將關系查詢SQL與智能處理AI結合在一起;有的則強調是場景的一體化,通過單一產品適應不同場景。這其中背后的邏輯都是一樣的,那就是盡量簡化使用者的技術棧,通過一系列一體化能力,簡化選型、簡化使用、簡化管理。
圖片
圖片
圖片
圖片
圖片
4)共享集群成為“新熱點”
作為一種經典架構,相應DBA們對Oracle RAC都非常熟悉。在過去20~30年,大量企業的核心應用都構建于此,曾幾何時這一架構被人們忽視了,隨著而來的是對分布式架構的追捧,究其根本還是產品能力尚的不足,導致不得不通過分布式架構來解決內核能力的不足。近兩年來,一批國產數據庫廠商開始發力,在共享存儲集群領域獲得突破,后者正成為除超大規模外的更普惠、更具性價比的解決方案。
圖片
圖片
圖片
5)兼容性,形似容易神似難
幾乎所有廠商都談到了兼容性,并且都羅列出了兼容能力。這里有一個誤區,就是兼容性本身就沒有標準范圍,大家各自談到的兼容性外延各不同。常見的就是語法兼容性(包括類型、函數、過程等),還有則是更高層級的語義兼容、生態兼容,甚至還包括不算兼容的兼容性能力(如性能不衰退等等)。比較可喜的是,各家一方面都比較重視兼容性,一方面也都通過工具等手段將不兼容的情況提前識別出來。那么從用戶角度來講,要有一個清醒的認識,就是沒有兩款產品是完全兼容的,不兼容的情況是一定,要做好不兼容的各種預案,包括預留必要的資源來改造。
圖片
圖片
圖片
6)高可用,老生常談的問題
高可用是數據庫的基礎能力之一,可以說是老生常談,但有不能忽略。特別是在企業的核心業務替換中,高可用是最不能被忽略的評估項。下面幾圖就是廠商談到的自己全方位的高可用能力。
圖片
圖片
7)產品體系,從能用到好用
隨著國產數據庫使用不斷深化,廠商已經從獨立產品的構建,演變為體系化的產品布局。用戶想使用好數據庫,不能僅僅滿足于提供一個單品,更要更為強調體系、乃至生態的作用。下圖正是廠商構建的數據庫全生命周期的產品家族,滿足從選型評估、遷移同步、開發優化、運維管理、診斷排障等,覆蓋全場景的產品系列。同時也有很多第三方的廠商也發力于此,提供滿足多種數據庫的此類能力。
圖片
圖片
3. 生產實踐篇
1)產品選型,從經驗到體系
隨著用戶對國產數據庫使用深入,各家也都逐漸摸索出選型的評估方法。如果說原來更多靠案例、靠口碑,現在則開始依靠評估體系。隨著廠商數量的快速收斂,未來選型方面會逐步簡化,頭部趨勢開始明朗。后續用戶會逐步根據自身情況,構建起多層次、多架構的自有技術棧選型方案。
圖片
圖片
圖片
2)系統上線,走好最后一公里
原來曾寫過一篇文章,談到走好信創最后一公里的問題,其核心數據庫的替換,特別是最后面臨割接上線、雙軌并行等問題。各家廠商都經歷了大量案例實踐,總結出一系列方法來幫助用戶快速落地。其實從用戶角度來講,一個完善的從評估、驗證、適配、改造、測試、遷移、并軌、割接的整體方案,是非常有意義的。這也是廠商從簡單的產品PK,逐步過渡到方案比拼,回歸到用戶關注的核心問題,如何平滑順利上線。
圖片
圖片
圖片
圖片
3)其他:分片、跑批、遷移
下面是在生產實踐中一些零散的總結,包括如何做數據分片,如何提升跑批性能,如何完成遷移及回退等。這些都是在實踐中的寶貴經驗,也值得同業者來學習借鑒。
圖片
圖片
圖片

























