資訊在沃

數據庫泰斗Stonebraker談行業變遷:AI挑戰下,年輕人擇業需謹慎

   發布時間:2026-05-03 09:01 作者:王婷

Mike Stonebraker,這位2014年圖靈獎得主,因其在數據庫系統領域的開創性貢獻而廣受贊譽。他的研究成果不僅被寫進教科書,還催生了多個商業上成功的工程系統,如Ingres、Postgres、Vertica、VoltDB和SciDB等。最近,Stonebraker做客meta資深工程師Ryan Peterman的播客,分享了他對數據庫行業的深刻見解以及對人工智能(AI)的獨到看法。

在對話中,Stonebraker直言不諱地批評了行業中的一些做法。他提到,Oracle的創始人Larry Ellison在推廣產品時,常?;煜F在時和將來時,實際上是在對客戶撒謊。他還對Google過去推崇的MapReduce和最終一致性表示質疑,認為這些技術不僅效率低下,而且在處理復雜數據時存在嚴重缺陷。對于亞馬遜同時維護多個數據庫系統的做法,他也認為過于冗余,建議精簡至三個以內。

談到AI,Stonebraker認為當前的agentic AI大多還停留在“只讀”階段,即只能進行數據分析和預測,而無法真正修改數據庫中的數據。然而,一旦AI開始進行讀寫操作,比如兩個agent協作完成轉賬,問題就會回到數據庫的核心領域:事務、一致性和原子性。他指出,盡管大模型在公開的text-to-SQL基準上表現不錯,但在真實生產環境中的準確率卻極低,甚至為零。這表明,至少在可見的未來,這項技術還不足以投入生產使用。

Stonebraker還分享了他對數據庫系統發展的看法。他認為,一種數據庫不可能解決所有問題,針對不同需求設計專門的數據庫方案才是正確的方向。他舉例說,流處理數據庫、列存數據庫和關系數據庫在實現上完全不同,但每種都比通用數據庫快一個數量級。因此,使用不適合工作負載的數據庫會付出巨大的性能代價。

在談到自己的職業生涯時,Stonebraker回憶了他在伯克利大學如何從零開始構建Ingres和Postgres的過程。他強調,學術版Ingres最初的目標是支持地理信息系統(GIS),但由于數據類型限制而失敗。這一教訓促使他在Postgres中設計了可擴展的類型系統,使其能夠高效支持各種抽象數據類型。這一創新大大擴展了Postgres的適用范圍,使其成為開源關系型數據庫的首選。

對于年輕工程師,Stonebraker建議他們尋找那些能夠挑戰自我、實現三倍于合理工作量目標的機會。他認為,真正出色的工程師通常能夠輕松應對深度技術問題,而識別不聰明的人也只需通過簡單的對話即可。他還提到,自己天生不適合大公司的官僚環境,更喜歡在學術界和創業領域發揮作用。

在對話的最后部分,Stonebraker介紹了他的最新項目DBOS(Database Operating System)。這個項目起源于一個學術想法:用數據庫技術來管理操作系統中的大規模數據。盡管最初的目標是替換Linux內核,但實際商業化的產品更側重于編程語言和持久化工作流。DBOS支持多種編程語言,并在云環境中表現出色,尤其在處理agentic AI的讀寫操作時具有原子性和一致性的優勢。

對于數據庫領域的未來,Stonebraker認為,盡管大模型在text-to-SQL任務上表現不佳,但隨著技術的進步,這一問題有望得到解決。他強調,將所有數據轉化為表格形式,并利用查詢優化器進行連接,是處理復雜結構化數據的有效方法。他還看好agentic AI在讀寫操作中的發展潛力,認為這將是一個充滿機遇的領域。

 
 
更多>同類內容
全站最新
熱門內容