從百度的「反恐24小時」到創立StarRocks,鏡舟科技CEO孫文現的職業生涯始於百度,一個大數據工程師「苦逼」的起點。
鏡舟科技CEO 孫文現
萌芽:StarRocks從「痛苦」中誕生
當時,時任百度高級研發經理的孫文現正參與開發統計系統——「福爾摩斯」,為廣告主提供效果監測。那時,「福爾摩斯」的前台採用Apache PHP的配置環境,後台則搭載MySQL資料庫。
而面對著日益增長的日誌量和數據量,當時「Apache PHP」後端搭配MySQL資料庫的方式,已難以招架大規模的數據挑戰。這讓孫文現和他的團隊陷入到緊張的數據恢復工作中,最後甚至演變到每周迎接一次的「反恐24小時」行動。
想起那段「痛苦」的經歷,孫文現的思緒回到了那些年「凌晨三點」的加班日常。他回憶說:「凌晨三點是跑批任務的關鍵時刻,也是我們壓力最大的時候。因為凌晨三點之前要把所有數據全部跑出來,否則一旦數據丟失就會引起廣告主投訴。」
那段「日常」,讓孫文現意識到,傳統的MySQL資料庫已經無法應對日益複雜的數據處理需求。這時,一個更深遠的方案開始在他腦海中初具雛形——把後台的MySQL改造成標準的OLAP(聯機分析處理)結構,並最終發展成MPP(大規模並行處理)結構。這也是後來孫文現創建StarRocks的主要指導邏輯。
於是,為了把這個想法變為現實,2014年,孫文現決定離開百度,先後從創建智雲科技(AbleCLOUD)擔任COO開始,到金山雲金融事業部銷售總經理和雲計算產品中心副總經理。這些經歷加深了他對大數據平台的理解,也為他後來創建鏡舟科技和StarRocks積累了寶貴的經驗和洞察。
終於,2022年隨著業界一聲「炸雷」響起,一款基於StarRocks由具備水平在線擴縮容,金融級高可用,兼容 MySQL 5.7 協議和 MySQL生態,同時提供全面向量化引擎與多種數據源聯邦查詢等重要特性的極速統一的Lakehouse產品——「鏡舟資料庫」橫空出世,鏡舟科技也因這款自研產品,開始在業界聲名鵲起。
回憶起這些年的職業生涯,孫文現感慨道:「我的職業生涯和我目前做的事情完全匹配,這或許就叫『人事合一』吧。」
崛起:緩解企業數字化「陣痛」
從建立到如今,短短不到兩年時間,鏡舟科技營收規模以每年超過兩倍的速度增長,產品應用於金融、零售、製造、遊戲等各行業頭部企業,基於StarRocks打造的企業級產品經歷了近百次POC,成功率達到90%以上。目前,已有超過300家市值10億美金的企業使用StarRocks。
至於為何鏡舟科技的「擴張」速度如此驚人,孫文現思索良久後回答:「或許是因為我當年的經歷,與當下企業數字化轉型初期所經歷的「陣痛」恰巧吻合,所以鏡舟資料庫才能更好的貼合客戶需求。
當孫文現重新瀏覽數字化轉型「新舊交匯」的時代軌跡。走進溫州和東莞的老舊鞋廠,親眼目睹了從傳統手工到數字化的躍遷。又研究了「奈雪的茶」和「瑞幸」的成功營銷幫助公司轉危為安的案例.....孫文現意識到,數字化轉型不僅僅是技術的升級,數字化工具也不僅是輔助工具,更是企業決策和分析的核心。而想要緩解「陣痛」,則將經歷企業數字化轉型兩個關鍵階段時關注幾個重點問題。
數字化升級階段,是絕大多數企業當前關注的重點。這個階段中,企業一方面要在大數據和數據分析領域實現智能化,實施「業財一體化」。「業財一體化」是企業決策和分析的核心,而在這其中,數據成為了決策的關鍵。這緣於「業財一體化」涉及的所有後台的人、財、物,包括員工薪資、人員績效等分析等核心交易場景,而這些場景「至關重要、不容有失、不允許出錯」。
另一方面,由於部分企業負責人對所需數據不明確,導致需求頻繁變化,促使自助報表興起。所以,企業的關注點應該放在驗證特定想法的正確性,利用報表等工具實現明確的目標。
智能化改造階段是數字化轉型的關鍵一步。這一階段的難點在於滿足三個條件:足夠大的數據量、強大的計算能力,以及低廉的計算成本。孫文現舉例稱,金融是他重點關注的行業,由於強監管的特點,使其成為數據量充足的典型例子。
「這些企業關注的重點,就是鏡舟資料庫目前最好的賣點」。孫文現如是說。
制衡:開源與商業化融合
除了產品的硬核實力,開源與商業化並重也是用戶選擇鏡舟科技的重要原因之一。孫文現表示,與阿里雲、騰訊、小紅書、滴滴等網際網路公司共同建設的StarRocks開源社區,為制勝場景的誕生提供了肥沃的土壤,各行各業、各種需求在社區中碰撞、交融,產生出StarRocks的制勝場景。
然而,許多數據企業往往重視商業化,卻忽視的開源的作用。而鏡舟科技的開源和商業化戰略,在實用主義與夢想主義間形成了微妙平衡——「開源和商業化可以相互促進、相互融合,協同發展。」用孫文現的話說,「我們不做『我花開後百花殺』的企業,同等對待開源用戶和付費用戶,採用相同的思維和模式來推動兩者融合。就是希望能夠推動產業鏈做更加繁榮。」
為了保持創新和用戶需求之間的平衡。鏡舟科技採用開源與商業化「雙擎驅動」的戰略。這種戰略能夠使讓鏡舟科技在獲取資源的同時,不失創新的「風帆」。
不言而喻,以開源項目為核心的開源社區通過眾多開發者參與,構建起一個開放創新的生態體系,能加速技術、產品和服務創新,對商業化的戰略意義重大。而商業化也對開源社區的發展意義重大,商業化不僅是開源項目成功與否的重要衡量標準,也能反哺促進開源社區持續發展。
兩年來,在「雙擎驅動」的推進下,不僅加快了鏡舟科技產品和服務的提供速度,同時隨著產品和企業成熟度提升,鏡舟科技的市場競爭力也不斷增強。
進化:向著雲原生和大模型
現在,在戰略驅動下的鏡舟科技,正致力於將鏡舟資料庫引領至新的高度。未來,鏡舟科技將持續進化,朝著雲原生方向繼續邁進,同時在大模型時代發揮關鍵作用。
產品疊代方面,鏡舟資料庫下一步將推動實時分析鏈路進一步精簡,通過ETL on lakehouse,all in one的作業模式,幫助企業低成本、高效率地發掘數據價值。StarRocks社區也將從大廠生產環境中持續吸收靈感和助力,給業界帶來更多驚喜。
在發展方面,孫文現則期待道:「希望在2025年,鏡舟科技能夠通過採用訂閱模式來實現營收的穩定增長,以及克服中國SaaS市場中單價下降帶來的挑戰。同時,未來將聚焦金融行業、新零售(新經濟)、製造業以及網際網路和遊戲的國際擴展等行業。
而對於這些重點行業,孫文現認為,私有化大模型對金融和製造業等具備複雜供應鏈鏈的行業而言,具備巨大潛力,可有效避免潛在的「雪崩效應」。而StarRocks的最新框架實現了存儲與計算的分離,引入了湖倉(Lakehouse)概念,結合了數據湖和數據倉庫。其允許統一存儲結構化和非結構化數據的技術優勢,對於企業構建私有化大模型至關重要。
在談及這一點時,孫文現眼中略顯興奮。他認為,未來或許是一個私有化大模型定義的時代,發展前景十分樂觀。
而後,他眼神變得堅定,沉言道:「雖然在大模型時代,我們可能還不是主角,但作為開發者和算力提升者,我們仍將努力為發揮關鍵作用,為時代發展貢獻力量。」