大數據,大野心
數據已經成為許多企業和組織的一項寶貴資產。他們正在對數據進行分析,以獲取有關市場、客戶和自身運營的洞察。他們正在利用數據來推動數字化轉型計劃並支持新的數據密集型服務。大量的數據也是人工智慧和機器學習計劃的重要組成部分。
但整理、管理和分析數據是當今一項重大挑戰。據市場研究機構IDC稱,創建、捕獲、複製和消費的數據總量每年增長20%以上,預計到2027年將達到約291 ZB。
這也是為什麼大數據初創公司源源不斷地開發領先技術來幫助企業訪問、收集、管理、移動、轉換、分析、理解、測量、治理、維護和保護數據。
以下來看看2023年備受關注的10家大數據初創公司。
Airbyte
將數據從運營應用和資料庫轉移到數據倉庫、數據湖和其他分析系統是數據分析中最具挑戰性的步驟之一。
市場上有很多商業數據移動和集成工具,但Airbyte憑藉它的開源數據移動/數據集成引擎以及用於設置和運行數據移動操作的連接器,吸引了人們的關注。
今年9月該公司表示,在短短三個月內,Airbyte的用戶社區已經使用Airbyte在今年6月推出的無代碼連接器構建器構建了1500多個數據連接器。10月,該公司宣布推出了矢量資料庫連接器,這種連接器對於把數據源連接到AI應用是至關重要的。
Airbyte成立於2020年,總部位於美國舊金山,在2021年12月進行的B輪融資中獲得1.5億美元。
Astronomer
Astronomer開發了Astro統一數據編排平台,用於集中數據流的可見性、控制並簡化數據管道部署。該系統可以幫助企業和組織擴展大規模數據集成、數據分析以及AI和機器學習任務,滿足關鍵的金融服務、零售和電子商務應用的數據需求。
Astro基於開源的Apache Airflow工作流管理技術(最初是由Airbnb開發),用於數據工程管道。
12月6日,Astronomer推出了最新版本的Astro,具有簡化的連接管理功能、新的系統升級實用程序和新的系統部署功能,以降低運營成本。
Astronomer成立於2018年,總部位於辛辛那提和舊金山,並在2022年3月進行的C輪融資中獲得了2.13億美元。Astronomer在2023年初進行了裁員,但根據9月份的報告顯示,今年上半年Astronomer的收入同比增長了206%。
Hex
大數據行業有眾多公司開發了用於管理、集成、轉換、分析和可視化數據的複雜技術,但共享和發布分析任務的結果仍然是一大挑戰。
Hex Technologies開發了Hex平台,一個用於協作分析和數據科學任務的現代數據工作空間系統。該平台包括了AI驅動的工具、協作數據筆記本、用於開發具有數據可視化的應用的工具以及數據集成技術——所有這些都使得使用交互式數據應用和故事連接和分析數據以及共享工作成為可能。
Hex總部位於美國舊金山,是由McCardel、首席技術官Caitlin Colgrove和首席架構師Glen Takahashi在2019年創立的,之前他們曾在Palantir共事過。Hex在2022年3月進行的B輪融資中獲得了5200萬美元。
今年10月,Hex推出了Hex 3.0,其中包含新的AI功能、新的計算引擎、新的元數據引擎以及用於將洞察轉化為交互式體驗的App Builder工具。今年早些時候,Hex推出了Hex Magic工具,將大型語言模型的強大功能直接引入Hex工作區。
Momento
Momento在2022年11月憑藉Momento Serverless Cache產品走出隱身模式,該產品可以優化和加速在AWS或者谷歌雲上運行的任何資料庫。
緩存通過更快交付常用的或者經常使用的數據來加快資料庫響應。但Momento的創始人認為,當今的緩存技術並不是為當今的現代雲堆棧設計的。Momento稱,高度可用的Momento緩存技術每秒可以執行數百萬此處理,並作為後端即服務平台運行,這意味著用戶無需管理基礎設施。
Momento總部位於美國西雅圖,由首席執行官Khawaja Shams和首席技術官Daniela Miao共同創立,兩人曾在AWS工作,並且是亞馬遜專有NoSQL資料庫服務AWS DynamoDB背後的工程負責人。
MotherDuck
6月22日,MotherDuck推出了MotherDuck無伺服器雲分析平台的第一個版本,該平台結合了雲和嵌入式資料庫技術,可以輕鬆分析數據,無論數據位於何處。
該平台是基於MotherDuck的DuckDB開源嵌入式資料庫,通過將進程內資料庫的速度與雲的可擴展性相結合,這個雲系統可以輕鬆地分析任何規模的數據。
MotherDuck 認為,近年來數據分析的大部分進步都面向擁有超過 PB 數據的大型企業和組織,而忽略了擁有類似數據量的中小型公司。
MotherDuck總部位於美國西雅圖,是由Google BigQuery創始工程師Jordan Tigani在2022年聯合創立的,現在擔任該公司的首席執行官。今年9月,MotherDuck在B輪融資中獲得了5250萬美元,融資總額達到1億美元。
Onehouse
初創公司Onehouse標榜自己是「數據的新基石」,為雲原生、完全託管的數據湖站服務打造了基礎。
該公司的服務是基於Apache Hudi的,一個開源事務數據湖項目,可為數據湖帶來資料庫和數據倉庫功能,其目標是充當不同數據存儲庫之間的數據集成層。
Onehouse成立於2021年,總部位於美國加利福尼亞州門洛帕克,在2022年初走出隱身模式。
今年2月,Onehouse在A輪融資中獲得了2500萬美元。Onehouse還推出了新的Onetable技術,讓用戶能夠利用基於Hudi的數據湖屋,同時充分利用Databricks和Snowflake中的原生性能加速功能。
Starburst
數據湖分析平台開發公司Starburst成立於2017年,是大數據領域較為成熟的初創公司之一。但Starburst憑藉其基於公司核心的MPP SQL查詢引擎(基於Trino開源技術構建)繼續加快發展勢頭,實現了對分布於多個數據源的大型數據集的查詢。
Starburst的產品組合包括Starburst Enterprise平台和Starburst Galaxy完全託管雲服務。今年9月,Starburst通過新的雲遷移功能(包括Starburst Galaxy中的本地連接)擴展了這兩個功能,隨後在11月推出了在Starburst數據湖上構建交互式應用的新功能,包括用於近實時分析和自動化數據治理的流式攝取。
Starburst總部位於美國波士頓,在2022年2月進行的D輪融資中獲得了2.5億美元,融資總額達到4.14億美元,當時的估值達到33.5億美元。
Telmai
數據可觀測性是大數據領域最活躍的領域之一,過去五年中湧現了很多初創公司,提供監控數據流的技術以提高數據質量和可靠性。
Telmai成立於2020年,總部位於美國舊金山,是較新的初創公司之一。Telmai以AI驅動的數據可觀測性平台可以幫助數據團隊使用一系列數據質量指標和KPI來自動監控數據管道過程,並主動實時檢測和調查數據異常。
Telmai在今年9月發布了新版本的軟體,其中包含許多新功能旨在簡化和加速數據可觀測性的採用,包括歷史數據的「時間旅行」回溯性分析、跨三大公有雲的私有雲選項、以及針對異構數據管道的端到端可觀察性。
Telmai在今年6月獲得了550萬美元的種子資金。
Tessell
Tessel採用了與傳統雲資料庫不同的方法。Tessel的雲原生託管資料庫即服務並沒有採用自己底層專有的資料庫引擎,而是支持Oracle、Microsoft SQL Server、Postgres和MySQL資料庫。
Tessel表示,憑藉自己運行在Azure或者AWS雲平台上的數據基礎設施和管理平台這一獨特設計,可以以更高的性能和更低的成本運行重型事務資料庫工作負載。
Tessell總部位於美國加利福尼亞州聖拉蒙,由首席執行官Bala Kuchibhotla和副總裁/工程負責人Kamal Khanuja在2021年創立,兩人此前都曾在Nutanix和Oracle工作。Tessell在2022年11的A輪融資中獲得了來自Lightspeed Venture Partners的3400萬美元。
Vendia
Vendia開發了一個基於區塊鏈技術的數據協作平台,通過跨公司、雲、系統和業務網路實現實時數據共享和工作流程自動化,幫助組織克服「數據蔓延」。
Vendia(公司名稱源自顯示重疊數據集的「維恩圖」)成立於2020年,總部位於美國舊金山。Vendia在2022年5月的B輪融資中獲得了3000萬美元,融資總額達到5000萬美元。