宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

AI算力爭奪戰中,誰會成為下一個Cerebras?

2026年05月29日 首頁 » 熱門科技

對AI模型運行所需算力的強勁需求持續攀升,但任何入局者都必須跨越兩大障礙:獲取合適的晶片,以及將晶片部署進數據中心並開始創造收益。

General Compute是一家新興的推理雲服務商,專注於AI模型完成訓練後的推理階段——即模型實時運行並響應用戶請求的環節。這家公司針對上述兩大問題給出了自己的答案,也由此揭示了AI生態系統的未來走向。憑藉這些答案,General Compute完成了一輪1500萬美元的種子輪融資,投後估值達6000萬美元,由FUSE VC領投,Carya Venture Partners和Village Global Ventures參投。

那麼,什麼才是合適的晶片?GPU的需求量已急劇攀升,但業界越來越形成共識:GPU並非運行AI模型的最佳選擇。AI模型在推理階段——即主動生成響應的過程——所需的算力結構與訓練階段存在本質差異,專為推理設計的新一代晶片正在興起。英偉達AI算力爭奪戰中誰會成為下一個Cerebras去年12月斥資200億美元收購Groq,以及Cerebras上周完成的570億美元IPO,都印證了這一趨勢。

在Groq和Cerebras產能均趨於緊張的背景下,General Compute聯合創始人、CEO Finn Puklowski與CTO Jason Goodison找到了另一條路——採用SambaNova的專用晶片。SambaNova是一家專注於推理晶片的英特爾系企業,近年來在矽谷的聲量有所減弱。

但隨著SambaNova今年推出新一代晶片,這一局面或將改變。新架構靈活性更強,在推理計算過程中採用更大容量內儲存存上下文,SambaNova聲稱其性能不僅超越GPU,更優於Groq、Cerebras等公司的同類專用晶片。Puklowski透露,新晶片的Token生成速度可達每秒600至700個,而GPU約為每秒250個。

General Compute已訂購價值3億美元的SambaNova SN50晶片,並稱將成為首家部署該晶片的雲服務商。

這款晶片還順帶解決了第二大難題——部署場所問題。SN50採用風冷而非水冷設計,功耗更低,可直接安裝於現有數據中心設施,無需新增基礎設施投入。

Puklowski正在積極拓展託管合作協議,這種模式下General Compute將自有硬體部署於合作方的場地。合作對象不僅限於數據中心運營商,還包括加密貨幣礦工——由於比特幣生產成本長期高於幣價,這些礦工正尋求將現有基礎設施轉型再利用。

General Compute已於上周正式推出雲服務,並宣稱目前在運行強大開源大語言模型MiniMax 2.7方面速度最快。

風險投資人Joe Hassleman早在2021年便投資了Groq,踏上了推理算力浪潮的早班車。今年,他設立了專注AI領域的新基金Evercrest Partners,並將General Compute作為首個投資標的。在他看來,SambaNova與General Compute的合作關係,與Coreweave和英偉達的深度綁定如出一轍,也頗似Groq在晶片製造與其前雲服務之間的協同模式。

"他們確實需要找到一批優質客戶,把晶片部署進高速增長的應用環境中,"Hassleman說,"General Compute在押注SambaNova,而SambaNova同樣在押注General Compute,雙方是相互賭注的關係。"

真正的核心問題在於:在AI的未來圖景中,哪種計算架構將成為最大的價值收割者?推理雲服務的崛起,本質上是對一個多模型、多智能體共存世界的隱性押注——在那個世界裡,沒有任何單一供應商能夠一統天下,推理的速度與成本將成為核心競爭變量。本周OpenRouter完成的1.13億美元B輪融資正是佐證——該公司能夠為客戶提供多模型接入,幫助優化Token使用成本。

在這套邏輯中,速度至關重要,直接影響價格與能力表現。Puklowski希望將編程智能體原本需要一小時完成的任務壓縮至五到十分鐘,同時讓用於客服場景的語音智能體——其對話流暢度高度依賴推理速度——變得更加經濟實惠。"如果ChatGPT能給你每秒50個Token的輸出速度,已經遠超人類的閱讀速度了,"Puklowski對TechCrunch說,"但現在的場景已經演進到智能體之間的互動,智能體要替我們讀取資訊、查詢資料庫,它們需要更快。"

Q&A

Q1:General Compute是一家什麼樣的公司?它主要做什麼業務?

A:General Compute是一家專注於AI推理階段的新興雲服務商,提供AI算力租賃服務。與訓練階段不同,推理階段是指模型完成訓練後實時響應用戶請求的過程。該公司採用SambaNova的專用推理晶片,主打高速、低成本的推理雲服務,目前已上線雲服務平台,並宣稱是運行開源大語言模型MiniMax 2.7速度最快的服務商。

Q2:SambaNova晶片相比GPU和其他專用晶片有哪些優勢?

A:SambaNova新一代晶片在推理場景下具備多項優勢:Token生成速度可達每秒600至700個,是GPU(約250個/秒)的兩倍以上;架構更靈活,推理計算時上下文儲存內存更大;採用風冷設計、功耗更低,無需改造現有數據中心即可部署,大幅降低基礎設施成本。SambaNova聲稱其性能超越GPU,以及Groq、Cerebras等同類專用晶片。

Q3:推理雲服務為什麼越來越受到資本關注?

A:隨著AI應用從單一模型響應向多智能體協作演進,推理速度和成本成為關鍵競爭變量。智能體之間需要高速交互、實時讀取數據,對推理性能要求遠超人類交互場景。資本正在押注一個多模型共存、無單一供應商主導的AI生態——在這個生態中,推理雲服務商有望占據重要價值節點。Groq、Cerebras的高估值,以及OpenRouter本周完成的1.13億美元融資,均印證了市場對這一賽道的高度認可。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新