近兩年前,當整個世界意識到生成式AI改變遊戲規則的能力以及使其成為可能的強大晶片時,半導體行業再次引發了人們新的興趣。其中,最大受益者是Nvidia,但同時各種初創公司都在尋求挑戰這家AI晶片巨頭或者是尋找其他可以顛覆的領域。
雖然半導體初創公司面臨的風險仍然很高——成本通常比早期軟體公司高得多——但今年該行業可能增長高達20%的預期可以讓他們從中受益,之所以有如此高的預期,一部分原因是市場對AI晶片有著強勁的需求。
這為Cerebras Systems、Hailo和Kneron等AI晶片初創公司製造了很大的空間,他們可以從IDC在12月預測的預計支出增長中分一杯羹,其他希望顛覆AI計算晶片設計方式的半導體初創公司還包括Celestial AI、Eliyan、Rivos和Tenstorrent等等。
Celestial AI
高管:創始人、首席執行官David Lazovsky
Celestial AI表示,正在通過自己的Photonic Fabric光學互連技術克服延遲和帶寬方面的瓶頸,為AI計算技術進步鋪平道路。
這家總部位於美國加州聖克拉拉的初創公司在今年3月宣布,已經在C輪融資中獲得1.75億美金,而且這輪融資是「超額認購」的,由U.S. Innovative Technology Fund領投,AMD、三星、大眾集團控股公司Porsche SE的風險投資部門參與。
同樣是的3月,這家矽光子初創公司表示,超大規模企業(全球最大的數據中心基礎設施消費者)和半導體公司「進入到技術採用的初期階段,目前正在設計Photonic Fabric光學晶片」。據Celestial AI稱,這種將光學晶片集成到多晶片封裝中的做法,正在日益成為高性能處理器的常態,與「其他最先進技術」相比,封裝外帶寬可提高25倍。
Cerebras Systems
高管:聯合創始人、首席執行官Andrew Feldman
Cerebras Systems正在利用自己的Wafer Scale Engine晶片挑戰Nvidia在AI計算領域的主導地位,該公司表示,他們的晶片能夠實現卓越的每瓦性能和「前所未有的可擴展性」。
今年3月,這家位於美國加利福尼亞州桑尼維爾的初創公司發布了第三代晶片Wafer Scale Engine 3,並表示,該晶片的性能是上一代晶片的「2倍」,而且「功耗和價格相同」。WSE-3由4萬億個電晶體組成,採用台積電的5納米工藝,包含了90萬個AI核心和44 GB片上SRAM,能夠實現125 petaflops的16位浮點性能。
Cerebras Systems今年的其他里程碑事件包括與醫療巨頭梅奧診所進行多年期的戰略合作,開發多模態大型語言模型以改善患者治療結果和診斷,與AI初創公司Aleph Alpha進行了多年期合作,構建安全的自主AI解決方案,以及為總部位於阿布達比的科技控股集團G42打造Condor Galaxy 3超級電腦。
Eliyan
高管:聯合創始人、首席執行官Ramin Farjadrad
Eliyan希望通過自己的NuLink PHY互連技術打破晶片間帶寬障礙,幫助晶片設計師構建更強大的、基於晶片的處理器。
這家總部位於美國加州聖克拉拉的初創公司在今年3月宣布完成了一輪6000萬美金的融資,由Samsung Catalyst和Tiger Global Management共同領投,並得到英特爾和SK Hynix風險投資部門等其他投資方支持。
今年早些時候,Eliyan公司表示,推出了物理層上「性能最高」的解決方案,用於在單晶片架構中連接多個晶片,並且使用台積電的3納米製造工藝,每條鏈路可實現高達64 Gbps的速度。
Hailo
高管:聯合創始人、首席執行官Orr Danon
Hailo正在與Nvidia展開競爭,利用在優化成本和功耗性能方面處於領先地位的晶片來加速邊緣的生成式AI工作負載。
這家總部位於以色列特拉維夫的初創公司今年4月宣布,作為C輪融資的延伸,已經從投資方那裡獲得了1.2億美金,而且推出了新的Hailo-10加速器,可以為PC和汽車資訊娛樂系統等設備實現「以最小功耗實現最高的生成式AI性能」。
例如,Hailo-10能夠以每秒最多10個token的速度運行有70億參數的Llama 2模型,功率僅為5瓦。對於Stable Diffusion 2.1模型,該晶片在相同功率下5秒即可創建圖像。
Kneron
高管:Albert Liu,創始人、首席執行官
Kneron推出的AI晶片旨在為企業降低伺服器成本,以及在生成式AI方面降低PC價格,來削弱Nvidia的影響力。
這家總部位於美國加利福尼亞州聖地亞哥的初創公司在今年6月宣布推出了第二代「邊緣GPT」伺服器KNEO 330,並表示,該伺服器可以將小型企業的AI成本降低30-40%,能夠實現每秒48萬億次運算(TOPS)和最多8個並發連接,支持大型語言模型和與雲解決方案相當的檢索增強生成精度。
Kneron已經從高通和富士康等投資方那裡融資了1.9億美金,還發布了第三代神經處理單元(NPU) KL830,旨在實現低成本AI PC以及支持AI的物聯網應用。
MetisX
高管:Jin Kim,聯合創始人、首席執行官
MetisX旨在通過開發基於Compute Express Link (CXL)技術的智能內存系統,使數據中心「更智能、更快速、更具成本效益」。
這家總部位於韓國首爾的初創公司在今年5月宣布,已經在A輪融資中獲得了4400萬美金,並表示計劃在美國擴展業務,明年推出一款針對超大規模客戶的晶片。
MetisX公司表示,已經完成了大規模數據處理用例的原型,例如矢量資料庫、大數據分析和DNA分析,並且此類原型的性能比傳統伺服器CPU提高一倍。
Rivos
高管:聯合創始人、首席執行官Puneet Kumar
Rivos希望通過結合高性能RISC-V CPU和用於數據分析和生成式AI工作負載的數據並行加速器晶片來撼動數據中心市場。
這家總部位於美國加州聖克拉拉的初創公司是由前谷歌、蘋果和英特爾工程師創立的,該公司在今年4月宣布,已經從包括英特爾和戴爾風險投資部門在內的多家投資方那裡籌集了超過2.5億美元的A-3輪超額認購資金。
Rivos公司在今年2月與蘋果公司達成訴訟和解之後,宣布獲得了這筆資金,並表示將用於推出首款晶片產品並擴大團隊規模。蘋果公司曾指責Rivos從蘋果挖走了數十名工程師,竊取了商業機密,而Rivos則以不正當競爭為由對其提起了反訴。
SiMa.ai
高管:創始人、首席執行官Krishna Rangasayee
SiMa.ai希望在運行生成式AI工作負載方面通過強大而高效的晶片取代Nvidia,這些晶片可以在一個「以軟體為中心」的平台上處理多種模式。
這家總部位於美國加州聖何塞的初創公司在今年4月宣布,已經從投資方那裡籌集了7000萬美金,其中包括戴爾風險投資部門和Cadence Design Systems執行董事長Lip-Bu Tan。
SiMa.ai公司表示,將利用這筆資金繼續滿足客戶對其第一代機器學習片上系統(MLSoC)的需求,這種晶片專門用於電腦視覺;同時加快第二代MLSoC的開發,該晶片支持多模式生成式AI工作負載,包括語音、音頻、文本和圖像。
Tenstorrent
高管:首席執行官Jim Keller
Tenstorrent致力於通過一種將銷售專用處理器與授權晶片技術供他人使用相結合的商業模式,在AI計算晶片設計領域開闢出一條新的道路。
這家總部位於安大略省多倫多的初創公司在今年2月宣布,已經和日本前沿半導體技術中心達成「多層次合作協議」,後者計劃利用Tenstorrent的RISC-V和小晶片技術開發他們的2納米邊緣AI加速器,Tenstorrent將作為這種晶片的聯合設計合作夥伴。
據The Information在6月的報道,Tenstorrent公司去年在由現代汽車集團和Samsung Catalyst Fund領投的融資中獲得了1億美金,在Samsung領投的新一輪融資中獲得了至少3億美金,總估值達到20億美金。據報道,另一家韓國大公司LG電子也就此輪融資進行了談判。
Taalas
高管:創始人、首席執行官Ljubisa Bajic
Taalas試圖通過設計可直接實現整個AI模型的加速器晶片來顛覆Nvidia的通用GPU戰略,據稱這可以將成本降低多達1000倍。
這家總部位於安大略省多倫多的初創公司是由Tenstorrent創始人Llubisa Bajic牽頭的,該公司在今年3月宣布融資5000萬美金,並透露了計劃創建一個自動化工作流程,將所有類型的深度學習模型硬連線到晶片中。
Taalas表示,得益於這種設計方法,他們能夠設計一個包含整個大型AI模型的晶片「而無需外部存儲器」,因此這種晶片設計預計比小型GPU數據中心晶片性能更高,為把AI計算成本降低1000多倍開闢了道路。
Taalas表示,計劃在今年第三季度推出首款大型語言模型晶片,並於明年第一季度向客戶出貨。