Semron 3D AI晶片設計示意圖。
一家德國創業公司Semron正在開發一種名為「3D堆棧」的晶片,以便直接在智慧型手機、耳機、VR頭戴式設備和其他移動設備上運行人工智慧模型。
由德勒斯登工業大學工程系畢業生Kai-Uwe Demasius和Aron Kirschen共同創立的Semron晶片使用電場而非傳統處理器的電流來進行運算,Kirschen聲稱此舉可提高能源效率並降低生產成本。
Kirschen在接受採訪時表示:「由於預期人AI算資源將出現短缺,許多依賴於這些能力的商業模式的公司面臨著生存風險——例如,那些訓練自己模型的大型初創公司。我我們技術的獨特功能將使我們能夠達到當今消費電子設備晶片的價格點,儘管我們的晶片能夠運行先進的AI,而其他公司則不能。」
Semron的晶片使用一種稱為「記憶電容器」的特殊組件進行運算,Demasius和Kirschen在2016年(成立Semron四年前)就為此提交了初步專利。大多數電腦晶片都是由電晶體制成,與電容器不同,電晶體無法存儲能量,它們只是充當「開/關」開關,控制電流的通過與否。
Semron的記憶電容器由傳統半導體材料製成,利用化學中稱為電荷遮罩的原理工作。記憶電容器通過一個「遮罩層」控制頂部電極和底部電極之間的電場。遮罩層反過來由晶片的內存控制,該內存可以存儲人工智慧模型的不同「權重」。(權重基本上充當模型中的旋鈕,在模型訓練和處理數據時控制和微調其性能。)
電場方法將晶片等級的電子移動降到最低,進而降低了能量消耗和熱量。Semron旨在利用電場的散熱特性將多達數百層的記憶電容器放置在單個晶片上,大大提高運算能力。
Kirschen補充道:「我們利用這個特性作為一個平台,在固定矽面積上部署數百倍的計算資源。你可以想像它就像就像一個封裝中有數百個晶片一樣。」
在2021年發表在《自然電子期刊》的一項研究中,Semron和馬克斯普朗克微結構物理研究所的研究人員成功訓練了一個電腦視覺模型,其能源效率超過3,500 TOPS/W,是現有技術的35到300倍。TOPS/W是一個有點模糊的指標,但結論是記憶電容器可以大大降低人工智慧模型訓練時的能量消耗。
目前,Kirschen表示Semron仍處於「產品前」階段,並且幾乎沒有收入。通常,晶片創業公司最困難的部分是大規模製造和獲得有意義的客戶群,儘管不一定按此順序。
對Semron來說更加困難的是,它在像Kneron、EnCharge和Tenstorrent這樣的定製晶片企業中面臨著激烈的競爭,這些公司總共籌集了數千萬美元的風險資本。與Semron一樣,EnCharge也在設計使用電容器而非電晶體的電腦晶片,但使用不同的基板架構。
然而,擁有11人團隊的Semron計劃到今年年底將團隊擴大到大約25人,已成功吸引來自Join Capital、SquareOne、OTB Ventures和Onsight Ventures等投資者的資金。迄今為止,這家創業公司已籌集到1000萬歐元。
SquareOne合伙人Georg Stockinger通過電子郵件表示:
「計算資源將成為21世紀的「石油」。隨著大型語言模型占據世界,摩爾定律接近物理極限,未來幾年計算資源將會出現巨大瓶頸。缺乏對運算基礎設施的訪問將大大降低公司和整個國家的生產力和競爭力。Semron將通過提供一種專門用於運算人工智慧模型的革命性新晶片來解決這一問題,成為解決方案的關鍵要素。它打破了傳統基於電晶體的運算典範,並將特定運算任務的成本和能源消耗降低至少20倍。」