一年前,當雲社區聚集在拉斯維加斯參加AWS re:Invent的時候,生成式AI幾乎還沒有備提及,而本周AWS在年度大會上發布了一系列公告,強調生成式AI將成為其發展的首要任務。
AWS推出了Generative AI Stack,旨在為客戶提供利用AI的應用、用於構建大型語言模型的新工具、以及加速模型訓練和推理的基礎設施成果。
AWS公司首席執行官Adam Selipsky(如圖)表示:「圍繞生成式AI模型的創新是爆炸性的,將重塑我們在工作和家庭中與之交互的每一款應用。我們正在以一種完全不同的方式來探討生成式AI這個整體概念。」
廣泛的能力
Selipsky在這次re:Invent大會上近兩個半小時的主題演講中,分享了有關生成式AI策略的細節,其中一個重點在晶片領域取得的進展,AWS在現有產品基礎上構建了新的生成式AI功能,並繼續通過Nvidia和Anthropic PBC等主要合作夥伴追求創新。
Selipsky表示:「擁有最廣泛和最深入的能力是很重要的,我們開始利用AWS徹底從頭重新思考IT基礎設施。」
重新思考IT基礎設施的一個關鍵因素就要涉及到矽。AWS通過Nitro虛擬機管理程序以及後續幾代的Trainium、Graviton和Inferentia處理器在矽技術方面取得了不錯的成績。
本周一晚上,AWS公司公用事業計算高級副總裁Peter DeSantis公布了AWS無伺服器產品和橫向擴展資料庫的一系列進展,突出了晶片所發揮的作用。「Nitro是AWS開始構建定製晶片的一個原因,」DeSantis在他的演講中這樣說道。
今天,Selipsky宣布推出了AWS Trainium2,一款用於生成式AI和機器學習訓練的專用晶片,以及Graviton4。他還公布了Nvidia擴大合作夥伴關係,其中包括把Nvidia的DGX Cloud人工智慧訓練即服務平台引入AWS。
「DGX Cloud是Nvidia的AI工廠,」Nvidia公司首席執行官黃仁勛表示,Selipsky邀請他走上re:Invent演講台發表演講,他指出,DGX Cloud將有16000個GPU連接到一台超級電腦。「這就像65台超級電腦合而為一。」
ChatGPT的潛在競爭對手
矽晶片這一層的額外火力,最終將催生一系列新產品,而且AWS希望這些產品能夠吸引企業的興趣,並有可能成為OpenAI ChatGPT生成式AI解決方案的替代方案。今天,AWS發布了Amazon Q,這是AWS生成式AI戰略的一個關鍵要素。Amazon Q是一款在工作場所使用的生成式AI助手。該工具的功能還將添加到Amazon QuickSight雲原生商業智能服務中,使客戶能夠為工作場所應用打造量身定製的解決方案,包括通過Amazon Connect進行呼叫中心管理。
AWS分析服務、資料庫和AI領導力副總裁G2 Krishnamoorthy在接受媒體採訪時談到Amazon Q to QuickSight在生成式AI堆棧中的應用:「您需要這一層為服務構建者而設計的功能,它就像一個助手,可以幫助你完成各種任務。」
Amazon Q最初主要面向開發人員和IT專業人員,明年可能會被廣大企業廣泛採用。開發人員能夠在幾分鐘內以對話方式將新功能疊代到代碼中。
「Amazon Q也是您的業務專家,」Selipsky說。「它是完全可定製的。」
Amazon Q的可定製性,是AWS尋求部署生成式AI堆棧的一個關鍵差異化因素。Selipsky表示,客戶想要不同的模型,他當然也注意到了OpenAI本月因首席執行官Sam Altman的突然離職和最終回歸所引發的一場混亂。
Selipsky說:「不會有一種模式能夠統治所有,您需要嘗試不同的模型,需要一個真正的模型提供商選項。我認為過去10天發生的事件,已經非常清楚地表明了這一點。」
Selipsky沒有直接提及我們熟知的名字,而是在主題演講中提到了AWS相對於「其他雲提供商」的競爭地位。當他宣布AWS在用於生成式AI和機器學習訓練的專用處理器方面取得的進展時,這一點尤其引人注目。
「與此同時,許多雲提供商只是在談論他們自己的機器學習晶片,」Selipsky說。
在今天的公告發布之前,AWS在本周一還發布了一系列公告,在第一位主題演講者上台之前,AWS就已經在re:Invent大會上發布了80多條新聞稿,傳遞的資訊很明確:AWS無意放棄在公有雲食物鏈頂端的地位,並且打算繼續發揮自身的優勢。
Selipsky表示:「在亞馬遜,我們下了大膽的賭注,最重要的重塑都是屬於你們的。」