AWS發布新產品加大投入生成式AI訓練

AWS近日發布了幾款用於在雲平台上訓練和部署生成式AI的新工具，將業務範圍進一步擴展到AI軟體開發領域。

贊助商廣告

AWS在AWS Machine Learning博客上發表了一篇文章，詳細介紹了這些新產品，這些模型是大規模的、預訓練的語言模型，為有針對性的自然語言處理任務奠定了基礎。基礎模型通常使用深度學習技術對大量文本數據進行訓練，使其能夠學習理解人類語言，生成文本。

使用預訓練的基礎模型，可以為開發人員節省大量的時間和資源，舉例來說，OpenAI的Generative Pre-trained Transformer（GPT），就可用於文本生成、情感分析和語言翻譯。

多種大型語言模型選項

Bedrock這項新服務可以通過應用界面提供各種來源的基礎模型，包括來自AI21 Labs的Jurassic-2多語言大型語言模型，可以生成西班牙語、法語、德語、葡萄牙語、義大利語和荷蘭語的文本；以及Anthropic PBC的Claude LLM，是基於用於訓練原則的、負責任AI系統的對話式處理任務和文本處理任務。用戶還可以使用API訪問Stability AI以及Amazon LLM。

AWS資料庫、分析和機器學習副總裁Swami Sivasubramanian這樣寫道，基礎模型是在網際網路規模上進行預訓練的，因此用相對較少的額外訓練就可以進行定製。他舉了一個時裝零售商內容營銷經理的例子，該經理可以向Bedrock中輸入少至20個來自「過去營銷活動、相關產品描述的優秀標語示例，Bedrock就可以自動開始為新款手袋產品生成有效的社交媒體內容、展示性廣告以及網路文案。」

除了Bedrock之外，AWS還推出了兩種新的Titan大型語言模型。第一種是生成式大型語言模型，用於摘要、文本生成、分類、開放式問答和資訊提取；第二種大型語言模型，是用於輸入文本並轉換為包含文本語義的數字表示，有助於產生不僅限於單詞匹配的上下文響應。

值得注意的是，這次公告中沒有提及OpenAI（微軟是其主要投資方），但考慮到市場對大型語言模型的需求，這應該不會成為Amazon面臨的一個障礙。

贊助商廣告

Gartner知名分析師、研究員Rajesh Kandaswamy表示：「人們急於創造很多技術，在這個階段，你看到的幾乎所有技術都有來自多家創新公司的多種選擇。」

在推出自己的大型語言模型方面，AWS落後於微軟和谷歌，但是這並不會成為一個競爭障礙，Kandaswamy表示，「我認為沒有人落後到必須追趕的程度，看起來市場中正在進行一場大型比賽，但和我們交談的客戶，除了非常早期的採用者之外，都不知道該如何做。」

硬體方面的提升

AWS還加強了用於在AWS雲上提供訓練和推理的硬體。新推出的網路優化型EC2 Trn1n 實例，結合了AWS專有的Trainium和Inferentia2處理器，現在每秒可提供1600 GB的網路帶寬，性能提升大約20%。AWS的Inf2實例，使用Inferentia2用於推理大型生成式AI應用，其中有包含了數千億個參數的模型，現在該實例已經面市。

AWS還推出了AI編碼工具CodeWhisperer，它使用基礎模型根據自然語言評論和集成開發環境中的歷史代碼實時生成代碼建議。該工具適用於Python、Java、JavaScript、TypeScript C#和其他10種語言，可以通過各種IDE訪問。

Sivasubramanian寫道：「開發人員可以簡單地告訴CodeWhisperer執行某項任務，例如『解析CSV歌曲字符串』，並要求它根據藝術家、標題和最高排行榜排名等值返回一個結構化列表，」。CodeWhisperer會生成「一個完整的函數來解析字符串並返回指定的列表。」他說，使用預覽版的開發人員報告說，與沒有使用該工具的情況相比，速度提高了57%，成功率提高了27%。

在不久的將來，大型語言模型領域可能還會保持零散和混亂的狀態，因為許多參與者試圖從ChatGPT等概念驗證的成功進行獲利。Kandaswamy說，任何一種模型都不太可能像谷歌自然語言API在語音識別領域那樣主導市場。

他說：「僅僅因為一個模型擅長一件事，並不意味著它會擅長所有事，有可能在未來兩三年內，大家都會提供其他人的模型，將來會有更多混合和跨技術的關係。」

贊助商廣告