宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

IBM發布全新Granite系列語言模型

2023年09月08日 首頁 » 熱門科技

IBM近日推出新的Granite系列語言模型陣容,該系列將作為IBM watsonx產品套件的一部分提供給用戶。

IBM發布全新Granite系列語言模型

Granite系列是與其他幾個新功能一起推出的。據IBM稱,watsonx將增加一款新的工具可以讓企業更輕鬆地創建AI訓練數據集,另一項新增功能則會讓神經網路更容易適應新的任務。

IBM在今年5月推出了watsonx軟體產品,旨在幫助企業構建生成式AI模型,並有望簡化例如確保神經網路滿足安全要求等相關任務。

IBM這次推出的Granite模型將通過watsonx一個名為watsonx.ai的組件提供給用戶。據IBM公司稱,後者提供的工具可以更輕鬆地構建定製神經網路。此外,Watsonx.ai還包括了一系列預先打包的AI模型,這些模型將在本季度晚些時候通過Granite系列得到增強。

Granite系列包括了兩種語言模型,分別是Granite.13b.instruct和Granite.13b.chat。IBM 表示,這兩種語言模型可以總結文檔、執行「洞察提取」以及生成文本,是IBM工程師通過2.4 TB訓練數據集構建的。

這兩個Granite模型都有130億個參數,這使其足夠緊湊,可以運行在Nvidia單個V100 GPU上。V100比Nvidia的旗艦產品H100要便宜得多,因此從理論上講,Granite系列應該比那些需要更複雜硬體才能運行的大型語言模型更容易部署。

IBM公司軟體高級副總裁Dinesh Nirmal在今天的博客文章中這樣寫道:「最初的Granite模型只是一個開始:更多的模型還將採用其他語言,更多IBM訓練的模型也在準備之中。」

除了Granite系列之後,IBM還在watsonx.ai上推出了兩個開源AI模型。第一個是Llama-2,這是Meta Platforms的通用大型語言模型;以及StarCoder,這是ServiceNow和Hugging Face在5月份發布的針對編程任務優化的神經網路。

除了更大的預打包神經網路目錄之外,最新版本的watsonx.ai還包括了新的人工智慧開發功能。

創建自定義人工智慧模型往往需要大量的訓練數據。在很多情況下,手動聚合這些資訊可能需要大量的時間和精力,企業簡化這個工作流程的方法之一,就是使用軟體自動生成訓練數據。

眾所周知,此類合成數據並不總是像手動創建的記錄那麼準確,但對於AI訓練來說通常是適合的。

據IBM稱,watsonx.ai將增加一個內置的合成數據生成工具。要使用該公司,企業就必須上傳示例數據集,例如購買日誌的集合,watson.ai可以分析這些日誌並生成具有類似特徵的綜合記錄。

讓已經訓練好的AI模型適應新的任務,這通常需要對其進行重新訓練,而且這可能是一個資源密集型的過程。為了應對這一挑戰,IBM為watsonx.ai配備了參數調整工具,該工具可以針對新任務優化神經網路,而無需重新訓練。

開發人員通過參數調整創建第二個起到支持作用的神經網路來優化AI模型。第二個神經網路向AI模型提供如何執行給定任務的指令,當這些指令與用戶的自然語言提示相結合的時候,AI就能夠比其他方式更有效地執行手頭上的任務。

IBM還詳細介紹了有關於watsonx.data的增強,watsonx.data是watsonx產品套件的一個組件,旨在幫助企業管理他們的AI訓練數據集。

據IBM稱,該工具將增加對話界面,允許用戶更輕鬆地可視化存儲在watsonx.data中的資訊,對其進行細化並查找特定記錄。IBM還增加了一個經過優化以保存嵌入的矢量資料庫,即AI模型用來存儲其內部知識存儲庫的數學結構。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新