Nvidia今天宣布推出了一項新的生成式AI微服務,旨在允許企業將自定義聊天機器人、copilot和AI摘要工具連接到實時專有的企業數據以提供更準確的結果。
這項名為NeMo Retriever的新服務是Nvidia NeMo雲原生框架和工具系列中的一部分,用於構建、定製和部署生成式AI模型,旨在讓企業組織能夠把檢索增強生成功能構建到他們的生成式AI應用中。
檢索增強生成(RAG)是一種通過利用從外部來源檢索的事實和數據填補大型語言模型「知識」空白以提高生成式AI模型準確性和安全性的方法。一個大型語言模型接受前期訓練,為其提供大量一般任務知識和能力,例如理解對話提示、總結和提供問答能力。訓練既昂貴又耗時,因此通常只進行一次或者很少進行訓練,以為部署模型做準備。
然而,一旦部署,模型本身將缺乏實時資訊和最新的特定領域專業知識,這可能會導致不準確和所謂的「幻覺」——也就是大型語言模型會自信但錯誤地回答問題。
使用NeMo Retriever,就可以把多種來源(包括資料庫、HTML、PDF、圖像、影片和其他方式)的最新數據輸入大型語言模型,這意味著模型將擁有由企業客戶自己專有來源提供的、更全面的事實集,這些事實可以在數據可用時進行更新。數據可以駐留在任何地方,包括雲、數據中心或本地環境中,並且可以安全地訪問這些數據。
Nvidia公司超大規模和高性能計算副總裁Ian Buck表示:「這是整個企業聊天機器人領域的聖杯,因為絕大多數有用數據都是專有數據,不是嵌入這些模型中的公開可用數據,而是公司內部可用的數據。因此,將AI和客戶資料庫相結合,可以使其更高效、更準確、更有用,並讓客戶能夠優化模型的功能。」
通過添加專有數據可以減少不準確的答案,因為大型語言模型可以利用更好的上下文資訊來產生結果,從而提高準確性。與研究論文如何提供資訊來源的引用類似,Retriever的RAG功能會根據企業內部特定領域知識提供額外的專家資訊來源,以便更好地為大型語言模型提供資訊,使其能夠根據問題提供更好的、更準確的答案。
Nvidia表示,與社區主導的開源RAG工具包不同,Retriever旨在支持商業型和生產就緒的生成式AI模型,這些模型已經可用並針對RAG功能、企業支持和託管安全補丁進行了優化。
目前,電子系統設計公司Cadence Design Systems、Dropbox、SAP和ServiceNow等企業客戶已經在和Nvidia合作,利用新功能將RAG引入他們定製的生成式AI工具、應用和服務中。
Cadence公司總裁、首席執行官Anirudh Devgan表示,該公司的研究人員正在與Nvidia展開合作,利用Retriever通過提高準確性來幫助生產出更高質量的電子產品。Devgan表示:「生成式AI引入了創新方法來滿足客戶需求,例如在設計過程早期發現潛在缺陷的工具。
Buck表示,通過使用Retriever,客戶可以用更少的時間訓練生成式AI模型,以獲得更準確的結果,這意味著企業客戶可以採用更多現成的模型,簡單地部署模型並使用他們自己的內部數據,而無需花費大量的時間、費用和精力來持續訓練模型以使保持模型的最新狀態。
NeMo Retriever將添加上述RAG功能,作為Nvidia AI Enterprise端到端雲原生軟體平台的一個組成部分,該平台主要用於簡化AI應用的開發。從今天開始,開發者就可以註冊搶先體驗NeMo Retriever。