
向量資料庫初創公司 Pinecone 推出了 Pinecone Assistant,這是一個 AI 代理構建 API 服務,旨在加速 RAG 開發。
大型和小型生成式 AI 語言模型 (大語言模型) 通過查找請求與數學編碼表示的項目多個方面或維度之間的相似性來生成響應,這些編碼表示被稱為向量嵌入。這些向量嵌入存儲在具有搜索功能的資料庫中。AI 代理用於對文本輸入提供自動智能響應,並可以調用大語言模型來完成工作。大語言模型為代理提供自然語言處理能力,使其能夠以類人方式與用戶交互,理解複雜查詢並生成詳細響應。Pinecone Assistant 就是為構建這樣的 AI 代理而設計的。
該公司表示:"Pinecone Assistant 是一個 API 服務,旨在精確且便捷地為基於聊天和代理的應用提供支持。" 該公司聲稱它抽象化了構建檢索增強生成 (RAG) 應用所需的分塊、嵌入、文件存儲、查詢規劃、向量搜索、模型編排、重排序等步驟。
Pinecone Assistant 包括:
- 通過新的聊天和上下文 API 為代理應用優化的接口 - 可根據特定用例或要求定製助手行為和響應的自定義指令 - 新的輸入和輸出格式,現支持 JSON、.md、.docx、PDF 和 .txt 文件 - 可選擇在歐盟或美國構建的區域控制
它提供了評估 API 和聊天 API,"通過簡單的步驟提供帶有引用的結構化、有據可依的響應。它支持流式和批處理模式,允許實時呈現引用或將其添加到最終輸出中。"
還有一個上下文 API,可以提供結構化上下文 (即與輸入查詢最相關的數據集合),以擴展塊的形式呈現,包含相關性分數和引用。Pinecone 表示,這使其成為代理工作流的強大工具,提供必要的上下文來驗證源數據,防止幻覺,並識別最相關的數據以生成精確、可靠的響應。
上下文 API 可與客戶首選的大語言模型一起使用,與其他數據源組合,或作為核心知識層集成到代理工作流中。
Pinecone Assistant 包括元數據過濾器,可按用戶、組或類別限制向量搜索,還包括自定義指令,用戶可以通過提供簡短描述或指令來定製響應。例如,您可以將助手設置為法律專家以提供權威答案,或作為客戶支持代理進行故障排除和用戶協助。
它採用無伺服器架構,具有直觀的界面和內置的評估和基準測試框架。Pinecone 表示,只需"通過簡單的 API 上傳原始文件"即可輕鬆上手,並且可以快速實驗和疊代。
Pinecone 在其基準測試中估計,Pinecone Assistant 的結果準確率比 OpenAI 助手高出最多 12%。
Pinecone Assistant 現已在美國和歐盟對所有用戶全面開放,更多資訊可在此處獲取。它由 Pinecone 的全託管向量資料庫提供支持。該公司表示,客戶數據在靜態和傳輸過程中都會加密,從不用於訓練,並可隨時永久刪除。