Anthropic 為 Claude 模型內置 RAG 功能並推出全新引用 API

周四，Anthropic 宣布推出 Citations（引用）功能，這是一項新的 API 特性，通過將回答直接鏈接到源文檔，幫助 Claude 模型避免捏造資訊（也稱為幻覺）。該功能允許開發者向 Claude 的上下文窗口添加文檔，使模型能夠自動引用生成答案時所使用的具體段落。

贊助商廣告

Anthropic 表示："當啟用 Citations 功能時，API 會將用戶提供的源文檔（PDF 文檔和純文本文件）按句子進行分塊處理。這些分塊後的句子，連同用戶提供的上下文，會與用戶的查詢一起傳遞給模型。"

該公司描述了 Citations 的幾個潛在用途，包括：總結案例文件並提供帶源鏈接的要點、跨金融文檔回答問題並追蹤引用，以及支持引用特定產品文檔的支持系統。

根據公司內部測試，與用戶在提示中創建的自定義引用實現相比，該功能將召回準確率提高了最多 15%。雖然 15% 的準確率提升看起來並不多，但由於其從根本上集成了檢索增強生成 (RAG) 技術，這一新功能仍然吸引了像 Simon Willison 這樣的 AI 研究人員的關注。Willison 在他的部落格上詳細解釋了為什麼引用功能如此重要。

他寫道："檢索增強生成 (RAG) 模式的核心是獲取用戶的問題，檢索可能與該問題相關的文檔部分，然後通過在提供給大語言模型的上下文中包含這些文本片段來回答問題。這通常效果不錯，但模型仍可能基於其訓練數據中的其他資訊（有時可以接受）或完全虛構不正確的細節（絕對不好）來作答。"

Willison 指出，雖然引用源可以幫助驗證準確性，但構建一個運行良好的系統"可能相當棘手"，不過 Citations 通過將 RAG 功能直接內置到模型中，似乎朝著正確的方向邁進了一步。

顯然，這種能力並不是新事物。Anthropic 的 Alex Albert 在 X 上寫道："在底層，Claude 經過訓練可以引用源文檔。通過 Citations，我們向開發者開放了這種能力。要使用 Citations，用戶可以在通過 API 發送的任何文檔類型上傳遞新的 'citations: {enabled:true}' 參數。"

贊助商廣告

早期採用者報告結果令人期待

該公司通過 Anthropic API 和 Google Cloud 的 Vertex AI 平台為 Claude 3.5 Sonnet 和 Claude 3.5 Haiku 模型發布了 Citations 功能，而且據報道已經在實際應用中得到使用。

Anthropic 表示，使用 Claude 來支持其 CoCounsel 法律 AI 參考平台的 Thomson Reuters 期待使用 Citations，這不僅可以"最大限度地降低幻覺風險，還能增強對 AI 生成內容的信任"。

此外，據首席執行官 Tarun Amasa 稱，金融科技公司 Endex 告訴 Anthropic，Citations 將他們的源文檔捏造率從 10% 降至零，同時每個響應的引用數量增加了 20%。

儘管有這些聲明，在該技術得到更深入研究和實地驗證之前，仍然存在依賴任何大語言模型準確傳遞參考資訊的風險。

Anthropic 將按照標準的基於 token 的定價向用戶收費，但響應中的引用文本不計入輸出 token 成本。根據 Anthropic 的標準 API 定價，使用 Claude 3.5 Sonnet 引用一份 100 頁的文檔大約需要 0.30 美元，使用 Claude 3.5 Haiku 則需要 0.08 美元。