宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Qdrant 發布搭載 GPU 的向量資料庫,承諾索引速度提升 10 倍

2025年01月27日 首頁 » 熱門科技

 

Qdrant 發布搭載 GPU 的向量資料庫,承諾索引速度提升 10 倍

 

開源向量資料庫供應商 Qdrant 表示,通過使用 GPU 計算向量索引的速度可以比 x86 CPU 快 10 倍。

向量資料庫存儲著向量嵌入,這些嵌入是從文本短語、音頻、圖像和影片流片段中經過數學計算得出的編碼 token。當大語言模型 (LLM) 響應用戶的自然語言請求時,會搜索這些向量嵌入。搜索過程會在向量空間中尋找與搜索項相近的內容。要進行搜索,必須建立向量嵌入的索引。隨著項目數量擴展到數十億甚至更多,建立索引的計算強度會顯著增加。Qdrant 在其最新的 v1.13 軟體版本中支持使用 AMD、Intel 和 Nvidia 的 GPU 來構建此類索引。

Qdrant CTO 兼聯合創始人 Andrey Vasnetsov 表示:"索引構建通常是向量搜索應用擴展的瓶頸。通過引入與平台無關的 GPU 加速,我們讓索引構建變得更快、更具成本效益,同時為用戶提供了選擇最適合其需求的硬體的靈活性。"

該公司的索引技術基於 HNSW (分層可導航小世界) 算法,這是一種基於圖的近似最近鄰搜索技術,在許多向量資料庫中都有應用。Qdrant 開發者關係總監 David Myriel 在博客中指出,Qdrant 是自主開發這款軟體,而不是使用第三方代碼。

他表示:"Qdrant 不需要高端 GPU 就能實現顯著的性能提升",並提供了一個表格,顯示了使用和不使用各種常見 GPU 的索引時間和成本比較。

下面是一個圖表,直觀展示了表格中兩個時間列的比較:

v1.13 版本還包括以下特性:

嚴格模式:限制計算密集型操作,如未索引過濾、批處理大小和某些搜索參數。這有助於改善多租戶工作效果。

HNSW 圖壓縮:通過 HNSW Delta 編碼減少存儲使用,只存儲值之間的差異(即"增量")。

命名向量過濾:適用於在單個數據點中存儲多個不同大小和類型的向量的情況。博客稱:"這使得基於特定向量的存在來搜索數據點變得容易。例如,如果您的集合包含圖像和文本向量,您可以只過濾出定義了圖像向量的數據點。"

自定義存儲:使用自定義存儲後端代替 RocksDB,以防止隨機延遲增加的壓縮峰值,通過要求讀寫操作的磁盤操作數量保持恆定來確保一致的性能,而不受數據大小的影響。

Qdrant 表示,此版本為需要實時響應、頻繁重新索引和能夠對動態數據流做出即時決策的 AI 驅動應用創造了新的可能性,如實時搜索、個性化推薦和 AI 代理。

其向量資料庫的安裝量已超過 1000 萬次。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新