宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

問鼎「最強AI」,Claude 3 支持20萬Token輸入性能吊打GPT-4

2024年03月05日 首頁 » 熱門科技

剛剛,Anthropic 丟出一顆「王炸」,聲稱其Claude 3 Opus模型在基準測試上優於 OpenAI 的 GPT-4 和 Google 的 Gemini 1.0 Ultra, 三個版本均支持20萬Token輸入並成為「最接近人」應答的大模型。

Claude 3 系列模型有三個版本:Claude 3 Haiku 輕便快捷、Claude 3 Sonnet 是技巧與速度的最佳結合以及性能最強大的 Claude 3 Opus。

問鼎「最強AI」,Claude 3 支持20萬Token輸入性能吊打GPT-4

Claude 3主打安全無害 

Anthropic是由前 OpenAI 研究高管創立,擁有包括谷歌、Salesforce 和亞馬遜雲科技在內的支持者,並在過去一年完成了五筆不同的融資交易,融資總額達到了 73 億美元。

Claude 3大模型不同於GPT-4與Gemini ,Anthropic 希望打造安全的人工智慧系統,並能讓人們能可靠地部署,通過在數據對齊方面的努力,追求從人類的反饋中進行強化學習,以培養出一個有益無害的助手。

Anthropic認為人工智慧是一門系統科學。為此他們開發了標度定律(scaling laws)。這是受到在統計物理學中標度普遍性的啟發。Anthropic發現 Transformer語言模型中性能與訓練時間、上下文長度、數據集大小、模型大小和計算預算等因素之間存在精確的冪律關係。通過使用足夠小的批次大小時所需的計算量預測,並且這對於理解語言模型的性能和優化計算資源分配具有重要意義。

安全性的研究則更為重要。技術的疊代讓人們每次都會看到比以往性能更好、更大的模型和網絡。這些更大的網絡也帶來了新的安全挑戰。Anthropic更加關注大型模型的安全問題,以便找到使其更可靠的方法,並提高整個領域的安全部署結果。Anthropic當前的重點是原型系統,將這些安全技術與分析文本和代碼的工具相結合。因此,在Claude 2 有時會過度拒絕,Claude 3 對提示的理解更加細緻。

Anthropic高度重視項目合作,並致力於自上而下和自下而上的研究規劃相結合。Anthropic非常重視讓每個人——研究人員、工程師、社會影響專家和政策分析師——都參與到確定這一方向中來。希望與其他實驗室和研究人員合作,因為我們相信,表徵這些系統的最佳研究將來自廣泛的研究人員群體。

為了讓模型有益無害,Anthropic利用一種方法,通過收集人類偏好數據並應用偏好建模(Preference Modeling,PMing)和從人類反饋中強化學習(Reinforcement Learning from Human Feedback,RLHF)的技術來訓練出一種相對有助且無害的自然語言助理。

強大的性能超越 OpenAI和 Google

Claude Opus 是最智能的模型,在人工智慧系統的大多數常見評估基準上都優於同行,包括本科水平專家知識 (MMLU)、研究生水平專家推理 (GPQA)、基礎數學 (GSM8K) 等。它在複雜任務上表現出接近人類水平的理解力和流暢性,引領通用智能的前沿。

問鼎「最強AI」,Claude 3 支持20萬Token輸入性能吊打GPT-4

快速是其另一大優勢。Claude 3 模型在20萬上下文的巨大輸入內容下也可快速應答問題。可以支持實時客戶聊天、自動完成和數據提取任務,其中響應是立即且實時。Haiku 可以在不到三秒的時間內閱讀 arXiv 上包含圖表和圖形的信息和數據密集的研究論文。

此外還具備強大視覺能力:他們可以處理各種視覺格式,包括照片、圖表、圖形和技術圖表。我們特別高興能夠為我們的企業客戶提供這種新模式,其中一些客戶的知識庫高達 50% 以各種格式編碼,例如 PDF、流程圖或演示幻燈片。

問鼎「最強AI」,Claude 3 支持20萬Token輸入性能吊打GPT-4

「風浪越大魚越貴」在大語言模型領域也不例外。Anthropic 表示,Claude 3 Opus 收取每百萬Token的數據的費用為 15 美元,而處理相同數據的較小模型的費用至少要低五倍。相比之下,OpenAI 對輸入其 GPT-4 Turbo 模型的每百萬Token收取 10 美元。

與雲服務企業深入合作,幫助企業快速落地

大語言模型擁有具有巨大的商業潛力。大語言模型可以用於自然語言處理、智能對話系統、文本生成、翻譯等多個領域。通過開發和推廣大語言模型,企業可以為其產品和服務增加更強大的自然語言處理能力,從而提升用戶體驗,擴大市場份額。

谷歌雲和亞馬遜雲科技都加入了對Claude 3 的支持與部署。

Google Cloud 雲人工智慧產品管理高級總監華倫·巴克利表示:「 為了增強客戶的選擇和創新能力 Google Cloud 通過在 Vertex AI 中提供的精選第一方、開源和第三方模型。Claude 3將在未來幾周內在Vertex AI Model Garden中全面推出。」

Google Cloud 客戶將能夠通過Vertex AI Model Garden中的 API 訪問從所有三個 Claude 3 模型中進行選擇。

通過 Vertex AI 中的簡單 API 調用快速訪問 Claude 的預訓練模型加速 AI 開發。使用戶專注應用,而不是基礎設施。付費更加靈活,通過按需付費優化成本。並利用 Google Cloud 的內置安全性、隱私性和合規性部署。

亞馬遜雲科技也迅速加入了對Claude 3系列模型的支持,並基於Amazon Bedrock提供服務。亞馬遜雲科技數據和AI副總裁Swami Sivasubramanian博士表示:「我們與Anthropic展開合作,旨在將領先的生成式AI技術帶給全球客戶,如在亞馬遜雲科技的先進基礎設施(如AI晶片Amazon Trainium)上進行構建。我們很榮幸能夠繼往開來,在Amazon Bedrock上引入Claude 3模型。

用戶將可以通過Amazon Bedrock訪問Claude 3系列的三個支持視覺功能的模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。其中Sonnet模型現已在美東(北弗吉尼亞州)和美西(俄勒岡州)區域正式可用,Opus模型和Haiku模型將在未來數周內推出。

AI技術更新速度可謂是「日新月異」,科技企業為了不掉隊,通過資本的方式投注新技術:因此我們看到了Google、亞馬遜雲科技、Meta這樣的企業除了自研大模型還不斷投資新興的大模型創業公司。在需求端,企業面對快速的技術更迭,軟體定義硬體的趨勢更加明顯,以往通過購買IT硬體再部署軟體上線業務的模式恐將「一去不返」。取而代之的是根據應用需求,採取軟硬體的訂閱模式:硬體按需求、性能訂閱算力、存儲等雲服務,軟體也將在雲上直接部署按Token付費。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新