問鼎「最強AI」，Claude 3 支持20萬Token輸入性能吊打GPT-4

剛剛，Anthropic 丟出一顆「王炸」，聲稱其Claude 3 Opus模型在基準測試上優於 OpenAI 的 GPT-4 和 Google 的 Gemini 1.0 Ultra，三個版本均支持20萬Token輸入並成為「最接近人」應答的大模型。

贊助商廣告

Claude 3 系列模型有三個版本：Claude 3 Haiku 輕便快捷、Claude 3 Sonnet 是技巧與速度的最佳結合以及性能最強大的 Claude 3 Opus。

Claude 3主打安全無害

Anthropic是由前 OpenAI 研究高管創立，擁有包括谷歌、Salesforce 和亞馬遜雲科技在內的支持者，並在過去一年完成了五筆不同的融資交易，融資總額達到了 73 億美元。

Claude 3大模型不同於GPT-4與Gemini ，Anthropic 希望打造安全的人工智慧系統，並能讓人們能可靠地部署，通過在數據對齊方面的努力，追求從人類的反饋中進行強化學習，以培養出一個有益無害的助手。

Anthropic認為人工智慧是一門系統科學。為此他們開發了標度定律（scaling laws）。這是受到在統計物理學中標度普遍性的啟發。Anthropic發現 Transformer語言模型中性能與訓練時間、上下文長度、數據集大小、模型大小和計算預算等因素之間存在精確的冪律關係。通過使用足夠小的批次大小時所需的計算量預測，並且這對於理解語言模型的性能和優化計算資源分配具有重要意義。

安全性的研究則更為重要。技術的疊代讓人們每次都會看到比以往性能更好、更大的模型和網路。這些更大的網路也帶來了新的安全挑戰。Anthropic更加關注大型模型的安全問題，以便找到使其更可靠的方法，並提高整個領域的安全部署結果。Anthropic當前的重點是原型系統，將這些安全技術與分析文本和代碼的工具相結合。因此，在Claude 2 有時會過度拒絕，Claude 3 對提示的理解更加細緻。

Anthropic高度重視項目合作，並致力於自上而下和自下而上的研究規劃相結合。Anthropic非常重視讓每個人——研究人員、工程師、社會影響專家和政策分析師——都參與到確定這一方向中來。希望與其他實驗室和研究人員合作，因為我們相信，表徵這些系統的最佳研究將來自廣泛的研究人員群體。

贊助商廣告

為了讓模型有益無害，Anthropic利用一種方法，通過收集人類偏好數據並應用偏好建模（Preference Modeling，PMing）和從人類反饋中強化學習（Reinforcement Learning from Human Feedback，RLHF）的技術來訓練出一種相對有助且無害的自然語言助理。

強大的性能超越 OpenAI和 Google

Claude Opus 是最智能的模型，在人工智慧系統的大多數常見評估基準上都優於同行，包括本科水平專家知識 (MMLU)、研究生水平專家推理 (GPQA)、基礎數學 (GSM8K) 等。它在複雜任務上表現出接近人類水平的理解力和流暢性，引領通用智能的前沿。

快速是其另一大優勢。Claude 3 模型在20萬上下文的巨大輸入內容下也可快速應答問題。可以支持實時客戶聊天、自動完成和數據提取任務，其中響應是立即且實時。Haiku 可以在不到三秒的時間內閱讀 arXiv 上包含圖表和圖形的資訊和數據密集的研究論文。

此外還具備強大視覺能力：他們可以處理各種視覺格式，包括照片、圖表、圖形和技術圖表。我們特別高興能夠為我們的企業客戶提供這種新模式，其中一些客戶的知識庫高達 50% 以各種格式編碼，例如 PDF、流程圖或演示幻燈片。

「風浪越大魚越貴」在大語言模型領域也不例外。Anthropic 表示，Claude 3 Opus 收取每百萬Token的數據的費用為 15 美元，而處理相同數據的較小模型的費用至少要低五倍。相比之下，OpenAI 對輸入其 GPT-4 Turbo 模型的每百萬Token收取 10 美元。

與雲服務企業深入合作，幫助企業快速落地

大語言模型擁有具有巨大的商業潛力。大語言模型可以用於自然語言處理、智能對話系統、文本生成、翻譯等多個領域。通過開發和推廣大語言模型，企業可以為其產品和服務增加更強大的自然語言處理能力，從而提升用戶體驗，擴大市場份額。

谷歌雲和亞馬遜雲科技都加入了對Claude 3 的支持與部署。

Google Cloud 雲人工智慧產品管理高級總監華倫·巴克利表示：「為了增強客戶的選擇和創新能力 Google Cloud 通過在 Vertex AI 中提供的精選第一方、開源和第三方模型。Claude 3將在未來幾周內在Vertex AI Model Garden中全面推出。」

贊助商廣告

Google Cloud 客戶將能夠通過Vertex AI Model Garden中的 API 訪問從所有三個 Claude 3 模型中進行選擇。

通過 Vertex AI 中的簡單 API 調用快速訪問 Claude 的預訓練模型加速 AI 開發。使用戶專注應用，而不是基礎設施。付費更加靈活，通過按需付費優化成本。並利用 Google Cloud 的內置安全性、隱私性和合規性部署。

亞馬遜雲科技也迅速加入了對Claude 3系列模型的支持，並基於Amazon Bedrock提供服務。亞馬遜雲科技數據和AI副總裁Swami Sivasubramanian博士表示：「我們與Anthropic展開合作，旨在將領先的生成式AI技術帶給全球客戶，如在亞馬遜雲科技的先進基礎設施（如AI晶片Amazon Trainium）上進行構建。我們很榮幸能夠繼往開來，在Amazon Bedrock上引入Claude 3模型。

用戶將可以通過Amazon Bedrock訪問Claude 3系列的三個支持視覺功能的模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。其中Sonnet模型現已在美東（北弗吉尼亞州）和美西（俄勒岡州）區域正式可用，Opus模型和Haiku模型將在未來數周內推出。

AI技術更新速度可謂是「日新月異」，科技企業為了不掉隊，通過資本的方式投注新技術：因此我們看到了Google、亞馬遜雲科技、Meta這樣的企業除了自研大模型還不斷投資新興的大模型創業公司。在需求端，企業面對快速的技術更迭，軟體定義硬體的趨勢更加明顯，以往通過購買IT硬體再部署軟體上線業務的模式恐將「一去不返」。取而代之的是根據應用需求，採取軟硬體的訂閱模式：硬體按需求、性能訂閱算力、儲存等雲服務，軟體也將在雲上直接部署按Token付費。