產生「自我認知」的Claude 3 現已登陸Amazon Bedrock

Claude 3最近正在被網友瘋狂測試。一位量子物理學博士，認為Claude 3是唯一理解他博士畢業論文的人之一，沒錯就是「人」。

贊助商廣告

還有就是在經典的「大海撈針」測試中，Claude 3不僅找到了那句格格不入的話，而且它還懷疑這個披薩配料「事實」可能是作為一個笑話插入的，或者是為了測試它是否在注意，因為它根本不符合其他話題。

一時間，很多人都在驚呼Claude 3產生了「自我認知」。當然英偉達科學家Jim Fan也認為不必過度解讀，Claude 3看似有自我意識的表現只是對齊了人類數據。Claude 3的發布受到了熱捧，就像OpenAI背後的微軟一樣，也讓亞馬遜雲科技這個幕後玩家成為最大受益者。

三種「杯形」任你選擇

Anthropic的核心成員都是來自OpenAI，所以Claude 3也是無時無刻不在對標GPT-4，距離上一代的Claude 2發布，僅相隔8個月。

Claude 3系列模型主要包括Haiku（中杯）、Sonnet（大杯）與Opus（超大杯）。在推理、數學、編碼、多語言和視覺等多個領域的20款測試中，Claude 3 Opus在14個性能指標下超越了GPT-4、谷歌Gemini等一系列模型。

三個模型均提供200k長度的上下文，並針對不同的用例進行了優化。三個模型有著不同的適用場景。

Haiku的優勢在於速度和成本效益，這是一種快速緊湊的模型，具有近乎即時的響應能力。

Sonnet在智能和速度之間實現了理想的平衡，適用於絕大多數工作負載，速度比Claude 2 和Claude 2.1快2倍，且智能水平更高。它擅長執行需要快速響應的智能任務，例如知識檢索或銷售自動化。

Opus是最先進、最強大的大模型，具有深度推理、高級數學和編碼能力，在高度複雜的任務上具有頂級性能。它可以非常流暢地導航開放式提示和新穎場景，包括任務自動化、假設生成以及圖表、圖形和預測的分析。

Claude 3具備三大優勢：一流的基準性能、視覺功能以及更加安全。

一流的基準性能：Claude 3在數學問題、編程練習和科學推理，超越了現有模型。Opus在大多數常見的評測基準中都優於同行，本科水平專家知識（MMLU）、研究生水平專家推理（GPQA）、基礎數學（GSM8K），官方也給出了根據上下文數據審計財務報告的例子。

贊助商廣告

視覺功能：Claude 3模型經過訓練，可以理解各類數據，包括語言、圖像、圖表等。企業能夠基於多源媒體，構建真正跨領域的生成式人工智慧應用。像查詢藥物研究論文、蛋白質結構分析，媒體組織可以自動生成圖像標題或影片腳本。

減輕幻覺：Claude 3模型通過憲法AI技術減輕幻覺現象，這些技術提供了對模型推理過程的透明度，並且提高了準確性。Claude 3 Opus在困難的開放式問題上，減少了錯誤回答的可能性。可控的指導自動化流程，在製造、醫療、金融和法律等行業至關重要。

至頂網也從故事、數學、識圖三個層面進行了測試，其中較為突出的是數學和識圖能力，而且Claude 3的生成速度也更快，不會產生中斷。官方也公布了三段演示影片，通過圖像識別預測美國GDP在未來十年的可能走向，以及全球各主要經濟體的趨勢；在不到三秒的時間內完成對約10k token的arXiv論文的閱讀；用西班牙語進行交談，用英語寫出這些內容，並用西班牙語回復。

靜待合作開花結果

亞馬遜雲科技在去年9月就宣布向Anthropic投資40億美元，加速Anthropic未來基礎模型的開發，並將其廣泛提供給亞馬遜雲科技的客戶使用。Anthropic使用Amazon Trainium和Amazon Inferentia晶片來構建、訓練和部署其未來基礎模型，並充分利用亞馬遜雲科技在價格、性能、規模和安全方面的優勢。

去年4月Amazon Bedrock就已經開始提供Claude模型給亞馬遜雲科技的客戶。Amazon Bedrock是一項完全託管的服務，可提供多種高性能基礎模型（FM），以及構建生成式人工智慧應用程式所需的一系列廣泛功能。

Amazon Bedrock也成為率先提供Claude 3 Sonnet的託管服務商，下一代Claude 3另外兩個模型 Claude 3 Opus和 Claude 3 Haiku也將很快在Amazon Bedrock推出。

在大模型的應用中，多種模型的組合使用是非常常見的，Amazon Bedrock則已經幫助客戶優選了模型，讓其可以在一個平台同時使用多種模型。Amazon Bedrock在近日將大模型提供商擴充至7家。至此，Amazon Bedrock的大模型供應商共有AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI，Mistral AI的兩種高性能模型Mistral 7B 和 Mixtral 8x7B也已經在Amazon Bedrock正式可用。

贊助商廣告

最近亞馬遜雲科技數據和AI副總裁Swami Sivasubramanian博士在部落格文章中寫到：「回顧2021年，當Anthropic第一次開始在亞馬遜雲科技上構建時，沒有人能想到Claude系列模型會帶來多大的變革。」

亞馬遜雲科技全球產品副總裁Matt Wood博士表示，在智能程度上，Claude 3 Opus是世界上最先進、最強大、最先進的基礎模型，具有深度推理、高級數學和編碼能力，在高度複雜的任務上具有頂級性能。Claude 3 Sonnet在智能和速度之間取得了理想的平衡，特別適合企業用例。Claude 3 Haiku是一款快速緊湊的模型，具有近乎即時的響應能力。所有Claude 3型號現在都包含最先進的視覺功能，可以通過OCR處理和分析圖像、照片、圖表、圖表、技術圖表和文本。因此，Claude 3模型可以從文檔、Web 用戶界面等中提取更多資訊。

未來「雲+大模型」將成為主要的發展路徑，同OpenAI的AGI選擇不同，Claude 3還是希望走2B路線，在商業場景中實現價值，這也和亞馬遜雲科技服務的客戶相吻合，兩者組合在一起，也會變相加速大模型應用的快速落地。