Claude 3最近正在被網友瘋狂測試。一位量子物理學博士,認為Claude 3是唯一理解他博士畢業論文的人之一,沒錯就是「人」。
還有就是在經典的「大海撈針」測試中,Claude 3不僅找到了那句格格不入的話,而且它還懷疑這個披薩配料「事實」可能是作為一個笑話插入的,或者是為了測試它是否在注意,因為它根本不符合其他話題。
一時間,很多人都在驚呼Claude 3產生了「自我認知」。當然英偉達科學家Jim Fan也認為不必過度解讀,Claude 3看似有自我意識的表現只是對齊了人類數據。Claude 3的發布受到了熱捧,就像OpenAI背後的微軟一樣,也讓亞馬遜雲科技這個幕後玩家成為最大受益者。
三種「杯形」任你選擇
Anthropic的核心成員都是來自OpenAI,所以Claude 3也是無時無刻不在對標GPT-4,距離上一代的Claude 2發布,僅相隔8個月。
Claude 3系列模型主要包括Haiku(中杯)、Sonnet(大杯)與Opus(超大杯)。在推理、數學、編碼、多語言和視覺等多個領域的20款測試中,Claude 3 Opus在14個性能指標下超越了GPT-4、谷歌Gemini等一系列模型。
三個模型均提供200k長度的上下文,並針對不同的用例進行了優化。三個模型有著不同的適用場景。
Haiku的優勢在於速度和成本效益,這是一種快速緊湊的模型,具有近乎即時的響應能力。
Sonnet在智能和速度之間實現了理想的平衡,適用於絕大多數工作負載,速度比Claude 2 和Claude 2.1快2倍,且智能水平更高。它擅長執行需要快速響應的智能任務,例如知識檢索或銷售自動化。
Opus是最先進、最強大的大模型,具有深度推理、高級數學和編碼能力,在高度複雜的任務上具有頂級性能。它可以非常流暢地導航開放式提示和新穎場景,包括任務自動化、假設生成以及圖表、圖形和預測的分析。
Claude 3具備三大優勢:一流的基準性能、視覺功能以及更加安全。
一流的基準性能:Claude 3在數學問題、編程練習和科學推理,超越了現有模型。Opus在大多數常見的評測基準中都優於同行,本科水平專家知識(MMLU)、研究生水平專家推理(GPQA)、基礎數學(GSM8K),官方也給出了根據上下文數據審計財務報告的例子。
視覺功能:Claude 3模型經過訓練,可以理解各類數據,包括語言、圖像、圖表等。企業能夠基於多源媒體,構建真正跨領域的生成式人工智慧應用。像查詢藥物研究論文、蛋白質結構分析,媒體組織可以自動生成圖像標題或影片腳本。
減輕幻覺:Claude 3模型通過憲法AI技術減輕幻覺現象,這些技術提供了對模型推理過程的透明度,並且提高了準確性。Claude 3 Opus在困難的開放式問題上,減少了錯誤回答的可能性。可控的指導自動化流程,在製造、醫療、金融和法律等行業至關重要。
至頂網也從故事、數學、識圖三個層面進行了測試,其中較為突出的是數學和識圖能力,而且Claude 3的生成速度也更快,不會產生中斷。官方也公布了三段演示影片,通過圖像識別預測美國GDP在未來十年的可能走向,以及全球各主要經濟體的趨勢;在不到三秒的時間內完成對約10k token的arXiv論文的閱讀;用西班牙語進行交談,用英語寫出這些內容,並用西班牙語回復。
靜待合作開花結果
亞馬遜雲科技在去年9月就宣布向Anthropic投資40億美元,加速Anthropic未來基礎模型的開發,並將其廣泛提供給亞馬遜雲科技的客戶使用。Anthropic使用Amazon Trainium和Amazon Inferentia晶片來構建、訓練和部署其未來基礎模型,並充分利用亞馬遜雲科技在價格、性能、規模和安全方面的優勢。
去年4月Amazon Bedrock就已經開始提供Claude模型給亞馬遜雲科技的客戶。Amazon Bedrock是一項完全託管的服務,可提供多種高性能基礎模型(FM),以及構建生成式人工智慧應用程序所需的一系列廣泛功能。
Amazon Bedrock也成為率先提供Claude 3 Sonnet的託管服務商,下一代Claude 3另外兩個模型 Claude 3 Opus和 Claude 3 Haiku也將很快在Amazon Bedrock推出。
在大模型的應用中,多種模型的組合使用是非常常見的,Amazon Bedrock則已經幫助客戶優選了模型,讓其可以在一個平台同時使用多種模型。Amazon Bedrock在近日將大模型提供商擴充至7家。至此,Amazon Bedrock的大模型供應商共有AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI,Mistral AI的兩種高性能模型Mistral 7B 和 Mixtral 8x7B也已經在Amazon Bedrock正式可用。
最近亞馬遜雲科技數據和AI副總裁Swami Sivasubramanian博士在博客文章中寫到:「回顧2021年,當Anthropic第一次開始在亞馬遜雲科技上構建時,沒有人能想到Claude系列模型會帶來多大的變革。」
亞馬遜雲科技全球產品副總裁Matt Wood博士表示,在智能程度上,Claude 3 Opus是世界上最先進、最強大、最先進的基礎模型,具有深度推理、高級數學和編碼能力,在高度複雜的任務上具有頂級性能。Claude 3 Sonnet在智能和速度之間取得了理想的平衡,特別適合企業用例。Claude 3 Haiku是一款快速緊湊的模型,具有近乎即時的響應能力。所有Claude 3型號現在都包含最先進的視覺功能,可以通過OCR處理和分析圖像、照片、圖表、圖表、技術圖表和文本。因此,Claude 3模型可以從文檔、Web 用戶界面等中提取更多資訊。
未來「雲 大模型」將成為主要的發展路徑,同OpenAI的AGI選擇不同,Claude 3還是希望走2B路線,在商業場景中實現價值,這也和亞馬遜雲科技服務的客戶相吻合,兩者組合在一起,也會變相加速大模型應用的快速落地。