Anthropic 首席產品官訪談實錄：先做一個還不能用的產品，然後等大模型疊代

我感覺上周Cisco 在舊金山舉辦了第二屆年度 AI Summit（大會的主題是"AI 經濟的建設者"），可能是過一年來，最重量級的AI會議之一，你沒看錯，確實如此。

贊助商廣告

活動由 Cisco CEO Chuck Robbins 和總裁兼首席產品官 Jeetu Patel 聯合主持，邀請到了 NVIDIA 黃仁勛、OpenAI Sam Altman、a16z Marc Andreessen、World Labs 李飛飛等重量級嘉賓，線上觀看人數超過 1800 萬。

Anthropic 首席產品官訪談實錄：先做一個還不能用的產品，然後等大模型疊代

不過，我非常關注其中一位嘉賓：Anthropic 首席產品官 Mike Krieger 。因為對話發生在 Anthropic 一個極為密集的產品周期中間：

2026 年 1 月 12 日

，Anthropic 發布 Claude Cowork，基於 Claude Code 同源架構打造的桌面智能體工具，面向非開發者用戶，讓 Claude 直接在本地文件夾中讀寫、創建文件、執行多步驟任務。Krieger 在對話中透露，Cowork "100% 由 Claude 構建，基本上三周內完成"。

2026 年 1 月 30 日

，Anthropic 為 Cowork 發布了 11 個開源行業插件（覆蓋法律、金融、銷售、營銷等），直接引發了全球軟體股恐慌——僅 2 月 3 日一天就蒸發約 2850 億美元市值，Goldman Sachs 美國軟體股指數單日跌幅創 2025 年 4 月以來最大。

2026 年 2 月 5 日

（即本次對話兩天後），Anthropic 發布 Claude Opus 4.6——上下文窗口從 20 萬 token 擴展到 100 萬，首次引入"智能體團隊"（Agent Teams）機制，支持多個智能體並行分工協作，並新增 PowerPoint 集成。

與此同時，開源社區的 OpenClaw（前身為 Clawdbot/Moltbot）在 1 月底爆火，GitHub 星標數周內突破 10 萬。這款開源智能體框架讓普通用戶也能在 WhatsApp、Telegram 等即時通訊工具中運行自主 AI 助手，成為"個人 AI 智能體元年"的標誌性產品——Krieger 在對話中也提及了這一現象。

理解以上背景，有助於把握 Krieger 在對話中反覆提到的"沙盒中的自主性""權限審批成為最大瓶頸""內外部體驗差距"等核心論點的產業語境。所以想了一下，我就直接把實錄放上來了，這樣大家可以更好感受其思考。當然，我儘可能做了注釋和總結，讀起來會更絲滑一些。

贊助商廣告

再介紹一下Krieger 自己，在加入 Anthropic 之前，Krieger 的名字更多與 Instagram 綁在一起——他是這款十億級用戶產品的聯合創始人兼前 CTO，也是 AI 新聞推薦應用 Artifact 的聯合創始人（後被 Yahoo 收購）。2024 年 5 月加入 Anthropic 擔任 CPO，2026 年 1 月轉入公司內部的 Labs 團隊，直接參與前沿產品的研發。

23 分鐘裡，Krieger 反覆在說同一件事：AI 產品的做法變了。產品經理不能再躲在漂亮的 PRD 和線框圖後面——軟體的核心引擎是非確定性的，你得儘早把真實模型接進去跑。企業不能再做"安全的小試點"——挑一個讓你心虛的核心流程，設好護欄，激進推進。而當模型能力已經足夠強的時候，真正卡住落地的往往不是技術，而是權限審批、流程瓶頸和組織慣性。

以下為對話實錄整理。

第一部分：從 Instagram 到 Anthropic

斯坦福符號系統專業 → Meebo → Instagram → Artifact → Anthropic。一條"技術能做什麼"和"人怎麼用它"交匯的職業線索。

Jeetu Patel：先介紹一下你的背景吧，因為你的經歷非常獨特——你是 Instagram 的創始人，現在在 Anthropic 工作。

Mike Krieger：貫穿我整個職業生涯的主線，是我一直對兩件事的交匯點感興趣：軟體和計算技術能做到什麼，以及你如何讓它真正地為人所用。

在斯坦福大學，我學的是 Symbolic Systems（符號系統）——一個很獨特的學位項目，雖然近年來越來越受歡迎了。它融合了認知科學、設計、電腦科學、哲學、心理學和人工智慧。當時的 AI 還主要是在迷宮裡尋路，和我們今天說的 AI 完全不是一回事。但我熱愛這種交叉領域——你可以擁有世界上最強大的軟體，但如果人們理解不了它，你真的做成了什麼實質性的事情嗎？

帶著這種思路，我先是在一家叫 Meebo 的公司工作，那其實是很好的鍛煉，因為那家公司的文化、招聘和人才選拔都非常出色。之後我聯合創立了 Instagram。Instagram 的很多工作，你得把時間撥回到 2009 年——當時移動應用還在萌芽期，攝影機開始普及，但大多數人仍然覺得自己的照片被"困"在設備里。我們做的很多事情就是：在每一個螢幕上，那一件你希望用戶做的事情是否足夠清晰？使用起來是否簡單到"顯而易見"？

贊助商廣告

後來我和 Instagram 的同一位聯合創始人（Kevin Systrom）一起做了另一家公司叫 Artifact，趕上了 AI 的起步階段——它是一款 AI 驅動的新聞推薦產品。直到現在，幾乎每次參加活動都會有人走過來跟我說："我真的很喜歡 Artifact，你們為什麼關掉了？" 我們做了大約三年，意識到它的發展軌跡不太可能成為我們想要投入下一個三年的方向，所以最終賣給了 Yahoo，現在以 Yahoo News 的形式繼續運營。

然後我面臨一個選擇——是再創業（我熱愛從零到一），還是加入一家公司？在 Artifact 的三年讓我看到了兩件事。第一，編程即將發生變革。我當時已經開始用早期的編碼模型來加速自己在 Artifact 的工作。那時候模型還很早期，還沒有視覺能力，所以我會用 ASCII 風格的文字來描繪我想實現的界面——用點和劃線勾勒出大致樣子——然後對模型說"請用 Swift 實現這個"。按下回車，每秒才兩個 token，我就去泡杯咖啡、散個步，等回來的時候，它已經有了一個還算像樣的起點。雖然當時還很粗糙，但趨勢已經非常明顯了。第二，模型將提供一個智能層，把原本需要數月開發時間的功能縮短到數小時。比如我們在 Artifact 中做的一些智能功能：對一篇文章做摘要、把一個寫得很標題黨的新聞標題改寫成客觀事實——這些功能如果要組建一個研究團隊來做，可能需要數月；但在 2020、2021 年的時候，一個 API 調用就能初步搞定。

所以我非常清楚，下一代軟體將由這些 AI 實驗室來驅動和賦能。我和 Anthropic 的人聊過，他們分享同樣的願景，而且我也很喜歡那裡的文化。我覺得那會是真正的跳板，我想成為其中的一部分。

第二部分：設計不會消亡

AI 能生成代碼，但"你使用的軟體"和"你熱愛的軟體"之間仍有鴻溝。匠心、品牌和用戶體驗的需求不減反增。

Jeetu Patel：你覺得科技行業有什麼被廣泛持有、但實際上根本性錯誤的信念？

贊助商廣告

Mike Krieger：現在有一種信念是"設計將會消亡"——既然用戶可以直接用自然語言向模型描述需求，模型就能生成軟體，那還要設計師幹什麼？Dylan [註：推測指 Figma CEO Dylan Field] 也在這裡，我猜我們共享這個反主流的觀點。

對我來說，"你使用的軟體"和"你熱愛的軟體"之間仍然存在差距。那種讓你主動回來用、因為它而改變了習慣、忍不住推薦給別人的體驗——我在很多 vibe-coded（憑感覺用 AI 快速生成的）產品里還沒有看到。我仍然認為需要有匠心，需要有存在的理由，需要有品牌——對一個人來說，這一切意味著什麼？

設計精良的軟體的"死亡"被過度渲染了。當然，具體的角色和實現路徑必然會演變。但這種需求，我認為和以往一樣關鍵。我現在在 Labs 團隊工作，花了大量時間和設計師交流——他們的角色確實在轉變，但重要性不減反增。

第三部分：產品人的思維轉變

別在靜態設計稿里停留太久。先做一個"還不能工作的產品"，等模型疊代後再驗證——Computer Use 就是這麼做出來的。

Jeetu Patel：你覺得產品人在這一波浪潮中犯的最大錯誤是什麼？

Mike Krieger：一個非常顯著的錯誤是：在真正把東西做出來之前，花太多時間停留在靜態設計稿和點不動的假原型上。

我們做的很多事情是：先構建一個還不能工作的產品，然後等下一個模型發布，看產品是否能工作了。比如 Computer Use（讓 Claude 驅動你的電腦、進行點擊操作），我在加入 Anthropic 的第三個月就做了原型——那還是 2024 年夏天。當時效果很糟糕，到處亂點，根本不能用。但即便是那個原型也教會了我們：模型能力的邊界在哪裡。每當研究團隊有了新的研究模型，我們就把它接入這個原型跑一遍："它過了文件菜單了嗎？它能點開文件了嗎？" 一點一點往前推進。

然後有一個時刻——我記得是 Sonnet 3.7——我們照例把新模型接進去跑測試，其實並沒有預期它會有多大改進，純粹是保持習慣。突然間，一個研究員發來消息說："你快看，它真的能用了。我們現在可以把它做成產品了。" 但如果我們沒有一直維護著那個測試框架，根本不會發現這個拐點。

贊助商廣告

所以你需要重新定義自己作為產品人的角色：不再是"我交付一份漂亮的產品需求文檔，我和設計師交付漂亮的線框圖，然後交給工程去實現"；軟體現在是一個有生命的動態系統，核心是一個非確定性的、令人驚嘆但有時也令人抓狂的引擎。你需要儘快體驗到那個狀態。

Jeetu Patel：在企業級場景也是這樣嗎？

Mike Krieger：尤其是在企業。

第四部分：智能體的自主性與沙盒

智能體的魅力在於自主解題，但企業需要的是"沙盒內的自主性"——最小權限、正確連接、全程可觀測。

Jeetu Patel：你們在 Anthropic 一直很重視安全和安全性。你覺得更多的自主性更好，還是適當控制自主性反而能獲得更好的採納率？

Mike Krieger：這些模型現在能做的一件神奇的事情是：給它一個目標和相當高層級的指令，它就能自己找到路徑。有時候還挺可愛的——有人給我發了個例子，我們的一位工程師讓 Claude 準備一份家庭度假準備文檔，但 Claude 在加載度假租賃網站時遇到了問題。它沒有顯示照片，而是自己畫了一幅它想像中房子的樣子。你會想"這跟實際的房子八成不一樣"，但它確實在創造性地嘗試解決問題。如果你從沒見過一個模型試圖解決問題的過程——真的很迷人。"我做不了這個，要不要試試那個？還是不行，那我換個方式……" 它真的非常想要把問題解決掉。

你不想完全束縛它，因為那是智能體的魅力所在。但你確實需要用正確的方式將它沙盒化。我們在企業內部構建的智能體系統中，核心問題是：Claude 運行的"盒子"擁有什麼權限？最小權限是什麼？它和外部世界之間的通道是什麼？

總結起來就是：在沙盒內給予自主性，配合正確的連接和可觀測性。

第五部分：AI 編程的現在與未來

Anthropic 產品代碼已 100% 由 Claude 編寫。瓶頸從"寫代碼"轉移到了審查、集成和 CI/CD——開發者基礎設施的任何摩擦都成了 10 倍懲罰。

贊助商廣告

Jeetu Patel：聊聊編程吧，你們在這塊做得非常出色。編程的未來一兩年、兩三年會是什麼樣？不僅是代碼寫作將達到 100%，軟體開發生命周期、角色分工會怎麼變？CIO 和企業應該如何適應？

Mike Krieger：我可以聊這個話題一個小時，我儘量精煉。

先分享一個 Anthropic 內部 Labs 團隊的日常畫面：我們經常互相提交 2,000 到 3,000 行的 Pull Request，尤其是在高速推進的 Labs 團隊。

Jeetu Patel：Claude 是用 Claude 寫的嗎？

Mike Krieger：是的。Claude 的產品和 Claude Code 完全是由 Claude 編寫的。Dario 大概一年前在台上說"到年底 90% 的代碼會由 Claude 編寫"，當時人們覺得這很瘋狂，但我們當時已經看到了那個趨勢。現在對於 Anthropic 的大多數產品來說，實際上是 100%——全部由 Claude 編寫。我們做的是圍繞它搭建一整套質量保障機制，讓我們可以信任它的產出。

軟體開發發生了幾個關鍵變化：

第一，對抗式代碼審查。讓 Claude 經過訓練和提示詞工程，成為一個非常好的對抗式代碼審查者，效果非常棒。我提交 Pull Request，Claude 會回來說"這裡有安全漏洞，這裡可以這樣重構，還可以怎樣改進"。我跟內部搭建這個系統的人聊過，其實並不複雜——就是認真地用提示詞把它調教成一個超級嚴格的評審者：窮舉所有可能的問題，做各種自動化檢查，再加上一些更軟性的規範要求。

第二，讓 Claude 重新架構代碼。我在做一個 iPhone 原型時，明顯到了初始架構碰壁的地步。讓 Claude 退一步，先寫一些驗證測試，然後重新重構。Anthropic 不是一家老公司，才幾年，但在 AI 時代你可以非常快速地積累技術債。償還技術債的成本收益計算已經完全改變了。

第三，所有其他流程都成了瓶頸。昨天我們的持續集成系統出了故障——以前一天產出一個變更集時，等一個小時只是輕微的不便。但當你每個工程師每天至少產出十幾個 Pull Request 時，我感到實實在在的痛苦——所有東西都堵在那裡了。開發者工具、開發者效率、開發者基礎設施——這些本來就重要，現在任何阻塞或摩擦都變成了對團隊生產力的 10 倍懲罰。

贊助商廣告

Jeetu Patel：現在的稀缺資源是審查和審計代碼，而不是編寫代碼？

Mike Krieger：是審查、審計和集成。因為你還有多個工程師同時往同一個代碼庫提交。然後是先對齊產品方向——這在某種意義上一直是最難的部分，現在更清晰地被看作是最難的部分了——以及對齊原則和架構，這樣在審查代碼時（無論是人還是 Claude 在審查）不會只是在東拼西湊，而是朝著某個共識性的北極星——架構、代碼原則、要解決的問題——持續演進。這在企業中尤為重要。

第六部分：企業採納的正確方式

"安全的小試點"幾乎註定失敗。正確做法：挑一個讓你心虛的核心業務流程，設好護欄，激進推進。產品形態要敢於推翻重來——Excel 集成是 Anthropic 的第四次嘗試。

Jeetu Patel：Anthropic 內部的哲學是極致地使用 AI 進行實驗。你會建議企業客戶也這樣做嗎？

Mike Krieger：我在企業中看到成功和失敗的分野，恰恰在於"極致實驗"的反面。如果一家企業說"我就在這一個我覺得安全的小地方採用一個小功能"或者"給某個低價值流程定製一個智能體"——這些幾乎都註定失敗。原因有二：第一，問題不夠有雄心，你不會真正了解 AI 的能力以及實際需要投入什麼；第二，一旦遇到路障或表現不佳，人們就放棄了。

我們和大型銀行、大型保險公司合作時發現的正確模式是：找到某個真正關鍵的業務流程——那種想到要用 AI 來處理會讓你覺得有點心虛的業務流程——然後緊密合作：成功標準是什麼？護欄是什麼？如何制定一個激進的時間表？如何進一步加速？因為你需要跟上前沿。

另一個維度是如何賦能你自己的產品團隊。理想狀態下，中央 AI 團隊主要負責提供模型訪問權限和一些審計/可觀測能力——保持精簡，不要過度干預技術選型（用 Claude Agent SDK 還是 LangChain 之類的決策應該儘可能交給產品團隊），只把"模型訪問"和"可觀測性"作為共性的薄層來管理。

贊助商廣告

Jeetu Patel：不要過早地對成敗下結論，要有持續疊代的持久力和信念。

Mike Krieger：沒錯。而且還需要靈活性——願意承認"我們賦予產品 AI 能力的方式還不太對，需要重新思考形態"。

舉個例子，就拿電子表格來說——這對企業來說是必不可少的工具。我們嘗試過讓 Claude 讀取電子表格然後寫代碼去更新它——這是一種方式。也嘗試過讓 Claude 通過 Computer Use 看著螢幕上的內容，在 Excel 里進行點擊操作——結果發現電子表格是你能給電腦視覺出的最難題目之一，真的非常困難。最終到了現在的形態——直接在 Excel 內部建立原生鉤子——這已經是我們的第三、四次嘗試了，效果遠好於前面所有方案。

這又回到了一個道理——那些一直成立的道理現在只是更加成立了。第一，你寫軟體的能力不是你的差異化優勢，真正的差異化是你建立的信任、品牌、客戶關係、數據和多年積累的系統集成。第二，你不應該執著於現有的產品形態，你應該執著於你在深度解決什麼問題。

第七部分：從編程到生產力——下一個前沿

用戶拿 Claude Code 做待辦清單和流程編排，催生了 Cowork——三周內用 Claude 構建的桌面智能體，定位介於完全自主的 OpenClaw 和傳統工具之間。

Jeetu Patel：你們 API 業務在指數級增長，編程領域也做得非常好，下一步是什麼？生產力工具？似乎你們覺得有一個更好的 Office 正在到來？

Mike Krieger：我們大約六個月前開始發現，人們在拿 Claude Code 做非常"不編程"的事情——有時是企業中的流程編排，有時是解決個人問題、創建待辦清單之類的。

所以我們現在思考的核心問題是：在最極端的情況下，你可以像 OpenClaw 那樣，讓 AI 全面接管你的電腦和基礎設施。但我不認為大多數人已經準備好了那種程度的自主。那麼，下一個既安全又強大的進化形態是什麼？

這就是 Claude Cowork 的由來——幾周前剛剛推出，100% 由 Claude 構建，基本上是在三周內用 Claude 建成的。我們正在持續疊代，不是要取代人們已經在做的工作，而是找到整合和自動化這些工作的正確方式。

贊助商廣告

第八部分：機械可解釋性——理解模型的大腦

從 Golden Gate Claude 的單個特徵，到迴路研究，再到"模型什麼時候誠實、什麼時候欺騙"——可解釋性正從學術走向應用安全。

Jeetu Patel：你們在機械可解釋性（Mechanistic Interpretability）方面做了很多工作。這個旅程走到了哪裡？我們真的能完全理解模型為什麼做出某個行為嗎？

Mike Krieger：我認為還處於早期，但在快速演進。我在 Anthropic 已經兩年了。我加入的那個月，我們發布了 Golden Gate Claude 論文——當時我們開始能夠展示模型"大腦"中的個別特徵（feature），甚至可以操縱它們。到去年，我們開始看到更多關於"迴路"（circuits）的研究——不只是單個概念，而是模型如何執行某種操作，比如心算——我們自己不太會去想自己是怎麼做心算的，但模型也在做，它們甚至不需要計算器就能做各種數學運算——但按照它們的訓練方式，你不會理所當然地認為它們能做到這一點。

現在我們正在深入到更應用層面：模型在特定情境下如何表現？什麼時候模型保持誠實？什麼時候它會欺騙？它如何對待自己收到的指令？它如何思考沙盒邊界？這是更加應用導向的可解釋性研究。

如果你想找個周末讀物，我們每個模型的 System Card（系統卡片）都會非常深入地描述我們做的各種實驗——我們真的會極限測試模型。但模型部署之後也會出現湧現行為，所以實驗室里的測試和部署後的觀察、參與、疊代都同樣重要。

第九部分：讓 AI 真正理解你

沒人願意填偏好表單。兩個方向：讓智能體先"旁觀"你的數字痕跡做冷啟動；讓 Claude 自己生成交互界面，在對話中逐步學習你。

Jeetu Patel：現在的模型在偏好學習方面似乎還太依賴用戶主動設置，怎麼讓它更本能地理解用戶？

Mike Krieger：這個領域有很多有趣的想法。其中之一是在模型開始為你工作之前就進行觀察。我們在 Anthropic 大量使用 Slack，各種智能體在 Slack 中運行——其中任何一個智能體看到的我的線上工作量，可能已經超過了我的任何一個同事。它可以圍繞"這個人在線上是什麼工作風格"建立起畫像——我寫過的所有文檔都在那裡。如果你能利用這些已經存在的數字痕跡來做冷啟動，我覺得這非常強大。

贊助商廣告

另一個方向是：什麼樣的對話方式能讓智能體或模型在互動中逐漸學習？我不覺得有人願意填一個大表單來設置偏好。但對話可以做到。我們一直在實驗的是——聽起來不像什麼高科技——Claude 能夠實時生成什麼樣的交互界面來輔助它了解你？比如讓你在 10 個選項中選擇，也許不是一個長列表，也許是一個詞雲，也許用某種分組方式呈現。我們正在賦予 Claude "自己創建 UI 來引出偏好"的能力，讓它可以通過這些微交互來學習用戶。

第十部分：擔憂與興奮

最大擔憂：權限審批和企業流程把 AI 體驗"閹割"到用戶覺得沒用。最大驚喜：Claude 已經能當產品經理實習生了，比預想中來得早。

Jeetu Patel：最後幾個問題。你最擔心什麼？最興奮什麼？有沒有去年還沒有、今年新出現的讓你興奮的事情？

Mike Krieger：我天生是個愛操心的人。那我選一個AI 安全和資訊安全之外的擔憂吧。

我擔心的不是模型能力撞牆——我不認為會——而是我們把這些東西整合進工作和生活的能力，會被非常無聊的人類流程問題卡住。比如拿不到某個權限。Claude 配上了正確的 MCP（Model Context Protocol）和沒有配 MCP 的 Claude，體驗差別是天壤之別——但總得有人在你的公司里批准那些 MCP 的接入。

前幾天有同事跟我說："我最大的恐懼是，我們內部用的 Cowork 和外部用戶用的 Cowork 體驗差距太大——因為我們把所有權限都打開了。" 而外部用戶可能被各種審批流程攔住，最後拿到的是一個被"閹割"過的體驗，用戶會想"這個產品到底有什麼用？"

Jeetu Patel：這簡直是我過去 30 年做企業生產力工具的人生寫照。

Mike Krieger：是的。怎麼解決這個問題，這大概是我最擔心的事情之一。

至於興奮的事——我工作時一半腦子在產品管理上，一半在工程上。我之前以為工程才是 Claude 在 2026 年最能幫上忙的領域。但我開始看到 Claude 能成為一個更好的用戶需求收集者和綜合分析者。它還不夠有創造力去憑空想出一個全新產品，但作為一個產品經理實習生——至少目前這個水平——已經相當有用了，而我之前以為這要等更久才能實現。

贊助商廣告

Jeetu Patel：編程和產品開發之外，下一個殺手級應用是什麼？

Mike Krieger：每個企業都有一些有趣的數據流，目前幾乎完全沒有被充分利用。關鍵不是讓 Claude 去逐條解析每一個數據點，而是先把數據準備度提升上來，然後構建數據攝取、聚合和洞察發現的能力—— 無論是網路安全、金融數據、交易信號，還是製造業。我們最近在越來越多的製造業場景中開始合作。這些場景雖然各有複雜性，但歸根到底本質是一樣的：有價值的數據流就在那裡，只是還完全沒有被挖掘。

Jeetu Patel：下次還來嗎？

Mike Krieger：當然。今天聊得非常過癮。