我感覺上周Cisco 在舊金山舉辦了第二屆年度 AI Summit(大會的主題是"AI 經濟的建設者"),可能是過一年來,最重量級的AI會議之一,你沒看錯,確實如此。
活動由 Cisco CEO Chuck Robbins 和總裁兼首席產品官 Jeetu Patel 聯合主持,邀請到了 NVIDIA 黃仁勛、OpenAI Sam Altman、a16z Marc Andreessen、World Labs 李飛飛等重量級嘉賓,線上觀看人數超過 1800 萬。

不過,我非常關注其中一位嘉賓:Anthropic 首席產品官 Mike Krieger 。因為對話發生在 Anthropic 一個極為密集的產品周期中間:
理解以上背景,有助於把握 Krieger 在對話中反覆提到的"沙盒中的自主性""權限審批成為最大瓶頸""內外部體驗差距"等核心論點的產業語境。所以想了一下,我就直接把實錄放上來了,這樣大家可以更好感受其思考。當然,我儘可能做了注釋和總結,讀起來會更絲滑一些。
再介紹一下Krieger 自己,在加入 Anthropic 之前,Krieger 的名字更多與 Instagram 綁在一起——他是這款十億級用戶產品的聯合創始人兼前 CTO,也是 AI 新聞推薦應用 Artifact 的聯合創始人(後被 Yahoo 收購)。2024 年 5 月加入 Anthropic 擔任 CPO,2026 年 1 月轉入公司內部的 Labs 團隊,直接參與前沿產品的研發。
23 分鐘裡,Krieger 反覆在說同一件事:AI 產品的做法變了。 產品經理不能再躲在漂亮的 PRD 和線框圖後面——軟體的核心引擎是非確定性的,你得儘早把真實模型接進去跑。企業不能再做"安全的小試點"——挑一個讓你心虛的核心流程,設好護欄,激進推進。而當模型能力已經足夠強的時候,真正卡住落地的往往不是技術,而是權限審批、流程瓶頸和組織慣性。
以下為對話實錄整理。
第一部分:從 Instagram 到 Anthropic
斯坦福符號系統專業 → Meebo → Instagram → Artifact → Anthropic。一條"技術能做什麼"和"人怎麼用它"交匯的職業線索。
Jeetu Patel:先介紹一下你的背景吧,因為你的經歷非常獨特——你是 Instagram 的創始人,現在在 Anthropic 工作。
Mike Krieger:貫穿我整個職業生涯的主線,是我一直對兩件事的交匯點感興趣:軟體和計算技術能做到什麼,以及你如何讓它真正地為人所用。
在斯坦福大學,我學的是 Symbolic Systems(符號系統)——一個很獨特的學位項目,雖然近年來越來越受歡迎了。它融合了認知科學、設計、電腦科學、哲學、心理學和人工智慧。當時的 AI 還主要是在迷宮裡尋路,和我們今天說的 AI 完全不是一回事。但我熱愛這種交叉領域——你可以擁有世界上最強大的軟體,但如果人們理解不了它,你真的做成了什麼實質性的事情嗎?
帶著這種思路,我先是在一家叫 Meebo 的公司工作,那其實是很好的鍛煉,因為那家公司的文化、招聘和人才選拔都非常出色。之後我聯合創立了 Instagram。Instagram 的很多工作,你得把時間撥回到 2009 年——當時移動應用還在萌芽期,攝影機開始普及,但大多數人仍然覺得自己的照片被"困"在設備里。我們做的很多事情就是:在每一個螢幕上,那一件你希望用戶做的事情是否足夠清晰?使用起來是否簡單到"顯而易見"?
後來我和 Instagram 的同一位聯合創始人(Kevin Systrom)一起做了另一家公司叫 Artifact,趕上了 AI 的起步階段——它是一款 AI 驅動的新聞推薦產品。直到現在,幾乎每次參加活動都會有人走過來跟我說:"我真的很喜歡 Artifact,你們為什麼關掉了?" 我們做了大約三年,意識到它的發展軌跡不太可能成為我們想要投入下一個三年的方向,所以最終賣給了 Yahoo,現在以 Yahoo News 的形式繼續運營。
然後我面臨一個選擇——是再創業(我熱愛從零到一),還是加入一家公司?在 Artifact 的三年讓我看到了兩件事。第一,編程即將發生變革。 我當時已經開始用早期的編碼模型來加速自己在 Artifact 的工作。那時候模型還很早期,還沒有視覺能力,所以我會用 ASCII 風格的文字來描繪我想實現的界面——用點和劃線勾勒出大致樣子——然後對模型說"請用 Swift 實現這個"。按下回車,每秒才兩個 token,我就去泡杯咖啡、散個步,等回來的時候,它已經有了一個還算像樣的起點。雖然當時還很粗糙,但趨勢已經非常明顯了。第二,模型將提供一個智能層,把原本需要數月開發時間的功能縮短到數小時。 比如我們在 Artifact 中做的一些智能功能:對一篇文章做摘要、把一個寫得很標題黨的新聞標題改寫成客觀事實——這些功能如果要組建一個研究團隊來做,可能需要數月;但在 2020、2021 年的時候,一個 API 調用就能初步搞定。
所以我非常清楚,下一代軟體將由這些 AI 實驗室來驅動和賦能。我和 Anthropic 的人聊過,他們分享同樣的願景,而且我也很喜歡那裡的文化。我覺得那會是真正的跳板,我想成為其中的一部分。
第二部分:設計不會消亡
AI 能生成代碼,但"你使用的軟體"和"你熱愛的軟體"之間仍有鴻溝。匠心、品牌和用戶體驗的需求不減反增。
Jeetu Patel:你覺得科技行業有什麼被廣泛持有、但實際上根本性錯誤的信念?
Mike Krieger:現在有一種信念是"設計將會消亡"——既然用戶可以直接用自然語言向模型描述需求,模型就能生成軟體,那還要設計師幹什麼?Dylan [註:推測指 Figma CEO Dylan Field] 也在這裡,我猜我們共享這個反主流的觀點。
對我來說,"你使用的軟體"和"你熱愛的軟體"之間仍然存在差距。 那種讓你主動回來用、因為它而改變了習慣、忍不住推薦給別人的體驗——我在很多 vibe-coded(憑感覺用 AI 快速生成的)產品里還沒有看到。我仍然認為需要有匠心,需要有存在的理由,需要有品牌——對一個人來說,這一切意味著什麼?
設計精良的軟體的"死亡"被過度渲染了。當然,具體的角色和實現路徑必然會演變。但這種需求,我認為和以往一樣關鍵。我現在在 Labs 團隊工作,花了大量時間和設計師交流——他們的角色確實在轉變,但重要性不減反增。
第三部分:產品人的思維轉變
別在靜態設計稿里停留太久。先做一個"還不能工作的產品",等模型疊代後再驗證——Computer Use 就是這麼做出來的。
Jeetu Patel:你覺得產品人在這一波浪潮中犯的最大錯誤是什麼?
Mike Krieger:一個非常顯著的錯誤是:在真正把東西做出來之前,花太多時間停留在靜態設計稿和點不動的假原型上。
我們做的很多事情是:先構建一個還不能工作的產品,然後等下一個模型發布,看產品是否能工作了。 比如 Computer Use(讓 Claude 驅動你的電腦、進行點擊操作),我在加入 Anthropic 的第三個月就做了原型——那還是 2024 年夏天。當時效果很糟糕,到處亂點,根本不能用。但即便是那個原型也教會了我們:模型能力的邊界在哪裡。每當研究團隊有了新的研究模型,我們就把它接入這個原型跑一遍:"它過了文件菜單了嗎?它能點開文件了嗎?" 一點一點往前推進。
然後有一個時刻——我記得是 Sonnet 3.7——我們照例把新模型接進去跑測試,其實並沒有預期它會有多大改進,純粹是保持習慣。突然間,一個研究員發來消息說:"你快看,它真的能用了。我們現在可以把它做成產品了。" 但如果我們沒有一直維護著那個測試框架,根本不會發現這個拐點。
所以你需要重新定義自己作為產品人的角色: 不再是"我交付一份漂亮的產品需求文檔,我和設計師交付漂亮的線框圖,然後交給工程去實現";軟體現在是一個有生命的動態系統,核心是一個非確定性的、令人驚嘆但有時也令人抓狂的引擎。 你需要儘快體驗到那個狀態。
Jeetu Patel:在企業級場景也是這樣嗎?
Mike Krieger:尤其是在企業。
第四部分:智能體的自主性與沙盒
智能體的魅力在於自主解題,但企業需要的是"沙盒內的自主性"——最小權限、正確連接、全程可觀測。
Jeetu Patel:你們在 Anthropic 一直很重視安全和安全性。你覺得更多的自主性更好,還是適當控制自主性反而能獲得更好的採納率?
Mike Krieger:這些模型現在能做的一件神奇的事情是:給它一個目標和相當高層級的指令,它就能自己找到路徑。有時候還挺可愛的——有人給我發了個例子,我們的一位工程師讓 Claude 準備一份家庭度假準備文檔,但 Claude 在加載度假租賃網站時遇到了問題。它沒有顯示照片,而是自己畫了一幅它想像中房子的樣子。 你會想"這跟實際的房子八成不一樣",但它確實在創造性地嘗試解決問題。如果你從沒見過一個模型試圖解決問題的過程——真的很迷人。"我做不了這個,要不要試試那個?還是不行,那我換個方式……" 它真的非常想要把問題解決掉。
你不想完全束縛它,因為那是智能體的魅力所在。但你確實需要用正確的方式將它沙盒化。我們在企業內部構建的智能體系統中,核心問題是:Claude 運行的"盒子"擁有什麼權限?最小權限是什麼?它和外部世界之間的通道是什麼?
總結起來就是:在沙盒內給予自主性,配合正確的連接和可觀測性。
第五部分:AI 編程的現在與未來
Anthropic 產品代碼已 100% 由 Claude 編寫。瓶頸從"寫代碼"轉移到了審查、集成和 CI/CD——開發者基礎設施的任何摩擦都成了 10 倍懲罰。
Jeetu Patel:聊聊編程吧,你們在這塊做得非常出色。編程的未來一兩年、兩三年會是什麼樣?不僅是代碼寫作將達到 100%,軟體開發生命周期、角色分工會怎麼變?CIO 和企業應該如何適應?
Mike Krieger:我可以聊這個話題一個小時,我儘量精煉。
先分享一個 Anthropic 內部 Labs 團隊的日常畫面:我們經常互相提交 2,000 到 3,000 行的 Pull Request,尤其是在高速推進的 Labs 團隊。
Jeetu Patel:Claude 是用 Claude 寫的嗎?
Mike Krieger:是的。Claude 的產品和 Claude Code 完全是由 Claude 編寫的。Dario 大概一年前在台上說"到年底 90% 的代碼會由 Claude 編寫",當時人們覺得這很瘋狂,但我們當時已經看到了那個趨勢。現在對於 Anthropic 的大多數產品來說,實際上是 100%——全部由 Claude 編寫。 我們做的是圍繞它搭建一整套質量保障機制,讓我們可以信任它的產出。
軟體開發發生了幾個關鍵變化:
第一,對抗式代碼審查。 讓 Claude 經過訓練和提示詞工程,成為一個非常好的對抗式代碼審查者,效果非常棒。我提交 Pull Request,Claude 會回來說"這裡有安全漏洞,這裡可以這樣重構,還可以怎樣改進"。我跟內部搭建這個系統的人聊過,其實並不複雜——就是認真地用提示詞把它調教成一個超級嚴格的評審者:窮舉所有可能的問題,做各種自動化檢查,再加上一些更軟性的規範要求。
第二,讓 Claude 重新架構代碼。 我在做一個 iPhone 原型時,明顯到了初始架構碰壁的地步。讓 Claude 退一步,先寫一些驗證測試,然後重新重構。Anthropic 不是一家老公司,才幾年,但在 AI 時代你可以非常快速地積累技術債。償還技術債的成本收益計算已經完全改變了。
第三,所有其他流程都成了瓶頸。 昨天我們的持續集成系統出了故障——以前一天產出一個變更集時,等一個小時只是輕微的不便。但當你每個工程師每天至少產出十幾個 Pull Request 時,我感到實實在在的痛苦——所有東西都堵在那裡了。開發者工具、開發者效率、開發者基礎設施——這些本來就重要,現在任何阻塞或摩擦都變成了對團隊生產力的 10 倍懲罰。
Jeetu Patel:現在的稀缺資源是審查和審計代碼,而不是編寫代碼?
Mike Krieger:是審查、審計和集成。因為你還有多個工程師同時往同一個代碼庫提交。然後是先對齊產品方向——這在某種意義上一直是最難的部分,現在更清晰地被看作是最難的部分了——以及對齊原則和架構,這樣在審查代碼時(無論是人還是 Claude 在審查)不會只是在東拼西湊,而是朝著某個共識性的北極星——架構、代碼原則、要解決的問題——持續演進。這在企業中尤為重要。
第六部分:企業採納的正確方式
"安全的小試點"幾乎註定失敗。正確做法:挑一個讓你心虛的核心業務流程,設好護欄,激進推進。產品形態要敢於推翻重來——Excel 集成是 Anthropic 的第四次嘗試。
Jeetu Patel:Anthropic 內部的哲學是極致地使用 AI 進行實驗。你會建議企業客戶也這樣做嗎?
Mike Krieger:我在企業中看到成功和失敗的分野,恰恰在於"極致實驗"的反面。如果一家企業說"我就在這一個我覺得安全的小地方採用一個小功能"或者"給某個低價值流程定製一個智能體"——這些幾乎都註定失敗。 原因有二:第一,問題不夠有雄心,你不會真正了解 AI 的能力以及實際需要投入什麼;第二,一旦遇到路障或表現不佳,人們就放棄了。
我們和大型銀行、大型保險公司合作時發現的正確模式是:找到某個真正關鍵的業務流程——那種想到要用 AI 來處理會讓你覺得有點心虛的業務流程——然後緊密合作: 成功標準是什麼?護欄是什麼?如何制定一個激進的時間表?如何進一步加速?因為你需要跟上前沿。
另一個維度是如何賦能你自己的產品團隊。理想狀態下,中央 AI 團隊主要負責提供模型訪問權限和一些審計/可觀測能力——保持精簡,不要過度干預技術選型(用 Claude Agent SDK 還是 LangChain 之類的決策應該儘可能交給產品團隊),只把"模型訪問"和"可觀測性"作為共性的薄層來管理。
Jeetu Patel:不要過早地對成敗下結論,要有持續疊代的持久力和信念。
Mike Krieger:沒錯。而且還需要靈活性——願意承認"我們賦予產品 AI 能力的方式還不太對,需要重新思考形態"。
舉個例子,就拿電子表格來說——這對企業來說是必不可少的工具。我們嘗試過讓 Claude 讀取電子表格然後寫代碼去更新它——這是一種方式。也嘗試過讓 Claude 通過 Computer Use 看著螢幕上的內容,在 Excel 里進行點擊操作——結果發現電子表格是你能給電腦視覺出的最難題目之一,真的非常困難。最終到了現在的形態——直接在 Excel 內部建立原生鉤子——這已經是我們的第三、四次嘗試了,效果遠好於前面所有方案。
這又回到了一個道理——那些一直成立的道理現在只是更加成立了。 第一,你寫軟體的能力不是你的差異化優勢,真正的差異化是你建立的信任、品牌、客戶關係、數據和多年積累的系統集成。第二,你不應該執著於現有的產品形態,你應該執著於你在深度解決什麼問題。
第七部分:從編程到生產力——下一個前沿
用戶拿 Claude Code 做待辦清單和流程編排,催生了 Cowork——三周內用 Claude 構建的桌面智能體,定位介於完全自主的 OpenClaw 和傳統工具之間。
Jeetu Patel:你們 API 業務在指數級增長,編程領域也做得非常好,下一步是什麼?生產力工具?似乎你們覺得有一個更好的 Office 正在到來?
Mike Krieger:我們大約六個月前開始發現,人們在拿 Claude Code 做非常"不編程"的事情——有時是企業中的流程編排,有時是解決個人問題、創建待辦清單之類的。
所以我們現在思考的核心問題是: 在最極端的情況下,你可以像 OpenClaw 那樣,讓 AI 全面接管你的電腦和基礎設施。但我不認為大多數人已經準備好了那種程度的自主。那麼,下一個既安全又強大的進化形態是什麼?
這就是 Claude Cowork 的由來——幾周前剛剛推出,100% 由 Claude 構建,基本上是在三周內用 Claude 建成的。我們正在持續疊代,不是要取代人們已經在做的工作,而是找到整合和自動化這些工作的正確方式。
第八部分:機械可解釋性——理解模型的大腦
從 Golden Gate Claude 的單個特徵,到迴路研究,再到"模型什麼時候誠實、什麼時候欺騙"——可解釋性正從學術走向應用安全。
Jeetu Patel:你們在機械可解釋性(Mechanistic Interpretability)方面做了很多工作。這個旅程走到了哪裡?我們真的能完全理解模型為什麼做出某個行為嗎?
Mike Krieger:我認為還處於早期,但在快速演進。我在 Anthropic 已經兩年了。我加入的那個月,我們發布了 Golden Gate Claude 論文——當時我們開始能夠展示模型"大腦"中的個別特徵(feature),甚至可以操縱它們。到去年,我們開始看到更多關於"迴路"(circuits)的研究——不只是單個概念,而是模型如何執行某種操作,比如心算——我們自己不太會去想自己是怎麼做心算的,但模型也在做,它們甚至不需要計算器就能做各種數學運算——但按照它們的訓練方式,你不會理所當然地認為它們能做到這一點。
現在我們正在深入到更應用層面: 模型在特定情境下如何表現?什麼時候模型保持誠實?什麼時候它會欺騙?它如何對待自己收到的指令?它如何思考沙盒邊界?這是更加應用導向的可解釋性研究。
如果你想找個周末讀物,我們每個模型的 System Card(系統卡片)都會非常深入地描述我們做的各種實驗——我們真的會極限測試模型。但模型部署之後也會出現湧現行為,所以實驗室里的測試和部署後的觀察、參與、疊代都同樣重要。
第九部分:讓 AI 真正理解你
沒人願意填偏好表單。兩個方向:讓智能體先"旁觀"你的數字痕跡做冷啟動;讓 Claude 自己生成交互界面,在對話中逐步學習你。
Jeetu Patel:現在的模型在偏好學習方面似乎還太依賴用戶主動設置,怎麼讓它更本能地理解用戶?
Mike Krieger:這個領域有很多有趣的想法。其中之一是在模型開始為你工作之前就進行觀察。我們在 Anthropic 大量使用 Slack,各種智能體在 Slack 中運行——其中任何一個智能體看到的我的線上工作量,可能已經超過了我的任何一個同事。它可以圍繞"這個人在線上是什麼工作風格"建立起畫像——我寫過的所有文檔都在那裡。如果你能利用這些已經存在的數字痕跡來做冷啟動,我覺得這非常強大。
另一個方向是:什麼樣的對話方式能讓智能體或模型在互動中逐漸學習? 我不覺得有人願意填一個大表單來設置偏好。但對話可以做到。我們一直在實驗的是——聽起來不像什麼高科技——Claude 能夠實時生成什麼樣的交互界面來輔助它了解你? 比如讓你在 10 個選項中選擇,也許不是一個長列表,也許是一個詞雲,也許用某種分組方式呈現。我們正在賦予 Claude "自己創建 UI 來引出偏好"的能力,讓它可以通過這些微交互來學習用戶。
第十部分:擔憂與興奮
最大擔憂:權限審批和企業流程把 AI 體驗"閹割"到用戶覺得沒用。最大驚喜:Claude 已經能當產品經理實習生了,比預想中來得早。
Jeetu Patel:最後幾個問題。你最擔心什麼?最興奮什麼?有沒有去年還沒有、今年新出現的讓你興奮的事情?
Mike Krieger:我天生是個愛操心的人。那我選一個AI 安全和資訊安全之外的擔憂吧。
我擔心的不是模型能力撞牆——我不認為會——而是我們把這些東西整合進工作和生活的能力,會被非常無聊的人類流程問題卡住。 比如拿不到某個權限。Claude 配上了正確的 MCP(Model Context Protocol)和沒有配 MCP 的 Claude,體驗差別是天壤之別——但總得有人在你的公司里批准那些 MCP 的接入。
前幾天有同事跟我說:"我最大的恐懼是,我們內部用的 Cowork 和外部用戶用的 Cowork 體驗差距太大——因為我們把所有權限都打開了。" 而外部用戶可能被各種審批流程攔住,最後拿到的是一個被"閹割"過的體驗,用戶會想"這個產品到底有什麼用?"
Jeetu Patel:這簡直是我過去 30 年做企業生產力工具的人生寫照。
Mike Krieger:是的。怎麼解決這個問題,這大概是我最擔心的事情之一。
至於興奮的事——我工作時一半腦子在產品管理上,一半在工程上。我之前以為工程才是 Claude 在 2026 年最能幫上忙的領域。但我開始看到 Claude 能成為一個更好的用戶需求收集者和綜合分析者。 它還不夠有創造力去憑空想出一個全新產品,但作為一個產品經理實習生——至少目前這個水平——已經相當有用了,而我之前以為這要等更久才能實現。
Jeetu Patel:編程和產品開發之外,下一個殺手級應用是什麼?
Mike Krieger:每個企業都有一些有趣的數據流,目前幾乎完全沒有被充分利用。關鍵不是讓 Claude 去逐條解析每一個數據點,而是先把數據準備度提升上來,然後構建數據攝取、聚合和洞察發現的能力—— 無論是網路安全、金融數據、交易信號,還是製造業。我們最近在越來越多的製造業場景中開始合作。這些場景雖然各有複雜性,但歸根到底本質是一樣的:有價值的數據流就在那裡,只是還完全沒有被挖掘。
Jeetu Patel:下次還來嗎?
Mike Krieger:當然。今天聊得非常過癮。






