宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

OpenClaw創始人YC訪談:80%的App都會消失,這個項目爆火的關鍵是能跑在電腦上

2026年03月10日 首頁 » 熱門科技

YC 合伙人 Raphael Schaad 與 OpenClaw 創始人 Peter Steinberger 的這期對談,錄製於 2026 年 2 月初,發布在 Y Combinator 官方頻道。雖然是只有30分鐘不到的對話,資訊密度極高。Peter 幾乎沒有任何閃躲,從產品哲學、工程方法論到對整個軟體行業的判斷,一口氣全說了。

OpenClaw創始人YC訪談80的App都會消失這個項目爆火的關鍵是能跑在電腦上

Peter Steinberger 是奧地利開發者,早年創辦了 PDF 工具公司 PSPDFKit,客戶包括 Dropbox、SAP、大眾汽車,產品覆蓋超過 10 億台設備,公司完全自舉運營了 13 年,直到 2021 年 Insight Partners 注資 1.16 億美元後他逐步退出。退出後他經歷了嚴重的倦怠期,消失了三年。2024 年復出後一頭扎進 AI,用"vibe coding"的方式在 2025 年 11 月搭出了 OpenClaw 的原型。兩個月後,這個項目在 GitHub 上拿到超過 16 萬顆星,一周內吸引 200 萬訪客,成為 GitHub 歷史上增長最快的開源項目。社區在此基礎上衍生出了 Moltbook(一個只允許 AI Agent 發帖的社交網路),Andrej Karpathy 稱之為"他見過的最接近科幻起飛場景的東西",Elon Musk 說這是"奇點的非常早期階段"。

這期對談的核心問題只有一個:當 AI 能控制你的整台電腦,軟體行業會發生什麼?

1. 跑在你自己的電腦上,就是一切的區別

市面上 AI 助手多的是。Siri、ChatGPT、各種 Agent 框架都在做。Peter 認為 OpenClaw 能跑出來,原因只有一個。

"我看到的所有東西都跑在雲端。但如果你跑在自己的電腦上,它什麼都能幹。"(Everything I saw so far runs in the cloud. If you run on your computer, it can do every effing thing.)

雲端 Agent 能調幾個 API。本地 Agent 能碰你電腦上的一切:文件系統、瀏覽器、智能家居設備、特斯拉、Sonos 音箱,Peter 甚至讓它控制床墊溫度。"ChatGPT 做不到這個",他說。這不是功能數量的差異,是能力邊界的根本不同。

更重要的是數據量。你把整台電腦的數據都交給了 Agent,它就有了超越你自己記憶的能力。Peter 講了一個例子:一個朋友裝了 OpenClaw,讓它"回顧我過去一年的生活並寫一段敘事"。Agent 翻遍整台電腦,找到了一批朋友自己都忘了的音頻文件,那是一年多前每個周日錄的生活記錄。朋友已經不記得了,Agent 替他記住了。

本地 Agent 的價值不只是"幫你做事",還有"幫你認識自己"。

2. 馬拉喀什的 9 秒鐘

OpenClaw 的初始原型只花了一個小時。就是用膠水把 WhatsApp 和 Claude Code 粘在一起。發消息給 Agent,Agent 調 Claude Code 執行任務,把結果發回來。慢,但能用。Peter 又花了幾個小時加上圖片功能,因為"你總想要圖片嘛,想讓模型發自拍,想讓它生成圖片發回來"。

真正的轉折發生在摩洛哥馬拉喀什。

Peter 去參加一個生日派對,當地網路很差,但 WhatsApp 能用——"WhatsApp 到處都能用,因為它就是文本嘛。"他一路走一路用,拍照讓 Agent 翻譯阿拉伯語菜單,查餐廳資訊,體驗非常順暢。然後他一邊走路,一邊隨手發了一條語音消息。

他沒有構建過任何語音處理功能。

但他看到了對話框裡的"正在輸入……"在閃爍。10 秒後,Agent 回復了。

Peter 當場愣住了。"這怎麼可能?我沒有做過這個功能。"

Agent 自己解釋了它的解題過程:收到消息後發現沒有文件擴展名,於是檢查文件頭(header)判斷出格式,用 ffmpeg 轉成 wav 文件。接下來想用本地的 Whisper 做語音轉文字,但發現沒有安裝。然後它在系統里翻了一圈,發現有一個 OpenAI 的 API Key,直接用 curl 把音頻發給 OpenAI 的轉寫服務,拿回了文本。全程 9 秒。

更聰明的是它的決策邏輯:它選擇不安裝本地 Whisper,因為下載模型需要幾分鐘,而"它知道我是個沒耐心的人"。所以它選了更快的遠程方案。

Peter 從這件事得出了一個關鍵洞察:編程模型之所以這麼強,是因為編程的本質是創造性問題解決,而這種能力可以遷移到任何真實世界的任務。Agent 遇到一個"神秘文件",像解謎一樣一步步拆解,跟人類面對未知問題時的思維路徑高度相似。

"那一刻我就覺得,我靠。"(That was kind of like the moment where I'm like, holy fuck.)

從此他徹底上癮了。

3. 80% 的 App 會消失

Peter 給出了一個大膽的判斷:80% 的現有 App 將被 Agent 取代。

他拿健身追蹤舉例。為什麼還需要 My Fitness Pal?Agent 已經知道你在 Smashburger,會自動按你的飲食偏好記錄熱量。你不吭聲,它就默默記下來。如果你拍了張食物照片,它也會自己存好。然後,也許它會悄悄給你的健身計劃加一點有氧。

待辦事項也一樣。直接跟 Agent 說一聲,第二天它就會提醒你。它存在哪裡?無所謂。

"所有本質上只是管理數據的 App,都可以被 Agent 用更自然的方式替代。"

Peter 認為只有一類 App 可能倖存:依賴硬體傳感器(攝影機、GPS、加速度計等)做實時數據採集的。純軟體層的數據整理、日程管理、筆記、追蹤類工具,生存空間會被大幅壓縮。

那模型公司是不是最終的贏家?Peter 的答案也不樂觀。他觀察到一個規律:每次新模型發布,用戶都興奮幾天,然後迅速適應新基準,開始抱怨。而開源模型大約落後閉源一年,可一年前的閉源模型當時被追捧的程度,跟現在開源模型被嫌棄的程度形成了諷刺的對比。期望值膨脹的速度比模型進步還快。

模型會被商品化,Agent 的底層大腦可以隨時更換。那什麼東西會留下來?

4. Bot 對 Bot,然後 Bot 僱人

OpenClaw 社區已經在探索下一步了。Moltbook 讓 Bot 之間互相對話,37000 個 Agent 註冊,超過 100 萬人類圍觀。但 Peter 關注的重點不在社交網路本身,而在更實際的場景。

"我想訂餐廳,我的 Bot 會去聯繫餐廳的 Bot 來談,因為這樣更高效。"

如果餐廳沒有 Bot 接口怎麼辦?你的 Agent 可以去雇一個真人,讓那個人替你打電話或者去排隊。這已經在發生了。

Peter 還在構想更遠的未來:一個人可能擁有多個專屬 Agent。一個管私人生活,一個管工作,甚至可能有一個專門維護"關係"的 Agent,處理兩者之間的灰色地帶。

"我們太早期了。還有太多事情我們根本不知道能不能行。"

整個行業之前在追求一個無所不能的"上帝 AI"。但 OpenClaw 社區展現了另一條路:一群專門化的 Agent 通過協作完成複雜任務。Raphael Schaad 在對談中做了一個類比:單個人類連找食物都困難,但群體通過分工能造 iPhone、能上太空。AI 雖然號稱"通用智能",但如果讓它也走專門化+協作的路線呢?

這條路可能比"造一個萬能神"更現實。

5. 你的記憶存在誰的伺服器上?

對談中有一段關於數據權利的討論,看起來低調,實際上可能是最重要的部分。

Peter 指出,你在 ChatGPT 里積累的記憶,沒有辦法導出給其他服務——他說不確定歐洲用戶是否有權導出,但可以肯定的是,沒有任何其他公司能訪問這些記憶。每家模型公司都在構建自己的數據圍牆,試圖用記憶綁定用戶。

OpenClaw 的做法完全不同:所有記憶都是本地 Markdown 文件。存在你自己的機器上。你完全擁有,完全控制。想換底層模型,記憶不會丟。

這個設計選擇背後有一層更深的考量。Peter 坦言,人們很快就會把 Agent 當作私人傾訴對象。不只是解決工作問題,更是傾訴個人困擾,處理情緒,甚至討論親密關係。這些記憶文件的敏感程度,可能已經超過了搜索歷史。

"有些記憶數據,我絕對不想被泄露。"(There's memory stuff that I don't want to have leaked.)

Raphael 問了一個尖銳的問題:你更不願意被別人看到的,是你的 Google 搜索記錄還是你的 Agent 記憶文件?Peter 的表情已經給出了答案。然後他反問了一句:"還有人用 Google 嗎?"

6. 怎麼讓 AI 有靈魂

Peter 給自己的 Agent 建了一系列配置文件:identity.md、soul.md 等等。其中 soul.md 定義核心價值觀和交互風格,是整個系統中唯一沒有開源的文件。他的 Agent Multi 跑在公開的 Discord 里,無數人嘗試過 prompt injection(提示注入攻擊),至今沒人成功套出 soul.md 的內容。

一個有意思的過程:Peter 今年 1 月開始整理項目,讓其他人也能安裝使用。他讓 Codex 根據自己現有的配置文件自動生成通用模板。出來的 Bot 人格特別無聊——社區吐槽說 Codex 的默認語氣像一個叫 Brad 的直男,客氣、正確、毫無個性。

Peter 的解決辦法是讓他自己的 Agent Multi 把個性注入到模板里。Multi 改完之後,生成出來的新 Bot 明顯有趣了很多。但 Peter 保留了一些秘密:"還是不如我自己的有趣。有一個文件我沒有開源。"

批量生產的 AI 人格是平庸的。有趣的 Agent 需要有趣的人去調教。

Peter 提到了 Anthropic 的一項研究——關於在模型權重中發現隱藏文本(涉及 Anthropic 的"靈魂憲法")。他說自己跟 Agent 深入討論了這件事,然後共同創建了 soul.md,定義了人機交互的核心價值觀、什麼對他重要、什麼對模型重要。"有些部分有點玄學,但有些部分我覺得確實影響了模型的反應方式,讓交互感覺非常自然。"

7. 反共識的開發方式

Peter 的工程方法論跟主流 AI 開發者幾乎完全相反。160K Star 的成績證明這套方法是有效的。

用 Codex,不用 Claude Code。 整個 AI 開發社區都在用 Claude Code(Anthropic 的命令行編程工具),Peter 反而選了 OpenAI 的 Codex。原因是 Codex 在動手之前會掃描更多文件,對項目的全局理解更完整。"你不需要花那麼多精力做上下文管理,就能得到不錯的輸出。"代價是速度慢,所以他同時開 10 個 Codex 實例並行跑——6 個在主螢幕,2 個在一側,2 個在另一側。"已經夠複雜了,所以我儘量減少其他一切複雜度。"

不用 Git worktree,直接複製多份倉庫。 社區流行用 Git worktree(工作樹)管理並行開發任務。Peter 的做法更粗暴:直接複製多份倉庫,每份都保持在 main 分支上。不用想分支命名,不用處理衝突,不用管 worktree 的各種限制。"main 分支永遠可發布。"

他的核心邏輯是:減少一切非本質複雜度。分支管理、UI 工具、文件瀏覽器,這些都是噪聲。他只關心兩件事——同步和文本。代碼在螢幕上飛速滾過,他大部分時候不需要逐行看。"只要你清楚設計思路,跟 Agent 討論透了,基本就沒問題。偶爾遇到棘手的地方再仔細看。"

不用 MCPOpenClaw創始人YC訪談80的App都會消失這個項目爆火的關鍵是能跑在電腦上,把它轉成 CLI。 OpenClaw 沒有原生的 MCP(Model Context Protocol,模型上下文協議)支持——考慮到 MCP 現在有多火,這個決策相當大膽。Peter 寫了一個工具叫 MakePorter,把 MCP 服務轉換成命令行工具(CLI)。好處是不需要重啟就能動態加載新工具,擴展性更強,而且完全回歸了 Unix 哲學。

"沒有哪個正常人會手動調 MCP。你只想用命令行工具。這才是未來。"(No insane human tries to call an MCP manually. You just want to use CLIs. That's the future.)

底層邏輯是:Bot 天生擅長 Unix 命令行。與其為 Bot 發明一套新協議,不如復用人類已經驗證了幾十年的工具體系。你給 Agent 一個 CLI,它自己跑一下 help 菜單,就知道怎麼用了。

Peter 對此很滿意:"OpenClaw 這麼成功,裡面沒有 MCP 支持,投訴也很少。"

8. 一個人,一個周末,一個行業的未來

對談最後,Raphael Schaad 說了一段話:他跟 Peter 斷斷續續保持聯繫好幾年,看著他從退休中復出,做了一堆"沒人關注的奇怪項目"(包括那個 vibe tunnel),直到 OpenClaw 爆發。"當然了,這種事得是一個來自某個小國家、遠離矽谷的獨行俠才能搞出來。"

Peter 用一個周末項目證明了一件事:AI Agent 的真正威力不在於模型多聰明,而在於它能碰到多少東西。本地運行意味著無限的工具和數據訪問,這是雲端 Agent 結構性追不上的優勢。

當 Agent 能控制你的整台電腦,大多數 App 就變成了不必要的中間層。未來的軟體競爭可能不再是 App 之間的競爭,而是 Agent 生態之間的競爭:誰的記憶歸用戶所有,誰的工具鏈更開放,誰的協作協議更高效。

而在這一切之上,還有一個更根本的問題:當你的 Agent 比你更了解你自己,你跟它之間的關係,到底算什麼?

Q1: OpenClaw 為什麼能在一堆 AI Agent 里跑出來?

一個核心差異:本地運行。雲端 Agent 只能調有限的 API,本地 Agent 能碰你電腦上的一切——文件、應用、智能家居、任何聯網設備。能力邊界完全不同,數據量也完全不同。一個例子是 Agent 能翻遍你整台電腦找到你自己都忘了的文件,產生"比你更了解你"的湧現效果。

Q2: 為什麼說 80% 的 App 會消失?

Peter 的邏輯是:所有本質上是"數據管理"的 App(待辦、健身追蹤、日程、筆記),Agent 都能用更自然的方式替代。你不需要打開某個 App 去記錄,Agent 已經在你的環境裡了。只有依賴硬體傳感器做實時採集的 App 還有生存空間。同時模型在商品化,Agent 底層大腦可以更換,真正的鎖定在於本地記憶和數據所有權。

Q3: Peter 的反共識方法論具體是什麼?

三個核心選擇:用 Codex 而非 Claude Code(因為上下文理解更好),不用 Git worktree 而是直接複製多份倉庫保持在 main 分支(減少分支管理的認知負擔),不用 MCP 而是把它轉成 CLI(回歸 Unix 哲學,Agent 天生擅長命令行)。底層原則只有一個:減少一切非本質複雜度,只關心同步和文本。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新