這兩年AI的發展可謂是相當的迅速,從各家的大模型,到Open Claw、Hermes這樣的Agent,以及像是OpenAI的Codex、Claude Code、Minimax Code之類的Coding Agent,滿足不同用戶不同的使用需求。
大模型、Agent大家都知道是幹嘛的,比較特殊的,是那些Coding Agent,看到MiniMax Code、OpenAI Codex這些名字,很多人的第一反應可能是,這不就是給程序員用的嗎?跟我有什麼關係?

說實話,Code這個詞,確實挺誤導人的,我一開始也覺得,它就不過是一個編程用的工具罷了。
其實,這些工具早已不再局限於編程本身,在工作和學習中也能發揮作用。接下來,我們通過幾個例子看看 Coding Agent 到底能做些什麼。
Coding Agent 到底是什麼?
對於大多數用戶來說,接觸最多的依舊還是大模型,而普通聊天模型和Coding Agent的區別,我們可以舉個例子。

比如,你跟普通聊天模型說:「我想吃番茄炒蛋。」
大模型給你的,會是一份詳細的菜譜,需要備什麼食材,每一步需要怎麼操作寫的非常明白,但你還得親自去廚房搞定這一切。
Coding Agent更像是直接接過圍裙的那個人。它會看看冰箱裡有什麼,缺什麼材料,開始切菜、開火;做好以後還會自己嘗一口,發現太咸了,再想辦法調整。

換到電腦上,它不只告訴你這件事應該怎麼做,而是可以讀取文件、修改代碼、運行程序、查看報錯,再根據結果繼續修。
你給它的不再只是一個問題,而是一個任務。而這也是Agent最重要的變化,從給答案,變成交作業。
MiniMax Code:我讓它從一段文案開始做影片
那這些Coding Agent工具,究竟可以做些什麼?我們以幾個實例來展示一下。Minimax作為國產大模型,它所推出的Minimax Code,應該也是大家相對來說使用難度較低的一個Coding Agent了。

它背後使用的MiniMax M3,是一款面向Coding和Agent任務的原生多模態模型。按照MiniMax的官方介紹,M3支持最高1M上下文,可以讀取圖片和影片,也具備操作電腦的能力。

聽起來有些複雜,我們來嘗試讓它生成一段影片看下效果。因為MiniMax M3是原生支持多模態的,所以我們可以文生圖、文生影片、圖生影片。為了內容相對可控,我們直接把腳本拆解成幾個畫面,然後針對性地給每個畫面先生成靜態的關鍵幀,以確保畫面的可控。
這裡有一個小技巧,很多人說,好像不太會寫精準、好用的prompt,其實很簡單,一併交給大模型就好了。

根據我們提供的prompt,Minimax Code生成了對應的關鍵幀。在確認畫面符合想要的風格之後,就可以繼續描述影片化prompt,來生成影片了。

這裡要補充一句,儘管有AI的幫助,也不代表一鍵生成就能直接用。畫面風格可能不統一,節奏也可能偏離預期,整個過程還是需要你不斷調整和把控。
當然,相比過去,這極大地降低了影片製作的門檻,也提升了製作效率。
Codex:零基礎也能開發APP
接下來是OpenAI的Codex。OpenAI對它的定義很直接,一個用於軟體開發 的Coding Agent。它可以讀取和修改文件、理解已有項目、運行測試、排查問題,也可以從零開始搭一個應用。

聽著還是很像一個程序員的,那就結合我的喜好,來給它一個非常生活化的任務,做一個咖啡豆管理APP,並且是鴻蒙版的。
日常咖啡豆買多以後,管理起來其實挺麻煩。豆子什麼時候烘的?產地是哪裡?用了多少?適合手沖還是意式?養豆養到第幾天?如果全靠腦子記,很容易出現的情況就是,在柜子角落裡翻出來一包存放了很久的豆子。

所以我把需求告訴 Codex,基於鴻蒙系統做一個咖啡豆管理APP,可以記錄豆子的名稱、產地、烘焙日期、風味、庫存和沖煮記錄;臨近最佳賞味期時要有提醒,界面不要做得像倉庫管理系統。
然後它就開始幹活了。它會先搭出基本的頁面,再補充錄入、篩選、庫存和詳情功能。運行之後,如果按鈕有問題、頁面顯示不對,它還能繼續檢查和修改。甚至,在這個過程中,會把鴻蒙開發環境,像是DevEco Studio之類的一併協助安裝好。

我們先看下效果,實際上達到目前的程度,僅僅是花了2個晚上的時間而已,整個效率是非常高的。後續只需要再優化一下UI,確保沒有BUG,就已經是一個非常成熟的APP了。
而在這個過程中,用戶就好像是那個產品經理,去提供APP的優化思路:這個頁面資訊太擠了;豆子快喝完時給個提醒;首頁別放那麼多卡片,我只想先看到最近在喝什麼……

我不需要告訴它具體應該改哪一行代碼,只需要把哪裡不好用講清楚。這也是Coding Agent對普通人而言最有意思的地方。它沒有讓編程知識突然消失,但它把很多需求翻譯成了日常語言,以及讓每個人,都能夠變成開發人員。
Codex:不僅是編程
其實,究竟要怎麼去使用Coding Agent,想像力很重要。

比如,我們可以讓它幫我搭建一個股票看板。它需要有大盤相應的指標、趨勢、分析。也可以添加自己關注的股票,來做針對性的分析。


其實整個過程很簡單,你只要和Codex說清楚你的想法,它就會幫你完成任務,甚至還能主動去尋找合適的數據源作為分析支撐。整個過程不需要太多的時間,但取得效果,還是非常顯著的。
真正變化的,不是人人都會編程
用完這幾個案例,我覺得Coding Agent 容易被誤解的一點,就是大家總在問,以後是不是不用學編程了?
這個問題有點像相機自動對焦出現以後,問攝影師是不是沒用了。工具確實變簡單了,但做什麼、為什麼做、好不好用,依然需要人來判斷。

做咖啡豆管理APP時,你得知道自己真正需要管理什麼;做股票看板時,你得知道哪些資訊值得留下;做影片時,你也要判斷什麼鏡頭有用,什麼畫面只是看起來熱鬧。Agent降低的是執行門檻,不是思考門檻。
而且它也會犯錯,它可能做出一堆你沒要的功能,也可能誤判問題所在,總之在這個過程中,你需要不斷的去協助Agent去調整、優化。

但不管怎麼說,帶來的變化依舊是顯而易見的。過去,一個想法到成品之間,隔著代碼、設計、部署、剪輯和各種軟體操作。很多想法不是不夠好,而是還沒動手,就已經被流程勸退了。
現在這堵牆正在變矮。你不必成為程序員,也不需要精通各種軟體。你只需要學會一件事,把模糊的想法,清晰地表達成可執行的任務。
所以,選擇一個趁手的Coding Agent,去迎接新的時代吧。






