潮水退去,才知道誰在裸泳。
3 個月前,全球最大 AI 開源社區 Hugging Face 首席執行官,對 2024 年的 AI 行業做了 6 條預測,其一是:
某個當紅的 AI 公司會破產,或者以極低的價格被收購。
不知道當時他的心裡有沒有具體的人選,但開年沒多久,現實真的如劇本一樣上演。
技術團隊集體出走,當紅 AI 獨角獸的垮掉
談到文生圖模型,跳不過三個產品:DALL-E、Midjourney 以及 Stable Diffusion。
DALL-E 內置於 GPT-4,召喚方便。Midjourney 因為創業團隊只有 11 人而成了傳奇,畫風更加藝術。
Stable Diffusion 出名更多是因為產品本身,開源、自由、免費,背後的公司 Stability AI 反而名不見經傳。
最近,Stability AI 又陷入了麻煩:Stable Diffusion 開發者之一 Robin Rombach,從公司辭職。
Robin Rombach.
強調「又」是因為,一年來,這家公司的技術團隊動盪不斷,首席技術官換人,首席資訊官、工程副總裁、產品副總裁、研發副總裁、研究主管、大語言模型負責人等陸續離職。
2022 年 8 月,Stability 向公眾發布了 Stable Diffusion,日活很快達到 1000 萬。當年 10 月,Stability 完成約 1 億美元的融資,估值達到 10 億美元,加入「獨角獸」的行列。
不過 1 年多,Stability 怎麼就從神壇跌落?
離職原因並未對外公布,福布斯認為,人才外流無非一個原因:公司已經入不敷出了,又賺不到錢和融不到資。
閉源的 DALL-E 和 Midjourney 用訂閱模式賺錢很好理解,Stable Diffusion 作為開源項目,供所有人免費下載和使用,但一樣可以做大做強。
就像開源界的楷模紅帽公司,基於免費的開源作業系統 Linux,以訂閱模式向 B 端出售優質的企業級軟體服務,並於 2019 年被 IBM 以 340 億美元收購。
Stability 的盈利方式則主要分為兩種:文生圖 Web 應用 DreamStudio 的 API 訪問,以及面向企業的 AI 諮詢和模型服務。
2023 年 12 月,Stability 為商業用戶推出了每月 20 美元起的付費套餐。個人和研究需要的非商用,依然是免費的。
然而,身處生成式 AI 的寒武紀大爆發,如同參與大逃殺,個人能力、人脈資源和場外因素缺一不可。
Stability 不像 Meta、Google 根基深厚,也不像 OpenAI 有微軟投餵算力和資金,而是和亞馬遜的雲計算部門按行業規矩簽了合同,拿 4000 多個英偉達晶片訓練模型。
AI 模型訓練燒錢,業務鋪得不夠大,虎視眈眈的競爭對手又在搶奪市場份額。去年 10 月,Stability 從英特爾拿到 5000 萬美元補血,但再多的錢也經不起一直虧損。
彭博社報道,Stability 在 2023 年 10 月的訓練和工資支出約 800 萬美元,同年 8 月的軟體和服務收入卻只有 120 萬美元。
福布斯從另一個角度說明了 Stability 的困難,打工人應該更能共情。公司不僅涉嫌拖欠員工工資、欠商業夥伴的錢,甚至因為不按時給錢逼得亞馬遜威脅斷掉 GPU 權限,但 Stability 否認了此事。
AI 圖片的版權爭議,讓本不富裕的初創公司雪上加霜。圖庫 Getty Images 以及藝術家們主張,Stability 竊取了藝術品和圖庫照片來訓練其模型,訴訟仍在進行中。
巧合的是,Stability 和競爭對手 Midjourney 的關係,也在最近掉入了冰點。
3 月初,Midjourney 拉黑了 Stability 所有員工,因為調查到疑似 Stability 員工的兩個付費賬戶試圖竊取數據,導致伺服器長時間中斷。
Stability 的 CEO 在 X 回應,這只是一個員工的個人行為,再次證明,高端的商戰,往往採用最樸素的方式。
做實事的人,講故事的人
Stable Diffusion 和 Stability 之間的關係,並非像 ChatGPT 和 OpenAI 那樣純粹。
Stable Diffusion 源於一個學術項目,前身是 Latent Diffusion 模型,由慕尼黑的路德維希-馬克西米利安大學、紐約的 AI 公司 Runway 主導研究。
Runway 就是文生影片賽道的那個 Runway,原來命運的齒輪早已開始轉動,科技行業也是個熟人圈子。
圖片來自:arxiv
項目的研究論文發布 7 個月後,2022 年 6 月,Stability 以金主的身份加入,為其提供了計算資源,Stability 自己的生成式 AI 團隊也參與了研究。
這次辭職的 Robin Rombach,是慕尼黑研究團隊領導和論文一作,後來被 Stability 納入麾下。論文署名緊隨其後的兩位慕尼黑同僚,疑似也隨其離開。
Stability 今年 2 月發布了 Stable Diffusion 3,3 月發布了新的 3D 影片模型 SV3D,這些技術人員,頗有站好最後一波崗再捲鋪蓋走人的感覺。
SD3 在多主題提示詞、圖像質量和文字拼寫方面都進化了.
過去的一年,Stability 可謂勤勉,升級 Stable Diffusion,並開發新模型:文生圖模型 SDXL、大語言模型 StableLM、音頻生成模型 Stable Audio、影片生成模型 Stable Video,代碼生成模型 Stable Code、3D 對象生成模型 Stable Zero123......
但競爭對手們也沒閒著,比如被 GPT-4、Gemini、Claude 幾座大山壓著,StableLM 幾乎沒有什麼水花。Meta 也開源了 Llama 2,更是和 Stability 直接競爭。
如今,草創時期的多名核心人才出走,雖然不至於人去樓空,但軍心勢必會被動搖,類似的例子近在眼前。
最近,初創公司 Inflection AI 聯合創始人 Mustafa Suleyman 接了微軟的 Offer,領導微軟面向消費者的 AI 業務,他同時也是 Google 旗下 DeepMind 的聯合創始人。
Mustafa Suleyman.
Inflection 最主要的產品是聊天機器人 Pi。和同行比較,Pi 的情商尤其突出,更有同理心,更加關心你,喜歡加 emoji 疑似患了聊天討好症,和它聊天的時候,會不自覺放鬆下來。
一同加入微軟的,還有 Inflection 聯合創始人兼首席科學家 Karén Simonyan,以及部分 Inflection 工程師和研究人員。
OpenAI 宮斗期間,納德拉招攬 Sam Altman 和幾百名誓死追隨的員工,從而無痛收購 OpenAI 的計劃落空了。莞莞類卿,如今他的願望在 Inflection 身上代償。
這次微軟把 Inflection 高管團隊打包帶走,將其模型集成到微軟的雲計算業務 Azure,花的錢遠低於估值,雖然不是收購,本質接近收購,Inflection 和 Pi 名存實亡。
不難看出,當 AI 行業卷生卷死,人才仍然是關鍵。只要有人的地方就有恩怨,有恩怨就會有江湖,科技行業也不免俗,內鬥不止,商戰不休。
人才出走,這劇情 Google 再熟悉不過。同時,Stability 的高層管理風格也和多次翻車的 Google 一樣,受到了質疑。
Emad Mostaque.
Stability 首席執行官 Emad Mostaque 的上份職業是對沖基金經理,大部分時間在搞石油交易,雖然擁有電腦科學學位,但之前從未創辦或入職科技公司,還有說大話和搶功勞的毛病,自上而下影響著企業文化。
一些現任和前任員工爆料,Mostaque 經常言過其實。他在融資時將亞馬遜稱為「戰略合作夥伴」,其實兩者只是普通的甲乙方。他說 Stability 正在為數十家客戶構建定製 AI 模型,但被問到具體的名字時,只透露了一家印度控股公司和一個非洲國家。
更加過分的是,明明公司已經資金困難,Mostaque和他曾經擔任公關主管的妻子,與公司財務之間的關係還不清不楚。
2023 年 7 月,前 Google 研究員 David Ha 在擔任 Stability 研究主管 8 個月後辭職,他接受媒體採訪時說,儘管入局得早,推動了 AI 行業的發展,但 Stability 仍然需要找到自己的護城河保持競爭力,似乎話裡有話。
多位人才出走之後, Stability 自己的技術能力如何,確實是個等待解答的問題。
宣布融資的新聞稿里,Stability 不知有意還是無意,模糊了 Stable Diffusion 研究人員的存在,只說 Stable Diffusion 是一款功能強大、免費且開源的文本到圖像生成器,自己是這款產品背後的公司。
話留一半也是事實,但在論文留名的教授 Björn Ommer 對此很是不滿:「在科學研究中,如果你從某個地方拿走了一些東西,你應該歸功於某人、引用某人。」
目前擔任 Stability 首席研究員的,是從 Google Brain 跳槽的 Varun Jhampani,他能夠被留住多久,恐怕只有他自己知道。
販賣想像的階段結束,見血的洗牌期到來
Stable Diffusion 的免費開源對於 AI 社區意義非凡。
它的許可證十分寬鬆,只要求道德、合法地使用模型,允許商業和非商業用途,讓任何人可以自由地創作、開發產品甚至推出自己的項目。
比如 AI 生成圖片的角色穩定性問題,Midjourney 給出了 Character Reference 的方案,開源社區則為 Stable Diffusion 推出了附加組件 IP Adapter。
同時,開源模型也更容易成為 Deepfake 的武器,用來生成暴力和色情內容。更有甚者,一些基於 Stable Diffusion 的初創公司不標註許可證和技術來源,套個殼就以嶄新的面貌出道騙錢了。
開源的倡導者們往往認為,當人們無需付費訪問模型時,AI 的開發效果會更好,並且模型的訓練方式更加透明。
但開發模型的公司們未必這麼覺得,因為擔心「競爭和安全問題」,OpenAI 從 GPT-4 開始不再分享研究成果,取而代之的是技術報告。
從商業的角度,OpenAI 的決定可以理解。開源的兩面性,以及開源和閉源的衝突,也如同當下 AI 競爭的縮影。
2023 年,生成式 AI 的發展如烈火烹油、鮮花著錦,巨頭和初創競相發布模型和商業化的產品,但一派欣欣向榮的景象不僅孕育著成功,也包容著謊言、危害、渾水摸魚和誇大其詞。一時風光無限的陪跑者,小心翼翼地等待泡沫破裂的瞬間。
身為前基金經理的 Mostaque,其實對水溫的變化非常敏銳,很早就嗅到了 AI 行業競爭的加劇,曾經警告員工:「2023 年你們都會死去。」
市場已經有太多的選擇,一時的估值只是鏡花水月。如何自力更生站穩腳跟,是 AI 公司們接下來的課題。
Inflection 去年 6 月才融了 13 億美元,但接到微軟的橄欖枝,高管和骨幹說走就走,也是因為看不到未來。
接受彭博社採訪時,Mustafa Suleyman 談到,Pi 的每日用戶數量已達到 100 萬,然而還沒有找到有效的商業模式。
Pi 雖然態度友好、招人喜歡,但面向消費者的純聊天機器人撐不起那麼高的估值,不如轉頭去做企業定製服務和被巨頭委以重任。
雖然 Inflection 承諾,Pi 的服務「不會立即變化」,但也有人覺得,它的死亡不過早晚。同樣,開發模型的大佬出走,用戶們不免擔心,尚在邀請測試的 Stable Diffusion 3,還能不能開源。
回應 Robin Rombach 的離職消息時,Stability 發言人感謝他的付出,祝福他有美好的未來,同時強調了公司的發展重心:將技術商業化。
說到 AI 的商業化,家家有本難念的經。今年 2 月,亞馬遜雲計算服務 CEO Andy Jassy 在和分析師的電話會議里談到,生成式 AI 的收入「仍然相對較小」。
但他補充道,亞馬遜的幾乎所有消費者業務都已經或將擁有生成式 AI 產品,預計未來幾年帶來數百億美元的收入。
微軟不想被稱為「OpenAI 的 IT 部門」讓投資者不滿,所以一邊開發內部的 AI 項目,一邊琵琶別抱,到處挖人,向 OpenAI 的競爭對手 Mistral AI 投資。
這一方面,OpenAI 也很有發言權,2015 年剛成立時是非營利組織,以最有可能造福全人類的方式開發 AGI,2019 年轉變為有限利潤(limited profit)公司,拉微軟入伙投資,原因其實很簡單:AI 實在太燒錢了。
OpenAI 去年的年化收入超過 16 億美元,賺錢主要靠三板斧:會員訂閱、對開發者的 API 接口調用收費、與微軟產品的收入分成。
馬斯克多次批評 OpenAI 的「墮落」,稱其成了一家由微軟控制的閉源、追求利潤最大化的公司,Sam Altman 不痛不癢,表示想念以前的那個馬斯克。
2024 年是生成式 AI 的第二年,熱點從聊天機器人、文生圖轉變到文生影片、機器人具身智能。
參賽選手們的情緒也變得更加緊張,如果還沒有脫離融資的供血,還沒有找到商業化的落地場景,或許無需很久,就能看到很多所謂的明星公司倒閉。
AI 發展的初期,市場的樂觀情緒高漲,會容忍販賣夢想、粗糙的體驗和對未來的想像。
但人工智慧的價值必須在實踐中體現出來,遊說投資者的熱情應當轉化為消費者願意買單的產品,技術的詩歌還是要寫在網際網路的大地而非虛空。
福布斯 2024 年 10 大 AI 預言之一是:Stability 將會倒閉。它或許說對了,問題是,接下來還會有多少 Stability。