
Napkin AI 這家圖形設計公司正在垂直 AI 代理應用這一前沿領域開闢獨特的發展道路。
用戶只需在 Napkin AI 的網站上輸入文字,其模型就能在 5 秒內生成對應的圖形表示。
有趣的是,在底層實現上,Napkin 是通過將傳統設計工作室中不同的工作角色 —— 文案、設計師、插畫師、品牌風格師等,用獨立的 AI 代理而不是人類來複製這些離散功能。
自 8 月份推出以來,該產品獲得了令人印象深刻的用戶增長。據 Napkin 聯合創始人兼 CEO Pramod Sharma 透露,目前有 200 萬測試用戶,相比六周前增長了一倍。
"我們採取了稍微不同的角度,"他在接受 VentureBeat 採訪時表示。"我們並不是從'讓我們看看圖像模型能做什麼'開始。事實上,對我們來說這是後話。重點是創建圖形需要什麼,現在是如何完成的,然後再反向思考。"
Napkin AI 是垂直 AI 代理趨勢的一部分
Napkin 是眾多新興創業公司中的一員,這些公司都在用垂直 AI 代理而不是傳統 SaaS 模式來服務特定領域。Napkin 展示了這些基於代理的公司能有多高效。公司有 12 人的遠程團隊,只有 Sharma 一人住在舊金山灣區。這些公司也有望帶來巨大的顛覆性,因為它們對特定用例來說更具定製性和功能性。
Napkin AI 的獨特之處在於它專注於服務特定需求:幫助非圖形設計專家的專業人士創建精美設計,主要用於 PowerPoint 演示。這些用戶需要圖表和其他插圖,而不僅僅是生成式 AI 提供商製作的精美圖片 —— 他們希望能夠簡單輕鬆地編輯這些圖像。這正是 Napkin 所做的:在 5 秒內向用戶提供最佳效果後,讓用戶可以編輯樣式、顏色和設計類型。
Napkin AI 代表著第三種方式
Sharma 表示,Napkin 不像大多數其他圖像提供商那樣使用擴散 AI 模型,因為這些模型不允許用戶輕鬆編輯插圖的獨特元素,例如餅圖的切片或周圍文字。通過在 Napkin 產品底層使用服務於特定有用功能的代理,Napkin 的方法代表了"第三種方式"。
第一種方式是現有的圖形設計公司如 Adobe 或 Canva 採用的方式,即將 AI 工具附加到傳統設計工作流程中。Napkin 沒有這樣做。它是生成式 AI 優先的,使用技術基於用戶提示創建最佳的視覺初稿。然後簡化剩餘的編輯過程,考慮到大多數用戶沒有高級設計技能 —— 比如使用 Adobe Creative Cloud 所需的那種技能。
Napkin 也沒有採用"第二種方式",即新一代 AI 圖像和影片公司 —— 如 MidJourney、Stable Diffusion、Runway、Ideogram 等 —— 以 AI 優先為榮,使用大型擴散模型用高質量圖像或影片讓用戶眼花繚亂。它們之間的區別往往並不明顯。然而,Sharma 指出,Napkin 決心不為了技術而沉醉於技術,因為那樣做不是以用戶為先。
以下是 Napkin AI 的工作原理:它允許用戶粘貼文字描述 —— 無論是演示提示、博客摘錄還是頭腦風暴筆記 —— 並在幾秒鐘內收到多個高質量的圖形選項。這些圖形不僅僅是模板,而是可定製的設計,具有可編輯的字體、顏色和布局 —— 但它們易於使用,帶有滑動工具。該產品避免了像 Figma 或 Canva 等更複雜工具提供的包含數百個選項的龐大菜單欄。創建圖像後,Napkin 允許您以 PNG、PDF 或 SVG 格式導出。
Napkin AI 底層有四個子代理
更有趣的是代理在底層是如何工作的:Napkin 使用一個編排大語言模型 (LLM),主要由 OpenAI 的 GPT-4o mini 驅動,來響應用戶的提示。這個 LLM 作為一個代理,將任務委派給一系列具有特定職責的其他子代理。第一個"文本"代理建議可以在設計中使用的文本。第二個"布局"代理查看文本,並決定最適合該文本的特定設計布局。
第三個"圖標和插圖"代理檢查資料庫,看是否有匹配文本請求的圖標,如果沒有,它可能會即時生成圖標。最後是第四個"樣式"代理,讓用戶可以用自己的企業顏色和風格定製設計。正如 Sharma 解釋的那樣,Napkin 對這四個代理沒有太多限制,只是要最大化質量和速度。Sharma 表示,在 5 秒內響應是滿足客戶需求的關鍵。
每個代理都為整體構圖做出貢獻,確保生成的圖形不僅在美學上令人愉悅,而且符合用戶的意圖。
第四個樣式代理將在下周引入產品,並會隨時間推移進行改進,Sharma 解釋道。不久,用戶將能夠上傳其企業樣式的截圖或其他文檔,這樣圖像模型就可以自動生成該風格的圖像。Sharma 提到了 Meta 在大概念模型 (LCMs) 領域的研究可能會在這方面有所幫助。不過,目前 Napkin 的代理是一個渲染引擎,通過儀錶板為用戶提供各種樣式選項。
質量和專注作為差異化因素
Napkin 最引人注目的承諾之一是對質量的關注。對 Sharma 來說,目標不僅僅是快速生成視覺效果 —— 而是確保每個圖形都值得使用。"我們將您的書面內容轉化為真正捕捉您想法精髓的圖形,"Sharma 說。"我們意識到在圖形方面,好還不夠。它必須非常非常棒。否則就失去了意義。"
Sharma 與 Jerome Scholler 共同創立了 Napkin AI,此前他們都對演示文稿的質量感到不滿。在創立 Napkin 之前,Sharma 創建了以設計質量著稱的教育遊戲公司 Osmo。Scholler 是 Osmo 的創始團隊成員。Sharma 也是前谷歌員工。
這種對質量的執著延伸到技術基礎。與通常缺乏圖形語義理解的擴散模型不同,Napkin 的代理驅動平台允許它分離內容、布局和樣式等元素。這種解耦允許用戶動態修改內容而不失去設計的完整性。
發展和擴張
市場似乎認同 Napkin 的方法。該平台在過去六周內用戶數量翻了一番,並顯示出強勁的留存率,表明用戶喜歡其底層工作流程。使用幾周后,Sharma 說:"用戶都在說:'給我更多!''你們能擴展目錄嗎?可能性呢?插圖類型呢?'這對我們來說很好,因為我們現在非常專注。"
有趣的是,對於視覺傳達來說,某些設計效果很好,而其他設計則不然。例如,人腦可以輕鬆理解餅圖和條形圖,但可能更難理解其他設計。"我們在這個領域了解到的是,結構本身並不是無限的,"Sharma 說。"它們是人們通常使用的明確定義的結構或隱喻,但如何呈現它們?如何闡述那個隱喻?這就是創造力發揮作用的地方,我們實際上正在大力擴展這一點。"
該公司籌集了 1000 萬美元種子輪融資,並於 2024 年 8 月退出隱身狀態。但他們開始研究這個問題已經有三年了。"我可以告訴你這仍然是一個非常困難的問題,"Sharma 說。"人類非常擅長閱讀圖形,並判斷圖形是否好。他們可能不知道如何製作一個,但他們可以很快判斷一個。"
Napkin AI 的未來
隨著 Canva 和 Adobe 等大型企業關注生成式 AI 領域,Napkin AI 的明確差異化可能使其成為收購目標。無論是作為獨立的顛覆者還是更大生態系統的關鍵組成部分,Napkin AI 無疑是生成式 AI 圖形領域值得關注的公司。