當企業紛紛搶灘AI浪潮時,一道無形的鴻溝正在形成。這份由麻省理工學院NANDA項目團隊完成的研究報告,通過系統分析超過300個公開披露的AI項目,訪談52家企業代表,並在四場主要行業會議上收集153位高管的問卷反饋,揭示了一個令人震驚的現實:儘管企業在生成式AI上投入了300到400億美元,但高達95%的組織根本沒有看到任何投資回報。

這不是一個關於技術失敗的故事,而是一個關於選擇的故事。站在鴻溝兩岸的企業,境遇截然不同。一邊是5%成功跨越鴻溝的組織,他們的AI試點項目正在創造數百萬美元的實際價值;另一邊是絕大多數仍然困在原地的企業,他們的投資就像投進了黑洞,看不到任何對利潤表的影響。研究團隊將這種極端分化的現象命名為"GenAI鴻溝"。更引人深思的是,這道鴻溝的形成並非由AI模型的質量或政府監管造成,而是完全取決於企業採取的方法和策略。
那些看似相似的企業,為什麼會在AI應用上呈現如此巨大的差距?答案隱藏在日常的工作場景中。ChatGPT和Copilot這類通用工具的採用率超過了80%,近40%的企業報告已經部署了這些工具,然而這些工具主要提升的是個人生產力,而非企業整體的財務表現。與此同時,那些為企業量身定製或由供應商銷售的企業級AI系統,卻遭遇了冷落。雖然有60%的企業評估過此類工具,但只有20%進入了試點階段,最終只有5%達到了生產部署。大多數失敗的原因在於工作流程設計僵化、缺乏上下文學習能力,以及與日常運營脫節。
通過深入分析300個公開實施案例、訪談記錄和調查數據,研究團隊識別出了定義這道GenAI鴻溝的四個關鍵模式。第一個模式是顛覆程度有限,在研究涵蓋的八大主要行業中,只有兩個行業顯示出明顯的結構性變革。第二個模式是企業悖論,那些規模最大的企業雖然在試點項目數量上遙遙領先,並且投入了更多人力資源,但在將試點轉化為規模化應用方面卻表現最差。第三個模式是投資偏見,企業預算嚴重傾向於那些可見的、面向客戶的前台功能,而那些投資回報率最高的後台辦公功能卻被忽視。第四個模式是實施優勢,通過外部合作夥伴關係實施的AI項目,其成功率是內部自建項目的兩倍。
阻礙企業跨越鴻溝的核心障礙不是基礎設施、不是監管政策、也不是人才短缺,而是學習能力。當前大多數GenAI系統無法保留用戶反饋、無法適應具體業務場景、也無法隨著時間推移而改進。少數成功跨越鴻溝的供應商和買家,正是因為他們直接解決了這些根本性的局限。那些成功的企業買家會要求AI系統深度定製以適應具體業務流程,並且基於業務成果而非軟體性能基準來評估工具。他們期待系統能夠與現有流程集成並持續改進。而那些滿足這些期望的供應商,正在幾個月內就拿下數百萬美元的部署合同。
雖然大多數AI實施項目並未導致裁員,但那些已經跨越鴻溝的企業開始在客戶支持、軟體工程和行政管理等特定領域看到了有選擇性的勞動力影響。表現最好的企業報告說,通過減少業務流程外包(BPO)支出和外部代理機構的使用,特別是在後台運營中,實現了可觀的成本節約。還有一些企業通過自動化外聯和智能跟進系統,提高了客戶留存率和銷售轉化率。這些早期成果表明,當學習型AI系統針對特定流程部署時,即使不進行重大組織重組,也能夠帶來真實價值。
鴻溝錯誤的一側:高採用率,低轉型效果
站在GenAI鴻溝錯誤的一側,大多數企業正面臨著一個尷尬的現實:AI工具的採用率很高,但業務轉型的效果卻微乎其微。九個行業中有七個幾乎看不到任何結構性變化。企業們正在試點各種GenAI工具,但很少有能夠真正部署的。像ChatGPT這樣的通用工具被廣泛使用,但那些定製化的企業解決方案卻因為集成複雜度高、與現有工作流程不匹配而陷入停滯。
當我們審視行業層面的轉型模式時,GenAI鴻溝的表現最為明顯。儘管投資規模龐大、試點項目遍地開花,但只有極少數企業真正實現了從實驗到有意義的業務轉型的跨越。儘管GenAI獲得了高度關注,但行業層面的轉型仍然有限。GenAI已經嵌入到客戶支持、內容創作和分析等應用場景中,但很少有行業表現出與過去通用技術相關的深層結構性轉變,比如新的市場領導者出現、商業模式被顛覆,或者客戶行為發生可衡量的變化。
為了更好地量化顛覆狀態,研究團隊開發了一個綜合性的"AI市場顛覆指數"。每個行業根據五個可觀察指標從0到5打分,這些分數代表了五個維度的標準化平均值,通過公開指標和訪談得出的評估進行三角驗證。研究團隊測試了不同的權重方案以確認行業排名的一致性。這五個指標包括:2022年到2025年間頂級在位者的市場份額波動性,2020年後成立的AI原生公司的收入增長,新的AI驅動商業模式的出現,可歸因於GenAI的用戶行為變化,以及歸因於AI工具的高管組織變革頻率。
研究結果顯示,技術行業的顛覆指數最高,達到3分,主要信號是新挑戰者正在崛起(例如Cursor
對比Copilot)以及工作流程的轉變。媒體和電信行業緊隨其後,得分2分,特徵是AI原生內容的興起、廣告動態的轉變,但在位者仍在增長。專業服務行業得分1.5分,雖然有效率提升,但客戶交付方式基本保持不變。醫療保健和製藥、消費品和零售、金融服務、先進制造業這幾個行業的得分都是0.5分,分別表現為文檔和轉錄試點但臨床模式未變、支持自動化但對忠誠度和領導者影響有限、後台自動化但客戶關係穩定、維護試點但供應鏈沒有重大轉變。能源和材料行業得分為0,幾乎零採用、實驗極少。

研究團隊對權重方案進行了敏感性分析,無論如何調整五個顛覆指標的權重,技術和媒體電信行業始終保持在最高排名,而醫療保健和能源始終保持較低。專業服務行業對權重變化最為敏感,根據對效率提升與結構性變化的重視程度不同,得分在1.2到2.1之間波動。九個主要行業中有七個顯示出了顯著的試點活動但幾乎沒有或完全沒有結構性變化。投資與顛覆之間的這種差距直接展示了大規模的GenAI鴻溝現象,即廣泛的實驗卻沒有帶來轉型。
受訪者對這一現狀的評價非常直白。一位中型製造業企業的首席運營官總結了普遍的情緒:"LinkedIn上的宣傳說一切都變了,但在我們的運營中,沒有什麼根本性的東西發生了變化。我們處理合同的速度快了一些,但這就是全部的改變。"
從試點到生產部署之間存在著一道陡峭的鴻溝,這在部署率上表現得最為明顯:只有5%的定製企業AI工具達到了生產階段。聊天機器人之所以成功,是因為它們易於嘗試且靈活,但在關鍵工作流程中卻因為缺乏記憶和定製化而失敗。這一根本性差距解釋了為什麼大多數企業仍然停留在鴻溝的錯誤一側。
研究揭示了GenAI採用工具的調查與試點和實際實施之間存在急劇下降,通用解決方案和定製解決方案之間存在顯著差異。通用大型語言模型(如ChatGPT和Copilot)的調查率為80%,試點率為50%,成功實施率為40%。而嵌入式或任務特定的GenAI工具的調查率為60%,試點率僅為20%,成功實施率只有5%。需要注意的是,這些數字基於個人訪談的方向性準確度,而非公司官方報告。樣本量因類別而異,成功定義在不同組織間可能有所不同。研究團隊將任務特定GenAI工具的"成功實施"定義為用戶或高管認為造成了顯著且持續的生產力或利潤表影響的工具。

企業AI解決方案95%的失敗率代表了GenAI鴻溝最清晰的體現。困在錯誤一側的企業繼續投資於無法適應其工作流程的靜態工具,而那些跨越鴻溝的企業則專注於具備學習能力的系統。通用的大型語言模型聊天機器人看似顯示出很高的試點到實施轉化率(約83%),然而這掩蓋了感知價值的更深層次分裂,也揭示了為什麼大多數企業仍然困在GenAI鴻溝的錯誤一側。
在訪談中,企業用戶對像ChatGPT和Copilot這樣的消費級工具給予了持續的正面評價。這些系統因其靈活性、熟悉度和即時效用而受到讚揚。然而,同樣的用戶對定製或供應商推銷的AI工具卻表現出壓倒性的懷疑態度,將它們描述為脆弱、過度工程化或與實際工作流程不匹配。正如一位首席資訊官所說:"今年我們看過幾十個演示,也許有一兩個真正有用。其餘的要麼是包裝產品,要麼是科學項目。"
雖然熱情和預算往往足以啟動試點項目,但將這些試點轉化為集成到工作流程中並具有持續價值的系統仍然很少見,這一模式定義了處於GenAI鴻溝錯誤一側的企業的體驗。企業,這裡定義為年收入超過1億美元的公司,在試點數量和分配給AI相關計劃的員工數量上領先。然而這種強度並未轉化為成功,這些企業報告的試點到規模化轉化率最低。相比之下,中型市場公司行動更快、更果斷。表現最好的企業報告從試點到全面實施的平均時間線為90天,而企業則需要九個月或更長時間。
關於企業GenAI的五個誤區也值得澄清。第一個誤區是AI將在未來幾年內取代大多數工作,但研究發現GenAI導致的裁員有限,而且只發生在已經受到AI顯著影響的行業。高管們對未來3到5年的招聘水平沒有達成共識。第二個誤區是生成式AI正在改變業務,但研究顯示採用率雖高,轉型卻很少見。只有5%的企業將AI工具大規模集成到工作流程中,九個行業中有七個沒有顯示出真正的結構性變化。第三個誤區是企業在採用新技術方面很慢,但實際上企業對採用AI非常渴望,90%的企業認真探索過購買AI解決方案。第四個誤區是阻礙AI發展的最大因素是模型質量、法律、數據或風險問題,但實際上真正阻礙的是大多數AI工具不學習、不能很好地集成到工作流程中。第五個誤區是最好的企業正在構建自己的工具,但實際上內部構建的失敗率是外部購買的兩倍。

在令人失望的企業部署數字背後,隱藏著一個令人驚訝的現實:AI已經在改變工作方式,只是不是通過官方渠道。研究發現了一個蓬勃發展的"影子AI經濟",員工使用個人ChatGPT賬戶、Claude訂閱和其他消費者工具來自動化他們工作的重要部分,往往沒有IT部門的知識或批准。規模相當可觀,雖然只有40%的公司表示購買了官方的大型語言模型訂閱,但超過90%受訪公司的員工報告定期使用個人AI工具完成工作任務。事實上,幾乎每個人都以某種形式在工作中使用大型語言模型。
在許多情況下,影子AI用戶報告說,他們通過個人工具每天多次使用大型語言模型完成每周工作量的很大一部分,而他們公司的官方AI計劃仍然停留在試點階段。這個影子經濟表明,當個人能夠使用靈活、響應迅速的工具時,他們可以成功跨越GenAI鴻溝。認識到這一模式並在此基礎上建立的企業,代表了企業AI採用的未來。具有前瞻性的企業開始通過學習影子使用情況、分析哪些個人工具提供價值,然後再採購企業替代方案來彌合這一差距。
投資配置模式也揭示了GenAI鴻溝的作用機制。50%的GenAI預算流向了銷售和市場營銷,但後台辦公自動化往往產生更好的投資回報率。這種偏見反映了更容易的指標歸因,而不是實際價值,並使企業專注於錯誤的優先事項。就功能重點而言,GenAI工具的投資高度集中。由於GenAI支出尚未在各個企業中正式量化,研究團隊要求高管將假設的100美元分配給不同職能。銷售和營銷職能在受訪企業中占據了約70%的AI預算分配。

需要注意的是,雖然GenAI投資的總體職能分配(例如約50%用於銷售和營銷)在高管訪談中相對一致,但子類別和用例細分應被視為方向性的。子類別反映了綜合筆記和軼事模式,而非精確的會計核算。公司類型驅動了顯著的差異。例如,製造商和醫療保健提供商通常將極少的投資用於銷售和營銷,而在運營方面過度投資。科技和媒體公司通常優先考慮營銷、內容和開發人員生產力。專業服務傾向於文檔自動化和法律合規工具。
銷售和營銷之所以占主導地位,不僅因為可見性,還因為結果可以輕鬆衡量。諸如演示量或電子郵件響應時間等指標直接與董事會級別的關鍵績效指標保持一致。相比之下,法律、採購和財務職能提供的效率提升更為微妙,包括更少的合規違規、簡化的工作流程或加速的月末流程,這些都很重要但很難在高管對話或投資者更新中體現。一位財富1000強制藥公司的採購副總裁清楚地表達了這一挑戰:"如果我購買一個工具來幫助我的團隊更快地工作,我如何量化這種影響?當它不會直接推動收入或降低可衡量的成本時,我如何向我的首席執行官證明這一點?我可以說它幫助我們的科學家更快地獲得工具,但這與底線影響相距甚遠。"
這種投資偏見通過將資源導向可見但往往轉型較少的用例,延續了GenAI鴻溝,而後台職能中投資回報率最高的機會卻資金不足。除了衡量挑戰之外,信任和社會認同在購買決策中仍然具有決定性作用。一家主要消費品公司的採購主管抓住了許多買家面臨的困境:"我每天都會收到無數電子郵件,聲稱提供最佳的GenAI解決方案。有些演示令人印象深刻,但建立信任才是真正的挑戰。有這麼多選擇湧入我們的收件箱,我們嚴重依賴同行推薦和我們網路的推薦。"
這突出了一個更廣泛的模式:僅憑產品質量很少足夠。推薦、先前的關係和風險投資介紹仍然是企業採用的更強預測因素,而不是功能或功能集。
試點為何停滯:鴻溝背後的學習差距
讓企業停留在GenAI鴻溝錯誤一側的主要因素是學習差距,即那些不學習、集成不良或不匹配工作流程的工具。用戶喜歡ChatGPT用於簡單任務,但由於其缺乏記憶而在關鍵任務工作中放棄它。缺失的是能夠適應、記住和進化的系統,這些能力定義了鴻溝兩側之間的差異。
為了理解為什麼如此少的GenAI試點項目能夠超越實驗階段,研究團隊調查了52個企業的執行贊助商和一線用戶。參與者被要求對常見的規模化障礙按1到10的頻率進行評分,其中10代表最常遇到的障礙。結果揭示了一個可預測的領導者:抵制採用新工具。然而,第二高的障礙被證明比預期的更為重要。

用戶被要求對每個問題按1到10的分數進行評分,結果顯示不願意採用新工具得分最高,其次是模型輸出質量擔憂,然後是糟糕的用戶體驗、缺乏執行贊助和具有挑戰性的變更管理。需要注意的是,這些分數反映的是報告頻率而非障礙影響的客觀測量,並且可能因行業和企業規模而有顯著差異。
模型質量擔憂的突出地位最初看起來違反直覺。ChatGPT和類似工具的消費者採用激增,超過40%的知識工作者個人使用AI工具。然而,那些將這些工具集成到個人工作流程的同一用戶,在企業系統中遇到它們時卻將其描述為不可靠。這個悖論說明了用戶層面的GenAI鴻溝。
這種偏好揭示了一個根本性的緊張關係。每天使用ChatGPT完成個人任務的專業人士,對企業工作要求學習和記憶能力。大量工作人員已經私下使用AI工具,報告生產力提升,而他們公司的正式AI計劃卻陷入停滯。這種影子使用創造了一個反饋循環:員工知道好的AI應該是什麼樣子,這使得他們對靜態的企業工具更加不容忍。
研究團隊的後續訪談揭示了一個引人注目的矛盾。那些對企業AI工具表示懷疑的專業人士往往是消費者大型語言模型界面的重度用戶。當被要求比較他們的體驗時,出現了三個一致的主題。在比較通用大型語言模型界面與集成工具時,用戶偏好驅動因素顯示,約80%的人認為"答案更好",約70%的人表示"已經熟悉界面",約60%的人說"更信任它"。

一家中型律所的公司律師體現了這種動態。她的企業投資了5萬美元購買專業合同分析工具,但她一直默認使用ChatGPT進行起草工作:"我們購買的AI工具提供了有限定製選項的僵化摘要。使用ChatGPT,我可以引導對話并疊代,直到得到我需要的確切內容。根本的質量差異是顯而易見的。ChatGPT始終產生更好的輸出,儘管我們的供應商聲稱使用相同的底層技術。"
這種模式表明,每月20美元的通用工具通常在即時可用性和用戶滿意度方面優於成本高出數個數量級的定製企業系統。這個悖論體現了為什麼大多數企業仍然停留在GenAI鴻溝的錯誤一側。
鑑於用戶對消費者大型語言模型界面的偏好,研究團隊調查了是什麼阻止了更廣泛地將其用於關鍵任務工作。這裡的障礙被證明與一般可用性問題不同,並直接揭示了定義GenAI鴻溝的學習差距。關鍵工作流程集成的障礙調查顯示,約60%的用戶表示"它不從我們的反饋中學習",約55%說"每次需要太多手動上下文",約50%認為"無法將其定製到我們的特定工作流程",約45%表示"在邊緣情況下崩潰且不適應"。

那位支持ChatGPT進行初稿的同一位律師,在敏感合同方面劃清了界限:"它非常適合頭腦風暴和初稿,但它不保留客戶偏好的知識或從以前的編輯中學習。它重複同樣的錯誤,每次會話都需要大量的上下文輸入。對於高風險的工作,我需要一個能夠積累知識並隨時間改進的系統。"
這種反饋指向了讓企業停留在GenAI鴻溝錯誤一側的根本學習差距。用戶欣賞消費者大型語言模型界面的靈活性和響應性,但需要當前工具無法提供的持久性和上下文意識。
當研究團隊要求企業用戶對高風險工作的不同選項進行評級時,偏好層次變得清晰。在"你會將這個任務分配給AI還是初級同事"的問題中,對於快速任務(電子郵件、摘要、基本分析),70%的人更喜歡AI,30%更喜歡人類。對於複雜項目(多周工作、客戶管理),只有10%更喜歡AI,90%更喜歡人類。

結果揭示,AI已經贏得了簡單工作的戰爭,70%的人更喜歡AI起草電子郵件,65%用於基本分析。但對於任何複雜或長期的工作,人類以9比1的比例占主導地位。分界線不是智力,而是記憶、適應性和學習能力,這正是區分GenAI鴻溝兩側的特徵。
代理AI(Agentic AI),這類通過設計嵌入持久記憶和疊代學習的系統,直接解決了定義GenAI鴻溝的學習差距。與每次都需要完整上下文的當前系統不同,代理系統維護持久記憶、從交互中學習,並可以自主編排複雜的工作流程。早期的企業實驗展示了端到端處理完整查詢的客戶服務代理、監控和批准常規交易的財務處理代理,以及跨渠道跟蹤參與度的銷售管道代理,這些都展示了自主性和記憶如何解決企業識別的核心差距。
跨越鴻溝:最佳建設者如何成功
站在GenAI鴻溝正確一側的企業有一個共同的方法:他們構建能夠從反饋中學習的自適應嵌入式系統。那些成功跨越鴻溝的頂級初創公司專注於狹窄但高價值的用例,深度集成到工作流程中,並通過持續學習而非廣泛的功能集來擴展。領域流暢度和工作流程集成比華麗的用戶體驗更重要。
在訪談中,研究團隊觀察到GenAI初創公司之間日益分化。一些公司正在與過時的SaaS劇本作鬥爭,仍然困在鴻溝的錯誤一側,而另一些公司則通過積極的定製和與實際業務痛點的對齊來吸引企業的注意。對GenAI工具的胃口仍然很高。幾家初創公司報告在幾天內簽署了試點項目,並在此後不久達到了七位數的收入運行率。表現突出的不是那些構建通用工具的公司,而是那些將自己嵌入工作流程內部、適應上下文並從狹窄但高價值的立足點擴展的公司。
研究數據揭示了一個明確的模式:成功的企業和供應商是那些積極解決學習、記憶和工作流程適應問題的企業,而失敗的企業要麼在構建通用工具,要麼試圖在內部開發能力。成功的初創公司構建從反饋中學習的系統(66%的高管希望這樣)、保留上下文(63%要求這樣)並深度定製到特定工作流程。他們從工作流程邊緣開始,進行大量定製,然後擴展到核心流程。
最成功的供應商理解,跨越GenAI鴻溝需要構建高管反覆強調的系統:不僅生成內容,而且在其環境中學習和改進的AI系統。在評估AI工具時,買家一致強調一組特定的優先事項。研究團隊在訪談中對這些主題進行了編碼,以量化它們在採購決策中出現的頻率。
高管選擇GenAI供應商的方式顯示,約90%的人認為"我們信任的供應商"最重要,約80%看重"深入理解我們的工作流程",約70%要求"對當前工具的最小干擾",約60%需要"清晰的數據邊界",約55%期待"隨時間改進的能力",約45%希望"事情變化時的靈活性"。
關於高管選擇GenAI供應商的直接引用也很有啟發性。關於"我們信任的供應商",有高管表示:"我們更有可能等待現有合作夥伴添加AI功能,而不是在初創公司上賭博。"關於"深入理解我們的工作流程",有人說:"大多數供應商不了解我們的審批流程或數據流是如何工作的。"關於"對當前工具的最小干擾",評論是:"如果它不能插入Salesforce或我們的內部系統,就沒有人會使用它。"關於"清晰的數據邊界",一位高管擔心:"我不能冒客戶數據與其他人的模型混合的風險,即使供應商說沒問題。"關於"隨時間改進的能力",反饋是:"第一周很有用,但隨後它只是重複同樣的錯誤。我為什麼要使用那個?"關於"事情變化時的靈活性",有人指出:"我們的流程每季度都在演變。如果AI不能適應,我們就回到電子表格。"
對勞動力影響的擔憂遠低於預期。大多數用戶歡迎自動化,特別是對於繁瑣的手動任務,只要數據保持安全且結果可衡量。儘管傳統觀點認為企業抵制訓練AI系統,但研究中的大多數團隊表示願意這樣做,前提是好處明確且有護欄。儘管對AI感興趣,但對新興供應商存在明顯的懷疑態度,特別是在高信任或受監管的工作流程中。許多採購負責人告訴研究團隊,他們忽略了大多數初創公司的推銷,無論創新如何。一家全球消費品公司的採購主管說:"我們每天都會收到數十個關於AI驅動採購工具的推銷。然而,我們已建立的BPO合作夥伴已經了解我們的政策和流程。我們更有可能等待他們的AI增強版本,而不是切換到未知的供應商。"
最成功的初創公司通過執行兩種策略來同時解決對學習系統的渴望和對新工具的懷疑。第一種策略是為特定工作流程定製。嵌入到非關鍵或相鄰流程中並進行大量定製,展示明確價值,然後擴展到核心工作流程至關重要。成功的工具有兩個共同特徵:低配置負擔和即時、可見的價值。相比之下,需要廣泛企業定製的工具往往在試點階段停滯。
從研究樣本來看,成功的類別包括:用於通話摘要和路由的語音AI,用於合同和表單的文檔自動化,以及用於重複性工程任務的代碼生成。掙扎的類別往往是那些涉及複雜內部邏輯、不透明決策支持或基於專有啟發式優化的類別。這些工具經常因深度企業特異性而遇到採用摩擦。
一些初創公司通過主導小而關鍵的工作流程(特別是在銷售和營銷方面)然後擴展而表現出色。頂級四分位數的GenAI初創公司在啟動後6到12個月內達到120萬美元的年化收入。根據範圍的狹窄程度和執行的複雜性,可以將項目分類。狹窄範圍且執行簡單的項目能夠快速獲勝(如支出分類、合同審查),狹窄範圍但執行複雜的項目處於早期試點階段(如談判機器人),廣泛範圍且執行簡單的項目只能實現部分試點(如供應商風險監控),而廣泛範圍且執行複雜的項目則會失敗(如全面採購編排)。
第二種策略是利用推薦網路。為了克服信任障礙,成功的初創公司通常使用與系統集成商的渠道合作夥伴關係、來自董事會成員或顧問的採購推薦,以及通過熟悉的企業市場進行分銷。研究顯示,領導者發現GenAI解決方案的方式中,供應商關係占主導地位,現有供應商合作夥伴關係占20%,新集成或合作夥伴推薦占15%。同行網路方面,非正式同行推薦占13%,董事會成員或顧問推薦占10%。活動和媒體方面,會議演示或小組討論占9%,行業出版物或網路研討會占6%。還有冷門入站和其他內部流程的渠道。
跨越GenAI鴻溝的窗口正在迅速關閉。企業越來越多地要求隨時間適應的系統。微軟365 Copilot和Dynamics 365正在整合持久記憶和反饋循環。OpenAI的ChatGPT記憶測試版預示著通用工具的類似期望。通過構建從反饋、使用和結果中學習的自適應代理,初創公司可以通過數據和集成深度建立持久的產品護城河,從而快速彌補這一差距。做到這一點的窗口很窄。在許多垂直領域,試點已經在進行中。
支持這一轉型的基礎設施正在通過模型上下文協議(MCP
)、代理到代理(A2A
)和NANDA等框架出現,這些框架實現了代理互操作性和協調。這些協議通過允許專業代理協同工作而非要求單體系統,創造了市場競爭和成本效率。這些框架構成了新興代理網路(Agentic Web)的基礎,這是一個可互操作代理和協議的網狀結構,用動態協調層取代單體應用程序。
在接下來的幾個季度中,幾家企業將鎖定幾乎不可能解除的供應商關係。這18個月的時間範圍反映了研究團隊採訪的17位採購和IT採購負責人的共識,並得到公開採購披露分析的支持,顯示企業從RFP到實施的周期從兩個月到18個月不等。投資於從其數據、工作流程和反饋中學習的AI系統的企業,正在創造每月複利的轉換成本。一家50億美元金融服務公司的首席資訊官說:"我們目前正在評估五種不同的GenAI解決方案,但無論哪個系統最能學習和適應我們的特定流程,最終都會贏得我們的業務。一旦我們投入時間訓練系統理解我們的工作流程,轉換成本就變得令人望而卻步。"
跨越鴻溝:最佳買家如何成功
成功跨越GenAI鴻溝的企業對AI採購的態度不同,他們像BPO客戶而非SaaS客戶那樣行事。他們要求深度定製、從一線推動採用,並讓供應商對業務指標負責。最成功的買家明白,跨越鴻溝需要合作夥伴關係,而不僅僅是購買。
在訪談中,一個洞察非常清晰:最有效的AI購買企業不再等待完美的用例或中央批准。相反,他們通過分布式實驗、供應商合作夥伴關係和明確的問責制來推動採用。這些買家不僅更渴望,他們在戰略上更具適應性。
在研究樣本中,具有學習能力和定製化的外部合作夥伴關係約67%的時間達到部署,而內部構建的工具約為33%。雖然這些數字反映了自我報告的結果,可能無法解釋所有混雜變量,但差異的幅度在受訪者中是一致的。這一差距解釋了為什麼ChatGPT在臨時任務中占主導地位但在關鍵工作流程中失敗,以及為什麼通用企業工具輸給消費者大型語言模型和深度定製的替代方案。
跨越GenAI鴻溝的正確組織結構至關重要。戰略合作夥伴關係成功的可能性是內部構建的兩倍。成功不太依賴資源,而更多地依賴於在保留問責制的同時分散權力。跨越GenAI鴻溝的主要障礙不是集成或預算,而是組織設計。研究數據顯示,當企業分散實施權力但保留問責制時,他們就會成功。
研究團隊觀察到GenAI實施的三種主要團隊結構,這些結構在成果上存在實質性差異,反映了企業落在鴻溝的哪一側。戰略合作夥伴關係(購買)占成功部署的66%,採購外部工具,與供應商共同開發。內部開發(構建)占33%,完全內部構建和維護GenAI工具。混合模式(構建-購買)數據不足無法量化,由內部團隊與外部供應商共同開發。
研究限制說明:這些百分比反映了52個企業的訪談樣本,可能不代表更廣泛的市場模式。成功定義在不同企業間有所不同,觀察期可能無法捕捉長期實施趨勢。重要限制是,這些成功率差異可能反映了組織能力而非僅僅實施方法。選擇外部合作夥伴關係的企業可能在風險承受能力、採購成熟度或內部技術能力方面與那些內部構建的企業不同。外部合作夥伴關係與成功之間的相關性不一定證明因果關係。
戰略合作夥伴關係在成功部署中占據了顯著更高的份額,而不是內部開發工作。雖然研究團隊在樣本中觀察到的構建計劃遠多於購買計劃,許多企業正在探索內部開發,但成功率偏向外部合作夥伴關係。儘管缺乏關於總計劃量的精確數據,但這一模式表明,儘管內部開發工作更常被嘗試,但其成功率要低得多。
雖然企業經常結合方法,但通過戰略合作夥伴關係構建的試點項目達到全面部署的可能性是內部構建的兩倍。更引人注目的是,外部構建工具的員工使用率幾乎是內部構建工具的兩倍。這些合作夥伴關係通常提供更快的價值實現時間、更低的總成本和與運營工作流程更好的一致性。企業避免了從頭構建的開銷,同時仍然實現了定製解決方案。理解這一模式的企業能夠更有效地跨越GenAI鴻溝。
在訪談中,成功跨越GenAI鴻溝的企業中出現了一致的模式:頂級買家對待AI初創公司不像軟體供應商,而更像業務服務提供商,用接近用於諮詢公司或BPO的基準來衡量他們。這些企業要求與內部流程和數據深度定製,根據運營結果而非模型基準對工具進行基準測試,通過早期失敗進行合作,將部署視為共同演進,以及從一線經理而非中央實驗室採購AI計劃。
在最後一種模式中,個人貢獻者和團隊經理經常發揮關鍵作用。許多最強大的企業部署始於高級用戶,這些員工已經為個人生產力嘗試了ChatGPT或Claude等工具。這些"專業消費者"直覺地理解GenAI的能力和限制,並成為內部認可解決方案的早期擁護者。成功的企業不依賴中央化的AI職能來識別用例,而是允許預算持有者和領域經理提出問題、審查工具並領導推出。這種自下而上的採購與執行問責制相結合,在保持運營適應性的同時加速了採用。
儘管50%的AI預算流向銷售和營銷(根據高管的理論估計),但研究團隊記錄的一些最顯著的成本節約來自後台辦公自動化。雖然前台收益可見且對董事會友好,但後台部署通常提供更快的投資回報期和更清晰的成本削減。最佳企業在兩個領域都產生了可衡量的價值。
前台勝利包括:潛在客戶資格認定速度提高40%,通過AI驅動的跟進和消息傳遞,客戶留存率提高10%。後台勝利包括:每年在客戶服務和文檔處理方面消除200萬到1000萬美元的BPO成本,外部創意和內容成本減少30%的代理支出,金融服務的風險檢查每年節省100萬美元的外包風險管理費用。
值得注意的是,這些收益是在沒有實質性勞動力削減的情況下實現的。工具加速了工作,但沒有改變團隊結構或預算。相反,投資回報率來自減少的外部支出、消除BPO合同、削減代理費用以及用AI驅動的內部能力替代昂貴的顧問。這種模式表明,雖然銷售和營銷獲得了大部分關注和投資,但對於願意超越明顯用例真正跨越GenAI鴻溝的企業來說,後台辦公自動化可能提供更顯著和可持續的回報。
關於工作影響的現實情況是,GenAI已經開始產生勞動力影響,表現為選擇性替代以前外包的功能和受限的招聘模式,但不是通過大規模裁員。已經跨越GenAI鴻溝的企業展示了可衡量的外部成本削減,同時內部人員略有減少。
研究分析揭示,GenAI驅動的勞動力削減集中在歷史上被視為非核心業務活動的職能:客戶支持運營、行政處理和標準化開發任務。這些角色在AI實施之前就顯示出脆弱性,因為它們的外包狀態和流程標準化。高管們對透露由於AI導致的裁員規模持謹慎態度,但在這些企業中,客戶支持運營和行政處理工作的裁員在5%到20%之間。
行業特定的招聘期望顯示出與GenAI影響模式的明確相關性。在顯示AI造成的結構性顛覆最小的行業(醫療保健、能源、先進制造業)中,大多數高管報告在未來五年內沒有當前或預期的招聘削減。少數高管提到他們可以預期招聘減少,但承認他們目前沒有系統來準確預測何時或在哪裡可能發生。例如,醫療保健高管不期望減少醫生或臨床員工的招聘。
相反,在GenAI已經展示出可衡量影響的技術和媒體行業,超過80%的高管預計在24個月內招聘量將減少。關鍵發現:這種動態仍然集中在先進的AI採用者中,並且僅在目前正在經歷GenAI顯著顛覆的行業(技術、媒體)中。
GenAI採用為企業創造了不同的招聘策略。雖然高管對入門級或一般招聘量沒有達成共識,但他們一致強調AI素養是基本能力要求。這反映了企業認識到AI熟練度代表了工作流程優化的競爭優勢。一家中型製造業企業的運營副總裁說:"我們的招聘策略優先考慮展示AI工具熟練度的候選人。應屆畢業生在這方面的能力往往超過經驗豐富的專業人士。"
MIT的"冰山項目"分析為潛在的自動化暴露提供了定量背景:當前自動化潛力為美國勞動價值的2.27%,潛在自動化暴露為2.3萬億美元的勞動價值,影響3900萬個職位。隨著AI系統發展出持久記憶、持續學習和自主工具集成,這些定義跨越GenAI鴻溝的能力,這種潛在暴露將變得可行。
勞動力轉型將逐漸發生,而不是通過離散的替代事件。在AI系統實現上下文適應和自主操作之前,企業影響將通過外部成本優化而非內部重組來體現。
超越個體AI代理的下一個演進是代理網路,在這個網路中,自主系統可以在整個網際網路基礎設施中發現、協商和協調,從根本上改變業務流程的運作方式。這一轉型的基礎設施已經通過模型上下文協議(MCP)、代理到代理(A2A)和NANDA等協議出現,這些協議不僅實現代理互操作性,還實現自主網路導航。在代理網路中,系統將自主發現最優供應商並在沒有人工研究的情況下評估解決方案,在沒有預構建連接器的情況下實時建立動態API集成,通過區塊鏈支持的智能合約執行無信任交易,並開發跨多個平台和組織邊界自我優化的新興工作流程。
早期實驗顯示,採購代理獨立識別新供應商並談判條款,客戶服務系統無縫跨平台協調,以及跨多個提供商的內容創作工作流程與自動化質量保證和支付。這代表了從今天的人工中介業務流程到在整個網際網路生態系統中運營的自主系統的根本轉變,遠遠超越了當前的GenAI鴻溝,重塑企業在網路化經濟中發現、集成和交易的方式。
結論:彌合GenAI鴻溝
成功跨越GenAI鴻溝的企業在三個方面做得不同:他們購買而不是構建,授權一線經理而不是中央實驗室,並選擇深度集成同時隨時間適應的工具。最具前瞻性的企業已經在試驗能夠在定義的參數內學習、記憶和自主行動的代理系統。
這一轉型不僅標誌著工具的轉變,還標誌著代理網路的出現:一個持久的、互聯的學習系統層,可以跨供應商、領域和界面進行協作。在當今的企業技術堆棧由孤立的SaaS工具和靜態工作流程定義的情況下,代理網路用能夠協商任務、共享上下文和協調行動的動態代理取代了這些。
正如最初的Web分散了出版和商業一樣,代理網路分散了行動,從提示轉向自主的協議驅動協調。像NANDA、MCP和A2A這樣的系統代表了這個網路的早期基礎設施,使企業能夠不是從代碼而是從代理能力和交互來組合工作流程。隨著企業在2026年開始通過反饋循環鎖定供應商關係,跨越GenAI鴻溝的窗口正在迅速縮小。下一波採用將不是由最華麗的模型贏得,而是由那些能夠學習和記憶的系統,或由那些為特定流程定製構建的系統贏得。
從構建到購買的轉變,結合專業消費者採用的興起和代理能力的出現,為能夠提供學習型、深度集成的AI系統的供應商創造了前所未有的機會。那些認識到這些模式並據此行動的企業和供應商,將在後試點AI經濟中建立主導地位,站在GenAI鴻溝的正確一側。
對於目前困在錯誤一側的企業來說,前進的道路很明確:停止投資需要不斷提示的靜態工具,開始與提供定製系統的供應商合作,並專注於工作流程集成而非華麗的演示。GenAI鴻溝不是永久的,但跨越它需要在技術、合作夥伴關係和組織設計方面做出根本不同的選擇。
Q1:什麼是GenAI鴻溝?
A:GenAI鴻溝是指企業在生成式AI應用上的極端分化現象。雖然95%的企業在AI上投入了大量資金卻沒有看到任何回報,但5%的企業已經通過AI項目創造了數百萬美元的價值。這道鴻溝不是由技術質量或監管造成的,而是由企業採取的方法決定的。成功跨越鴻溝的企業專注於構建能夠學習、記憶和適應的AI系統,而大多數企業仍在使用無法改進的靜態工具。
Q2:為什麼企業AI項目的失敗率這麼高?
A:企業AI項目95%的失敗率主要源於學習差距。大多數GenAI系統無法保留用戶反饋、無法適應具體業務場景、也無法隨時間改進。雖然像ChatGPT這樣的通用工具因其靈活性而受到員工歡迎,但企業級定製工具往往因為工作流程設計僵化、缺乏上下文學習能力而在試點階段就停滯了。此外,企業更傾向於投資可見的前台功能而非高回報率的後台自動化,這種投資偏見也導致了資源錯配。
Q3:企業如何才能成功跨越GenAI鴻溝?
A:成功跨越鴻溝的企業有三個共同點:第一,他們選擇購買而非自建,因為外部合作夥伴的成功率是內部開發的兩倍;第二,他們授權一線經理而非中央實驗室來推動AI採用,讓真正理解業務流程的人來選擇和部署工具;第三,他們選擇能夠深度集成到現有工作流程並隨時間學習改進的AI系統。最重要的是,這些企業像對待業務服務提供商而非軟體供應商那樣對待AI供應商,要求深度定製並基於業務成果而非技術指標來評估效果。






