IBM在企業AI領域做出了一系列頗為獨特的探索。藍色巨人目前正在推動全棧技術布局,以自2020年來興起的AI和混合雲作為企業戰略領域的兩大基礎性支柱,同時借鑑了自身在其產品組合中積累下的優勢。
更重要的是,這套方案扭轉了主要以AI概念驗證為目標的總體趨勢,轉而專注於解決高度具體的業務用例,且執行效率更高。其通過基於內部企業數據構建並微調、與既定用途高度契合的AI基礎模型作為達成目標的依託,而非選擇由純通用領域公共數據訓練而成的普適性大語言模型。
就在幾周之前,IBM正式發布了其全新Granite 3.0基礎模型。除了將其作為上述戰略規劃的基礎,藍色巨人還在紐約舉辦了一場大型分析師活動,詳盡介紹了公司當前探索方向以及相應運作成果,同時配合現場的實際用例展示了可量化的AI功能效果。我們也藉此機會與IBM公司高管進行了交流訪談,希望加深對於藍色巨人所做工作的理解。這既是對Granite 3.0模型的探究,也是對IBM整個AI戰略的一份年度回顧。閒言少敘,我們馬上進入主題。
運用Granite 3.0模型,在效率與性能間尋求平衡
讓我們先從Granite 3.0模型聊起。作為一套在技術意義上的基礎模型,這也是IBM開拓市場的方法論基礎。受篇幅所限,本文將專門討論該模型的業務影響力。
據IBM介紹,企業數據在當今AI基礎模型中的占比不足1%
新的Granite 2B與8B模型與我們從OpenAI、Meta乃至其他廠商處看到過的規模化大語言模型之間有著根本區別,後者這些擁有數千億參數的大模型是由公共數據構建而成——也就是說,其訓練素材為來自公共網際網路上搜集而來的所有數據,包括用戶可能關注的體育賽事比分、食譜、度假景區等各類資訊。正如IBM公司CEO Arvind Krishna所言,如果我們並不清楚要用AI來做什麼、或者需要搜索某些通用資訊,那麼這類模型無疑最為適合。
然而,這些大型公共語言模型的普適性定位,在企業環境中卻面臨著一系列重大挑戰。首先,這些模型並不清楚特定公司在嘗試解決具體業務問題時的狹義背景,畢竟它們無法訪問到企業的內部賬單資訊、代碼庫或者來自供應鏈的統計數據。其次,大語言模型固有的強大訓練和推理方法需要耗費海量資源,包括電力、數據中心算力(特別是昂貴的GPU算力)以及內存容量。
理想的作法當然是使用能夠為更具針對性的用例提供準確答案的AI模型,並保證以經濟高效、省時且節能的方式實現功能。這也正是IBM在其龐大數據平台背景之下,為全新Granite模型設定的基本定位。
為IBM AI戰略提供支持的數據平台,借鑑了藍色巨人旗下技術組合中的多個不同領域
Granite模型到底有多高效?
此前版本的Granite模型已經具有很高的執行效率,但從各項統計指標來看,其性能仍未達到最高水平。但從我們親自得出的基準測試結果來看,Granite的性能完全能夠比肩(在多數情況下甚至超越)其他廠商的最佳同類模型。這也證明了IBM長期以來在研發方面投入的大量資源與心力(該公司早在兩年之前生成式AI熱潮出現之前,就一直致力於開發AI模型),也凸顯出這類精心設計、專門面向資料庫與ERP系統內結構化與非結構化數據的模型在特定業務場景下的卓越能力。
在本次紐約分析師活動中,IBM公司首席商務官Rob Thomas及研究主管Dario Gil帶來了更多令人眼前一亮的成績。Thomas指出,「現在我們在推理方面實現了40倍的性能提升。」Gil則補充稱,IBM的內部數據顯示「使用定製化專用模型能夠顯著節約實現成本,幫助客戶以極低的投入獲得更好的用例性能。」
除此之外,這裡還要補充一點。像Granite這類體量相對較小的模型,不需要匹配最先進的GPU即可順暢運行。換言之,用戶可以在性能較差的GPU甚至是CPU上運行這些模型,使得它們在支撐應用場景時的運營成本降低至常規大模型的十分之一甚至二十分之一。
從「AI加力」到「AI優先」
這種技術和財務層面的實用性,也支撐起Thomas介紹的整體轉變趨勢。在過去幾年裡,企業已經可以將自己希望解決的任何問題和業務流程交付給AI,運用這項新興技術成果改造自己的固有運營模式。Thomas表示,IBM意識到客戶對於AI技術的態度已經發生根本性變化,逐步轉向所謂「AI優先」思維。也就是說AI不僅僅是被附加在現有流程之上的加力因素,而是從設計初期就作為內置部分存在。在他看來,「未來十年誰能真正實施以AI為先的戰略,誰就能在市場上擁有優異的表現。這也將成為新的業務運營常態。」
對於IBM的客戶來說,最常規的操作流程就是先選擇一套模型(Granite或者其他第三方模型),而後使用IBM的watsonx.ai運行該模型,再配合InstructLab產品根據自有業務數據對模型進行微調。IBM廣泛產品組合帶來的一大優勢(所有這些都經過重新調整以支持其整體AI戰略),就是客戶可以根據自己的喜好運用IBM成果以滿足自身AI需求。這種成果可以是完整的IBM解決方案,也可以是由IBM Maximo Application Suite提供的資產管理數據等。客戶還可以使用紅帽提供的數據管理要素,甚至與IBM諮詢部門合作對其內容進行拆解分析。(順帶一提,IBM諮詢部門繼續保持著驚人的AI業務發展速度——根據藍色巨人公布的最新收益報告,該部門的業務總額已經達到25億美元。)換句話說,客戶既可以親自動手做出各種探索,也可以向IBM求助以儘可能滿足自己的AI需求。
Thomas接下來介紹了IBM通過實際觀察總結出的,企業AI能夠為客戶帶來切實回報的關鍵領域,主要集中在客戶體驗、員工體驗以及IT運營方面。在各種實際應用場景之下,AI模型、AI助手以及近期快速崛起的AI智能體正在批量識別模式、解決問題、檢索相關資訊、實施流程自動化改造並越來越多地採取自主行動,藉此減輕員工的重複性工作量並創造出巨大的效率優勢。他還列舉了許多來自客戶的特定用例,其中最令人印象深刻的數字,當數IBM在過去兩年半中「通過實施我們的自有技術來提高生產力」,成功依託AI成果節約下20億美元。(IBM高管們表示,他們預計後續節約數額還將進一步增加。)這也是IBM過去幾年來,承諾在外部客戶之前先行應用其AI產品所帶來的巨大回報。
寬鬆許可和對治理的高度關注
IBM的方法論不僅為客戶帶來實用性,同時也高度關注企業AI在法律、財務和合規等領域的具體問題。雖然頗為「無聊」,但沒有這些事務的加持,我們根本不可能正常開展業務。Granite模型採用極其寬鬆的Apache 2許可保護,與IBM對於開源議題的整體承諾相契合。Granite模型家族也同樣經過IBM律師的嚴格審查,能夠享受到IBM承諾的全額賠償政策。
相信關注技術圈資訊的朋友都知道,近期開源社區一直在爭論某些被宣傳為開源的模型到底算不算「開放」。例如,反對者們注意到,Meta對其Llama模型的使用和微調方式就做出了不少實質性的限制,目的當然是為了增加其經濟收益。相比之下,Apache 2許可在開源社區中則高度透明且廣受好評。援引IBM的評價,Apache 2堪稱「開放許可領域最寬鬆的許可協議」。
IBM在治理方面同樣具有很大優勢。在紐約的活動當中,Thomas表示自從IBM一年多前首次公布watsonx.governance以來,市場上就一直沒有真正能與之競爭的同類產品。這樣的情況著實令他感到驚訝。與此同時,同IBM保持合作的每一家全球系統集成商「都在全面使用watsonx.governance」。據Thomas介紹,「這是因為當今市場上真的沒有其他方案可以幫助客戶處理……不斷變化的法規條款、如何向監管機構提交或認證報告內容、如何管理數據蔓延、如何管理風險等現實問題。」數據治理是IBM幾十年來始終擁有出色表現的中車個「無聊」領域,我甚至嚴重懷疑是否有其他廠商能夠在這個領域挑戰藍色巨人的傳統優勢。
IBM在AI領域的下一步計劃
關於IBM的合作夥伴關係、AI智能體日益增長的現實應用、量子計算對於AI效能的加持作用以及藍色巨人的其他未來規劃,當然還有很多值得討論的空間。例如,公司CEO Krishna就堅定認為,GPU從根本上講無法滿足未來幾年的新增AI工作負載。在他看來,採用不同於以往的晶片設計方法有望在未來幾年內將AI推理延遲進一步壓縮,同時將所需電力控制在當前水平的百分之一。為了踐行這一判斷,IBM也在著手設計AI應用領域的定製晶片,其NorthPole晶片將採用完全不同的12納米神經形態模擬架構。
更重要的是,IBM還希望以全棧、全部門覆蓋的方式推動並落地企業AI戰略。藍色巨人已經拿下總額30億美元的AI訂單,其中包含大量諮詢服務需求,客戶顯然希望借鑑IBM在多年經營之下積累得到的各種現實成果。
IBM還提出一個令人信服的論據,用Rob Thomas的話來說,AI將成為「推動企業生產力發展的強勁催化劑」。由此可見,AI已經成為藍色巨人當前及下個階段的發力重點。現在IBM需要進一步加大力度,包括增加推廣投入、擴大銷售範圍並與Adobe及SAP等夥伴開展深度合作。簡而言之,IBM當前的首要工作,就是對其此前所取得的成就做出一次漂亮的整理和總結。而隨著Granite 3.0模型的發布,我們可以看到IBM顯然決定走上一條多角度並進、以業務針對性為核心的戰略路線,既涉及針對消費者優化的模型、又涵蓋針對企業優化的模型和配套服務。總而言之,IBM正傾盡全力投身於企業AI應用。