隨著2023年的帷幕徐徐落下,IT界正以樂觀且謹慎的態度展望新的一年。其中謹慎是因為持續低迷的整體經濟環境,而樂觀的底氣則來自生成式AI服務的橫空出世。
繼20世紀90年代文字處理與電子表格軟體的爆發式增長以來,生成式AI(簡稱GenAI)已經成為知識工作領域又一波重大生產力驅動因素。根據麥肯錫全球研究院的數據,在提升客戶運營、銷售與營銷以及軟體工程方法,生成式AI每年有望給全球經濟帶來高達4.4萬億美元的價值增量。
這種謹慎樂觀的情緒來自IT領導者對企業數據中心進行一體化改造,從而適應生成式AI及其他數據密集型工作負載的寶貴機遇。這無疑將是一項複雜的工作,但只要執行得當,也完全能夠幫助組織提高應用程序性能、提高運營效率,同時控制成本。
我們當然沒有預測未來的魔力,畢竟當初沒人想得到生成式AI能夠讓這項技術在普羅大眾當中普及得如此迅速。但這就是事實,所以無論是否準確,我們都決不可放棄對前景的推衍。
話不多說,下面來看2024年可能出現的IT管理趨勢變化。
生成式AI推動工作負載分配決策
生成式AI能夠縮短知識工作者每天完成工作的時間,從而徹底改變各個行業。根據戴爾科技今年早些時候開展的生成式AI脈搏調查(Generative AI Pulse Survey),52%的IT部門出於這一考量而構建或已經部署了生成式AI解決方案。
到2024年,生成式AI將加速工作負載的分配流程,組織將考慮如何以及應在何處運行其生成式AI應用,從而發揮底層大語言模型(LLM)的力量。也有一部分IT決策者將選擇使用公共服務。
其他決策者則傾向於在本地設施內運行開源大語言模型,藉此獲取控制權,並得以利用特定領域實現、伺服器集群以及合作夥伴提供的其他可靠基礎設施來靈活調整工作負載規模。
通過這種方式將AI引入數據設施,將幫助組織制定起更強大的安全策略和訪問政策,建立起能夠降低聲譽風險並增強成本效益的護欄。
多雲管理更趨無縫化
出於對靈活性的需求,將有更多組織進一步從運營環境中抽象出軟體功能,以便在他們選定的位置上運行工作負載。
這要求將以往運行在本地設施上的部分存儲選項轉移到公有雲中,藉此確保IT人員在管理環境時擁有更好的數據移動性與一致性。
此外,還應保證開發人員能夠在本地訪問到自己熟悉和樂於使用的雲服務。例如,組織可能會建立自定義生成式AI聊天機器人,隨時為開發者提供業務資訊支持。
將這些方法匯總起來,就是當前這波努力將多雲環境合併為可以無縫管理的統一系統的廣泛趨勢。這意味著整個基礎設施資產都將被視為單一實體,從而提供更高的運營效率與商業價值。
邊緣運營同樣趨於合併
長久以來,支持邊緣環境的基礎設施一直高度分散。現如今,組織希望將這些解決方案合併起來,這樣才能切實降低延遲,讓整個應用體系都能保持近實時的運行性能。
到2024年,將有更多組織採用邊緣運營方法,藉此簡化、優化且安全地跨複雜多雲資產進行部署,最終獲得更好的正常運行時間和服務質量。
這將加速零售(例如智能貨架)、醫療保健、汽車、農業、能源及其他各個領域的創新步伐。此外,也將有更多組織探索如何將生成式AI應用擴展至邊緣場景以孕育出更大的商業價值。
「即服務」隨時為您服務
大多數IT員工對於公有雲和當日達服務都讚不絕口,這二者都以敏捷、快速的服務體驗為核心賣點。然而,大多數組織也厭倦了爭論到底該用哪家廠商的雲服務,以及由公有雲服務帶來的難以預測的成本波動。
到2024年,將有更多組織繼續維持相同的基礎設施服務即用即付訂閱模式,但轉而由自己選定的數據中心或託管中心負責交付。
此類「即服務」解決方案有效平衡了靈活性與控制力,確保IT領導者只需要為業務運營的實際開銷付費。這將有助於遏制由資源密集型工作負載(例如生成式AI和高性能計算類應用)相關的成本上升,同時也讓IT部門得以更好地控制計算與存儲資源的消耗方式。
多雲設計將不斷演進
多年以來,組織已經親眼見證自己的應用程序正在根據性能、延遲、安全性、數據可移植性甚至是其他一些突發奇想式的要求而被分布在多個運營位置。
因此,大多數IT組織在本地、公有雲與私有雲、託管中心以及邊緣位置上運行應用程序,這也構成了事實上的多雲資產。根據Enterprise Strategy Group於2023年5月發布的《通過優級工作負載釋放多雲之力》報告,這種位置層面的差異將愈發凸顯,87%的組織預計其應用環境將在未來兩年內更加趨於分散。
到2024年,將有更多IT領導者在設計層面考慮多雲布局,或有意通過架構提高應用程序的性能和運營效率。這種多雲體系也將有助於滿足監管要求、控制和保護資產並優化運營成本。
此外,考慮到所創建的生成式AI應用程序包含大量數據,這波浪潮也將給IT領導者在設計基礎設施時的思路產生巨大影響,同時影響到人們在構建和訓練大語言模型時的引導傾向。
關鍵要點
大家可能已經注意到,貫穿這些趨勢的主線就是生成式AI。事實上,這項2023年最具顛覆性的技術力量,也同樣將在2024年成為最熱門的工作負載類型。
IT領導者還將做出一系列關鍵決策,決定他們要運行哪些生成式AI應用程序,以及是否要在內部、外部或跨多個位置分布式運行。
這自然需要認真考慮計算和存儲需求,以及工作負載的部署和運行架構。IT基礎設施的多雲設計方法則為此提供一條更智能、更負責任的實現路徑。此外,值得依賴的合作夥伴將成為這段旅程上的重要助力和嚮導。
這已經不是胡亂猜測,而是有理有據的前瞻性判斷。