微軟近日推出了Microsoft Fabric集成數據分析平台,該平台匯集了所有構建AI所需的數據和分析工具。
微軟在本周三於西雅圖舉行的微軟年度開發者大會Build 2023上宣布推出了該平台,它將數據工廠、Synapse和Power BI等平台集成到一個統一的軟體即服務產品中。
據微軟稱,Microsoft Fabric將用一個更簡單、更易於管理且具有成本效益的集成平台取代那些分散的系統,供那些希望構建AI並將其集成到技術堆棧中的企業所使用。Microsoft Fabric平台把數據專業人員所需的所有工具捆綁在一個地方,包括數據集成、數據工程、數據倉庫、數據科學、實時分析、應用可觀察性和商業智能。
微軟表示,人們的設備、應用和交互生成的數據充斥著這個世界,Fabric會讓人們的生活變得更加輕鬆。儘管組織已經有效地利用其中大部分數據進行數字化轉型並獲得競爭優勢,但隨著生成式AI和大型語言模型的興起,仍然有很多東西需要簡化。
Azure OpenAI等服務讓企業能夠創造各種尖端的AI體驗,從而提高人們的工作效率。但是構建這樣的體驗具有挑戰性,因為這需要穩定的乾淨數據流和高度集成的分析系統。大多數企業都做不到這一點,而是不得不應對錯綜複雜的、互不關聯的工具和服務,意味著AI開發變得既耗時且成本極高。
Microsoft Fabric旨在改變這一點,允許組織使用單一的產品,讓開發者能夠從數據中提取洞察,並將其提供給AI或最終用戶所需的所有功能。在發布時,Fabric平台支持七種核心的工作負載,其中包括Data Factory——提供了150多種連接器通過拖拽功能連接主流的雲和本地數據源。
Microsoft Fabric還支持Synapse數據工程、Synapse數據科學、Synapse數據倉庫和Synapse實時分析,以及Power BI的可視化功能,支持通過Data Activator進行實時數據檢測和監控。微軟表示,所有這些功能現在都處於預覽狀態。
除此之外,Microsoft Fabric還將集成微軟的Copilot工具,類似於GitHub Copilot,預覽版即將推出,讓用戶能夠使用自然語言命令和類似聊天的界面與Fabric進行交互,從而更輕鬆地生成代碼和查詢、創建AI插件、啟用自定義問答、創建可視化等。
Microsoft Fabric建立在OneLake開放數據湖平台之上,後者充當單一的事實來源,無需提取、移動或複製數據。微軟表示,Fabric還通過OneLake支持持久的數據治理和單一的容量定價模型,隨著使用量的增長而擴展,同時其開放性消除了鎖定的風險。
微軟表示,除了簡化AI開發任務之外,Microsoft Fabric還將幫助每個用戶駕馭數據的力量。該平台與Microsoft Excel等Microsoft 365應用進行了原生集成。因此,使用Excel的用戶可以直接從OneLake中發現和分析數據,並點擊一下即可生成Power BI報告。
微軟表示,或者,使用Microsoft Teams的用戶也可以使用Fabric將數據直接放進他們的聊天、頻道、會議和演示中。或者,使用Dynamics 365的銷售人員可以使用Fabric和OneLake提供對客戶關係、業務流程的洞察。
Azure數據更新
Microsoft Fabric可以說是此次Build大會上公布一系列與數據相關更新中的重中之重。此外,微軟還宣布了Power BI中的一系列新功能,旨在提高用戶的工作效率。
最大的更新就是Copilot for Power BI,現已提供預覽版,可以更輕鬆地在幾秒鐘時間內根據Power BI數據創建報告或者敘述性摘要。用戶還可以用他們的自然語言詢問有關數據的問題,以生成答案、圖表和可視化。
與此同時,Power BI Direct Lake是一種有助於避免數據複製的新存儲模式,而Power BI Desktop Developer Mode在通過Git集成為Power BI數據集和報告提供以開發者為中心的工作流程。
微軟的雲資料庫服務Azure Cosmos DB也進行了各種更新,可以提高開發者的工作效率並優化成本,其中包括新的Burst Capacity選項,據說可以通過更好地利用資料庫的空閒吞吐量容量來應對流量高峰,為開發者提高性能。
微軟聲稱,當請求超過吞吐量限制時,使用標準配置吞吐量並啟用突發容量的資料庫,將能夠在短時間內保持性能。微軟補充說,如果客戶配置不足,這會為客戶提供「緩衝」,並減少限速請求的數量。
Cosmos DB的其他功能還包括用於更高效分區策略的分層分區鍵、用於NoSQL的Cosmos DB物化視圖,以及.NET和Java SDK遙測和應用洞察。
最後,Cosmos DB更新支持超大規模池進行更新,一種用於超大規模資料庫的共享資源模型,目前處於預覽狀態。開發者可以在雲中構建和管理新應用,對那些有不同適用需求且不可預測的多個資料庫進行擴展。