比ChatGPT更強大微軟推出全能型人工智慧模型

基於 ChatGPT 的必應聊天已經讓不少用戶感受到了 AI 的強大，而微軟於近日推出了更為強悍的全能型 AI--Kosmos-1。ChatGPT 是純文本 LLM，而它是更強大的多模式大型語言模型（MLLM）。

贊助商廣告

贊助商廣告

Kosmos-1 可以分析圖像的內容、解決視覺難題、執行視覺文本識別、通過視覺智商測試以及理解自然語言指令等等。據悉，Kosmos-1 可以處理文本、音頻、圖像和影片等內容，構建一個全能型的人工智慧，可以像人類思維一樣來處理任務。

研究人員在他們的學術論文中寫道：「作為智能的基本組成部分，多模態感知是實現人工智慧的必要條件」。Kosmos-1 論文中的視覺示例顯示模型分析圖像並回答有關圖像的問題，從圖像中讀取文本，為圖像編寫標題，並以 22-26% 的準確度進行視覺智商測試。

微軟表示，它計劃向開發人員提供 Kosmos-1，儘管該論文引用的GitHub頁面在本文發表時沒有明顯的 Kosmos 特定代碼。

比ChatGPT更強大 微軟推出全能型人工智慧模型