宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Google推出Gemini 3.5 Flash,推動AI智能體深入企業工作流程

2026年05月28日 首頁 » 熱門科技

Google發布了Gemini 3.5 Flash,這是一款專為支持其產品和企業平台中智能體工作流程而設計的新AI模型。該公司希望將生成式AI從聊天機器人式的交互推向更深層次的業務運營。

這款模型在年度Google I/O開發者大會上發布,可通過Gemini應用、Google搜索中的AI模式、Google Antigravity、Google AI Studio和Android Studio中的Gemini API、Gemini企業智能體平台以及Gemini Enterprise使用。

Google在部落格文章中表示,Gemini 3.5 Flash專為軟體開發、財務文檔準備、客戶入職、OCR、稅務工作流程和數據診斷等任務而構建。

Google還試圖將該模型定位為大型旗艦系統的更快替代方案。它將Gemini 3.5 Flash描述為迄今為止在智能體和編碼任務方面最強大的模型,聲稱在Terminal-Bench 2.1、GDPval-AA和MCPGoogle推出Gemini35Flash推動AI智能體深入企業工作流程 Atlas等基準測試中優於Gemini 3.1 Pro。

該公司還表示,該模型在多模態理解方面處於領先地位,在CharXiv Reasoning上得分為84.2%。

Google補充說:"從每秒輸出Token數來看,它比其他前沿模型快4倍。"

Google還表示,它與行業合作夥伴合作開發了Gemini 3.5模型系列,並補充說他們"看到了有意義的影響——從銀行和金融科技公司自動化數周的工作流程,到數據科學團隊在複雜數據環境中挖掘洞察。"

分析師表示,Gemini 3.5 Flash應該被視為Google推動構建可在監督下執行企業任務的AI智能體的一部分,而不僅僅是改進的聊天機器人。

Pareekh Consulting首席執行官Pareekh Jain表示:"Google在速度、成本和性能方面的改進很重要,因為許多AI試點項目在規模化時會因為太慢或太昂貴而失敗。更快、更便宜的模型可以使AI智能體在編碼、支持、分析和自動化等實際業務運營中變得實用。"

但根據Greyhound Research首席分析師Sanchit Vir Gogia的說法,首席資訊官不應只關注模型成本,還應關注完成工作流程的成本,例如解決索賠異常、審查合同、分類服務事件或推動軟體修復通過測試和審批。

Gogia說:"供應商基準測試能力,企業試點測試生存能力。"

Counterpoint Research研究副總裁Neil Shah表示,企業目標也在發生變化。Shah說:"企業目標已經從總結文檔、回答基於提示的問題或基本代碼生成,演變為將受監督的自主後台工作者直接部署到核心業務工作流程中。"

這引發了一個問題:Google能否使智能體AI足夠可靠以用於生產環境,而不僅僅是運行更快或更便宜。

Gartner高級總監分析師Anushree Verma表示,隨著AI智能體從被動助手轉變為業務流程中的主動參與者,企業還需要對其運作方式進行更強有力的控制。

Verma說:"隨著AI智能體在業務系統中被採用,企業面臨一系列新挑戰,例如,智能體被授權執行哪些操作以及在什麼情況下執行。"

她說,風險不僅限於操作錯誤。跨多個系統運行的智能體可能會擴大攻擊面,為攻擊者創造新的入口點,並增加惡意提示或數據觸發意外操作的可能性。

Verma補充說:"問責制、可審計性、可解釋性也將成為關鍵問題,隨著部署更多智能體,可觀察性變得非常關鍵。隨著智能體快速被採用,還有更多問題需要處理,這可能會造成智能體泛濫。"

Verma表示,解決這些風險需要IT、安全、合規和業務團隊共同合作,並投資於為AI驅動的自動化構建的工具和流程。

Q&A

Q1:Gemini 3.5 Flash是什麼?它有什麼特點?

A:Gemini 3.5 Flash是Google推出的新AI模型,專為支持智能體工作流程設計。它的主要特點是速度快,每秒輸出Token數比其他前沿模型快4倍,適用於軟體開發、財務文檔準備、客戶入職、OCR、稅務工作流程等企業任務,在智能體和編碼任務方面表現出色。

Q2:企業在部署AI智能體時面臨哪些挑戰?

A:企業在部署AI智能體時面臨多重挑戰,包括智能體被授權執行哪些操作、在什麼情況下執行等權限管理問題。此外,跨系統運行的智能體可能擴大攻擊面,增加安全風險。問責制、可審計性、可解釋性和可觀察性也是關鍵問題,快速採用可能造成智能體泛濫。

Q3:Gemini 3.5 Flash相比其他模型有什麼優勢?

A:Gemini 3.5 Flash在多個方面具有優勢。它在Terminal-Bench 2.1、GDPval-AA和MCP Atlas等基準測試中優於Gemini 3.1 Pro,在多模態理解方面處於領先地位,CharXiv Reasoning得分達84.2%。更重要的是,它的速度和成本優勢使AI智能體在實際業務運營中更加實用。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新