Google推出Gemini 3.5 Flash，推動AI智能體深入企業工作流程

Google發布了Gemini 3.5 Flash，這是一款專為支持其產品和企業平台中智能體工作流程而設計的新AI模型。該公司希望將生成式AI從聊天機器人式的交互推向更深層次的業務運營。

贊助商廣告

這款模型在年度Google I/O開發者大會上發布，可通過Gemini應用、Google搜索中的AI模式、Google Antigravity、Google AI Studio和Android Studio中的Gemini API、Gemini企業智能體平台以及Gemini Enterprise使用。

Google在部落格文章中表示，Gemini 3.5 Flash專為軟體開發、財務文檔準備、客戶入職、OCR、稅務工作流程和數據診斷等任務而構建。

Google還試圖將該模型定位為大型旗艦系統的更快替代方案。它將Gemini 3.5 Flash描述為迄今為止在智能體和編碼任務方面最強大的模型，聲稱在Terminal-Bench 2.1、GDPval-AA和MCP Google推出Gemini35Flash推動AI智能體深入企業工作流程 Atlas等基準測試中優於Gemini 3.1 Pro。

該公司還表示，該模型在多模態理解方面處於領先地位，在CharXiv Reasoning上得分為84.2%。

Google補充說："從每秒輸出Token數來看，它比其他前沿模型快4倍。"

Google還表示，它與行業合作夥伴合作開發了Gemini 3.5模型系列，並補充說他們"看到了有意義的影響——從銀行和金融科技公司自動化數周的工作流程，到數據科學團隊在複雜數據環境中挖掘洞察。"

分析師表示，Gemini 3.5 Flash應該被視為Google推動構建可在監督下執行企業任務的AI智能體的一部分，而不僅僅是改進的聊天機器人。

Pareekh Consulting首席執行官Pareekh Jain表示："Google在速度、成本和性能方面的改進很重要，因為許多AI試點項目在規模化時會因為太慢或太昂貴而失敗。更快、更便宜的模型可以使AI智能體在編碼、支持、分析和自動化等實際業務運營中變得實用。"

但根據Greyhound Research首席分析師Sanchit Vir Gogia的說法，首席資訊官不應只關注模型成本，還應關注完成工作流程的成本，例如解決索賠異常、審查合同、分類服務事件或推動軟體修復通過測試和審批。

贊助商廣告

Gogia說："供應商基準測試能力，企業試點測試生存能力。"

Counterpoint Research研究副總裁Neil Shah表示，企業目標也在發生變化。Shah說："企業目標已經從總結文檔、回答基於提示的問題或基本代碼生成，演變為將受監督的自主後台工作者直接部署到核心業務工作流程中。"

這引發了一個問題：Google能否使智能體AI足夠可靠以用於生產環境，而不僅僅是運行更快或更便宜。

Gartner高級總監分析師Anushree Verma表示，隨著AI智能體從被動助手轉變為業務流程中的主動參與者，企業還需要對其運作方式進行更強有力的控制。

Verma說："隨著AI智能體在業務系統中被採用，企業面臨一系列新挑戰，例如，智能體被授權執行哪些操作以及在什麼情況下執行。"

她說，風險不僅限於操作錯誤。跨多個系統運行的智能體可能會擴大攻擊面，為攻擊者創造新的入口點，並增加惡意提示或數據觸發意外操作的可能性。

Verma補充說："問責制、可審計性、可解釋性也將成為關鍵問題，隨著部署更多智能體，可觀察性變得非常關鍵。隨著智能體快速被採用，還有更多問題需要處理，這可能會造成智能體泛濫。"

Verma表示，解決這些風險需要IT、安全、合規和業務團隊共同合作，並投資於為AI驅動的自動化構建的工具和流程。

Q&A

Q1：Gemini 3.5 Flash是什麼？它有什麼特點？

A：Gemini 3.5 Flash是Google推出的新AI模型，專為支持智能體工作流程設計。它的主要特點是速度快，每秒輸出Token數比其他前沿模型快4倍，適用於軟體開發、財務文檔準備、客戶入職、OCR、稅務工作流程等企業任務，在智能體和編碼任務方面表現出色。

Q2：企業在部署AI智能體時面臨哪些挑戰？

A：企業在部署AI智能體時面臨多重挑戰，包括智能體被授權執行哪些操作、在什麼情況下執行等權限管理問題。此外，跨系統運行的智能體可能擴大攻擊面，增加安全風險。問責制、可審計性、可解釋性和可觀察性也是關鍵問題，快速採用可能造成智能體泛濫。

贊助商廣告

Q3：Gemini 3.5 Flash相比其他模型有什麼優勢？

A：Gemini 3.5 Flash在多個方面具有優勢。它在Terminal-Bench 2.1、GDPval-AA和MCP Atlas等基準測試中優於Gemini 3.1 Pro，在多模態理解方面處於領先地位，CharXiv Reasoning得分達84.2%。更重要的是，它的速度和成本優勢使AI智能體在實際業務運營中更加實用。