宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

2025年05月21日 首頁 » 熱門科技

去年的 Google I/O 前一天,OpenAI 甩出 GPT-4o 狙擊。

今年攻守之勢異也。

前幾天 OpenAI 透露 GPT-5 將 All in One,集成各種產品。剛剛,Google 就把這個思路貫徹到  I/O 大會,直接掏出了自家有史以來最強的 AI 全家桶。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

從 Gemini 2.5 Pro/Flash 模型,到 AI Mode,再到 Veo 3、Imagen 4,以及面向開發者與創作者的 AI 套件等,Google 幾乎把從模型到產品的路徑都壓縮到一場發布會裡。

更準確地說,當下最火的 AI 應用場景,都被 Google「預埋」進了產品接口裡,讓人無法忽視它作為全球同時具備工程實力和生態整合能力的 AI 巨頭硬實力。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

也難怪許多網友調侃,將近兩個小時的發布會過後,又將有一大批初創公司死於 Google 之手。

不過,也不難看出,發布會上有一些功能仍停留在「預告片」和小範圍測試階段,距離真正的落地或許還有不小的距離。

此外,Google 還正式發布了 Android XR 產品和技術線的最新一代產品:與 Xreal 共同推出的首款輕量級智能眼鏡產品 Project Aura。(更多細節請留意後續的另一篇報道)

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

幫我「買票 找座 填表」一口氣搞定,Google 新 AI 搜索卷瘋了

AI 正在重寫搜索的底層邏輯。

在去年的 I/O 大會上,Google 推出了 AI 概覽(AI Overviews)功能,至今已擁有超過 15 億的月活躍用戶。

生成式 AI 逐漸改變了人們的搜索方式,但隨之而來的卻是,我們不再滿足於在搜索框裡輸入簡單的問題,而是拋出更複雜、更長、更具多模態的提問。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

今天,Google 再次加碼搜索與 AI 的融合,推出一種端到端的 AI 搜索體驗——AI Mode。

正如 Google CEO 桑達爾·皮查伊介紹的那樣,這是 Google 有史以來最強大的 AI 搜索形態,不僅具備更先進的推理能力和多模態理解能力,還支持通過上下文追問和網頁鏈接進行深度探索。

例如,當用戶面對一個需要複雜解讀的搜索問題,AI Mode 可啟動「深度搜索」機制,不同資訊之間進行推理,並在幾分鐘內生成一份專家級的引用報告,為你節省數小時的研究時間。

與此同時,Google 也將 Project Astra 的多模態能力接入搜索,進一步提升搜索的實時交互性。通過 Search Live 功能,用戶只需打開攝影機,即可通過畫面實時提問並獲得反饋。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

今年是 Agent 元年,Google 也很貼心地推出了 Project Mariner Agent 功能,能幫助用戶更高效地完成任務。

例如,只需一句「幫我找兩張周六比賽的實惠票,位於下層座位」,AI Mode 便能自動跨多個票務平台檢索選項,實時比較價格和庫存,並完成表單填寫等繁瑣操作,大幅提升效率。

藉助 Gemini 模型和 Google 購物圖譜的強大支持,Google AI Mode 能夠幫助你縮小商品範圍並提供靈感。如果你想看看衣服穿在自己身上的效果,只需要上傳一張自己的照片,就能實現虛擬試穿衣服。

此外,AI Mode 也具備強大的個性化能力,能根據用戶上下文偏好給出定製化建議,還可生成圖表和可視化結果,尤其在體育和金融類搜索中表現出色。

該功能今日起已在美國全面上線,未來將推廣至更多地區。

會寫代碼、還省 Tokens,Gemini 拿到了「學霸」人設

在模型能力方面,Google 此次發布了 Gemini 2.5 Pro 的 I/O 版本,在各大排行榜上獨占鰲頭。

現在,Gemini 2.5 Pro 引入了名為「Deep Think」的推理增強模式。這項功能可在生成答案前考慮多個假設,從而更深入地理解問題背景。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

2.5 Pro Deep Think 在 2025 年美國數學奧林匹克(USAMO)以及 LiveCodeBench(編程基準)排名領先,並在 MMMU(測試多模態推理)中獲得了 84.0% 的分數。

不過,Google 表示,將會花更多時間進行前沿安全評估,並徵求安全專家的進一步意見。作為第一步,Deep Think 功能目前將通過 Gemini API 向小範圍測試者開放。

同樣得到升級的還有注重效率的 Gemini 2.5 Flash。

新版 2.5 Flash 在推理、多模態、代碼和長上下文等關鍵基準上都有了改進,同時在效率上更高,評估中使用的 tokens 減少了 20% 至 30%。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

2.5 Flash 現已在 Gemini 應用程序中向所有人開放,並將在 6 月初通過 Google AI Studio 面向開發者和 Vertex AI 向企業全面發布。

開發者體驗上,2.5 Pro 和 2.5 Flash 將在 Gemini API 和 Vertex AI 中引入了「思維摘要」功能,可將模型的推理路徑以標題、關鍵資訊和調用工具等方式進行結構化呈現。

開發者也將從中受益,Google 宣布在 Gemini API 和 SDK 中正式支持 MCP 工具,讓開發者可以輕鬆接入更多開源工具和插件生態。

音樂、電影、圖像全套上線,Google 把 AI 玩出了花

本次發布會,Google 帶來了新一代影片和圖像模型——Veo 3 和 Imagen 4。

與傳統影片生成不同,Veo 3 是一款支持音頻的影片生成模型,能在城市街景中模擬交通、鳥鳴,甚至角色對話,顯著提升沉浸感。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

該模型不僅在文本和圖像提示的基礎上生成影片,還能精確實現物理環境與口型同步,極大提升了影片創作的真實感。

目前,Veo 3 已在 Gemini 應用和 Flow 平台上向 Ultra 訂閱用戶開放,並已在 Vertex AI 平台上為企業用戶提供支持。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

上文提到的 Flow 正是 Google 為創作者打造的一款 AI 電影製作工具。

用戶只需用自然語言描述電影場景,即可管理演員、地點、道具和風格,自動生成敘事片段。Flow 已在美國向 Gemini Pro 和 Ultra 用戶開放,全球範圍的推廣也在推進中。

在圖像生成方面,新版 Imagen 4 提升了精度與速度,細節表現上可逼真展現織物、水滴與動物毛髮,同時也能生成偏抽象類型的風格。

它支持 2K 解析度和多種長寬比生成,在排版和拼寫方面也有顯著優化,適合製作賀卡、海報甚至漫畫。

Imagen 4 今日已在 Gemini、Whisk、Vertex AI 以及 Workspace 的 Slides、Vids 和 Docs 中上線,據悉,未來還將推出速度快十倍的版本。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

在音樂創作方面,Google 擴大了 Lyria 2 驅動的 Music AI Sandbox 的訪問權限,並上線了互動式音樂生成模型 Lyria RealTime。該模型現已通過 API 和 AI Studio 向開發者開放。

考慮到由 Veo 3、Imagen 4 和 Lyria 2 生成的內容將繼續帶有 SynthID 水印,Google 發布了全新的 SynthID Detector。

用戶只需上傳文件,即可識別其中是否包含 SynthID 水印,用於防偽和追蹤 AI 內容來源。

Google 要造「世界模型」,連任務都能幫你做了?

Google 希望將 Gemini 打造成一個「世界模型」,既能計劃、理解,也能模擬現實世界的各個方面。

Google DeepMind CEO Demis Hassabis 表示,這一方向正是 Project Astra 的核心理念之一。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

過去一年裡,Google 已將影片理解、螢幕共享、記憶功能等逐步集成進 Gemini Live。如今,Gemini 新的語音輸出加入了原生音頻,更加自然;記憶與 computer use 能力也同步增強。

此外,Google 還在探索如何利用 Agent 能力幫助人們處理多任務。

Project Mariner 就是其中之一,能夠同時完成最多十項任務,比如資訊查詢、預訂、購物與調研。已面向美國 Ultra 用戶開放,並即將集成至 Gemini API 與其他核心產品中。

AI 新功能扎堆發布,會誕生真正的殺手鐧嗎

NotebookLM 官方昨日宣布,上線 24 小時就已經成為 App Store 中排名第 2 的生產力應用和第 9 的整體應用。

作為 Google 在 AI 筆記工具上的一次重要探索,NotebookLM 提供音頻概覽和思維導圖等功能。

其中,音頻概覽目前已支持超過 80 種語言,而本周,Google 也宣布將為這一功能引入更高的可定製性,用戶可根據需要選擇摘要的長度,無論是快速瀏覽還是深入閱讀都不在話下。

這項功能首先將在英語中推出,隨後將擴展到更多語言。

與此同時,Google 也在回應用戶對視覺呈現的訴求,即將在 NotebookLM 中加入影片概覽功能,用戶只需一鍵即可將筆記內容轉化為教育類影片,用更直觀的方式傳遞資訊。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

在 AI 編程領域,Google還帶來了 Jules 的最新進展。

這個最初出現在 Google Labs 的自主編碼助手,能夠理解代碼並自主完成諸如編寫測試、構建功能和修復 Bug 等開發任務,如今已經正式進入公開 Beta 測試階段。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

此外,Google 還推出了全新的訂閱服務 Google AI Ultra。

該計劃為專業用戶提供 Google 最強大模型和高級功能的無限制訪問,適合電影製作人、開發者、創意工作者等專業人士,月費為 249.99 美元。

目前,該計劃已經在美國上線,並將很快擴展至其他國家。

搶跑GPT-5,Google發布最強AI全家桶,史上最貴AI會員

實際上,AI 如今不缺模型,也不缺功能,真正稀缺的,是一個能嵌入日常生活、真正打進主流用戶心智的「殺手級產品」。

Google 當然明白這個道理,也正全力以赴尋找答案。

因此,我們看到,在這次的發布會上,Google 幾乎什麼都做了,也什麼都提了:從文本、圖像、影片、音樂,到搜索、Agent、創作工具,一應俱全。

牌已經亮完,技術也到位,現在,Google 只差一記真正擊中用戶痛點的落子。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新