當人們還在排隊灰測 GPT-4o 的語音模式,當蘋果的 Apple Intelligence 只能在 Beta 版體驗部分擠牙膏的功能時,今天 Google 徹底掀桌了,將這些之前只在發布會驚艷的功能,直接塞進了剛剛發布的 Pixel 9 系列裡了。
過去 Pixel 一般在 10 月發布,這次提前亮相,讓 Android 搶先 iOS 成為首個擁有大型設備內多模態 AI 模型的移動作業系統——Gemini Nano。不是期貨,馬上能用。矛頭直指蘋果和 OpenAI 的 Google 沒少在發布會上調侃那些「即將推出」的 AI 功能。雖然 Google 今年在 AI 產品發布上屢次翻車,但這次將 Gemini 模型和一系列 AI 功能整合到手機里,讓我們看到 Android 這個全球最多人用戶的作業系統 ,該怎麼用 AI 重塑,給智慧型手機帶來真正來自由里到外的更新。讓我們先看看這次發布會主要的更新: Google Pixel 系列迎來了四款 AI 手機:Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL 以及 Pixel 9 Pro Fold 對標 GPT-4o 高級語音功能的 Gemini Live 落地手機,未來幾周內向 iOS 設備開放 Gemini 支持實現多個應用跨界調用的無縫體驗,承諾用戶個人數據不會被發送給第三方 AI 提供商 AI 圖像功能迎來疊代進化,推出 Add me 與 Magic Editor 新功能買 Google AI 送手機Google 緊握的救命稻草便是當下最為風頭正勁的詞彙——人工智慧(AI)。當 AI 落地端側成為眾所矚目的命題作文時,如何把 Gemini 更好地塞進手機等端側設備里,成了本場發布會的最大懸念,好在 Google 也沒有讓我們的期待落空。在本場發布會上,Google 推出了重磅的 Gemini Live 功能。簡單來說,你可以將之理解為你的聊天搭子。類似於 GPT-4o 的高級語音模式,Gemini Live 能夠讓你與 Gemini 進行自由流暢的交流,並且提供了包括名為 Ursa 和 Dipper 在內的 10 種新的語音選項。感受一下 Gemini 多變的聲線在對話過程中,你甚至隨時可以打斷 Gemini 的回應,深入探討某個話題,或是暫停對話,稍後再繼續。此外,Gemini Live 現在也支持免提功能,用戶即使在手機後台或者鎖屏的狀態下也能與 Gemini 進行對話,這樣無論是在走路還是忙於其他事務時,都能像普通電話一樣隨時進行交流。即日起,Gemini Live 將在 Android 手機上向 Gemini 高級訂閱用戶推出英文版本,未來幾周內還將支持 iOS 設備,並增加更多語言選項。Gemini Live 不僅僅只是 Gemini 嵌入 Google 端側設備的一個縮影,也昭示著 Google 對於整合 Gemini 至其應用生態不再是模糊的概念,而是日漸成型的藍圖。另一個典型的案例就是,上機的 Gemini 省卻了在不同的應用程序和服務之間來回切換的繁瑣,真正意義上實現多個應用跨界調用的無縫體驗。比如你要舉辦晚宴,那麼你可以使用 Gemini 來搜索 Gmail 中的千層麵食譜,並要求 Gemini 將食譜中的食材添加到 Keep 應用的購物清單中。又或者,在未來你可以隨手拍攝一張音樂會傳單的照片,詢問 Gemini 在那一天是否有空閒時間,Gemini 將能夠訪問你的日曆資訊給出回復,如果你恰好有空,它還可以幫你設置一個提醒,以購買音樂會的門票。在發布會現場,Google 高管 Dave Citron 也演示了這項功能。聲稱所有演示都是現場直播的 Citron 通過拍攝 Sabrina Carpenter 音樂會海報的照片,然後讓 Gemini 檢查他的日曆,看看他是否在這位藝術家今年來到舊金山時有空。結果 Gemini 在最初的兩次嘗試中都沒有響應,直到 Citron 換了手機後,Gemini 才最終給出了回應。通過長按電源按鈕或是輕聲呼喚「Hey Google」,你還可以隨時在 Pixel 上激活調用 Gemini。無論是在 YouTube 上觀看旅行影片時查看資訊,還是需要將 Gemini 生成的圖像拖放到 Gmail 或 Google Messages 中,Gemini 都能迅速響應你的需求。為了提高響應速度和質量,Google 也引入了 Gemini 1.5 Flash 這樣的新模型。並且,Google 還計劃與其他服務進行更深層次的集成,包括但不限於 Google Home、Phone 和 Messages。至於用戶最為關心的隱私安全問題,Google 也承諾 Gemini 將在 Google 的安全雲內部處理複雜的個人數據,以確保用戶的個人數據不會被發送給任何第三方 AI 提供商。Pixel 9,全系登場在這場提前了兩個月的年度盛典上,Pixel 9 系列登場。今年,Google Pixel 系列迎來了四位成員,分別是 Pixel 9、Pixel 9 Pro、回歸的 Pixel 9 Pro XL 以及 Pixel 9 Pro Fold,這四台手機均搭載了 Google 自研的 Tensor G4 處理器。Tensor G4 處理器使用 1 3 4 的核心配置,由一顆 Cortex-X4、三顆 Cortex-A720 與 四顆 Cortex-A520 組成,與 Pixel 8 上的 Tensor G3 處理器相比(或更以前的晶片),Tensor G4 中新的 Cortex-X4 提升了約 11% 的單核性能,但由於缺少一個核心(Cortex-A720),所以與 Tensor G3 相比,多核結果預計只會上升約 3%。Google Pixel 9 Pro XL 與上一代 Pixel 8 Pro 跑分對比不過,晶片的短暫停滯並沒有影響 Google 使用 AI 的決心:這是第一台搭載了 Gemini Nano Multimodality 多模態模型的手機,Google 宣稱這個模型比去年推出的模型要強大 3 倍,複雜程度也提高 3 倍。除了新晶片,Google 為影像也做足了準備。雖然 Pixel 9 標準版與上代 Pixel 8 標準版的變化不大,只是將超廣角攝像頭從 IMX 386 提升到 IMX 858,但在 Pixel 9 Pro 與 Pro XL 上,Google 選擇「一致強大」的方案:除了主攝使用三星 GNK 五千萬像素傳感器外,其他所有攝像頭都使用索尼 IMX 858 傳感器。IMX 858 是目前影像旗艦中最常見的傳感器,1/2.51 英寸足以在適當的影像模組大小中擔任超廣角鏡頭與長焦鏡頭的成像任務——這與小米 14 Ultra 的相應焦段配置相同。Pixel 從單攝「硬剛」雙攝的時代一路走來,終於在今天趕上了影像旗艦手機應有的硬體配置。AI 影像,由「實」入「虛」在 AI 浪潮襲來的時候,Google 企圖踏浪而行——去年的 Made by Google 與今年 Google I/O 2024 大會上,Google 公布了大量 AI 技術,從生成式模型到自然語言處理、從獨立 app 到系統集成,這是一種行為上的「All in AI」。賈伯斯最認可的電腦科學家艾倫·凱(Alan Kay)有句名言:真正認真對待軟體的人,就應該自己做硬體。Google 推出的 AI 新功能的第一位接棒者,自然是「親兒子」Pixel,而影像,便是手機 AI 的大展拳腳之處。Google 將 Pixel 9 系列的相機稱呼為 「世界上第一款 AI 相機」,足以見證除了旗艦級別的攝影模組外,Google 對全新 AI 的加持抱有同樣的信心。在 Pixel 8 中,有一個專為合照準備的功能:Best Take在拍照時,有時難免會拍下不符合當時情景的表情和姿態,Best Take 會拍攝多張照片,通過 AI 選擇出這些照片中每個人最好的一部分自動合成,如果你對 AI 選擇的不滿意,也可以手動進行選擇,最後合成在一張照片中。而在 Pixel 9 中,為了幫助你更好地合照,Google 又搞了新花樣:Add me。這個新功能企圖解決你在沒有外人的幫助下進行「非自拍合影」的困難——你只需要將 Pixel 9 舉起來拍攝朋友,再讓朋友在同樣位置將 Pixel 9 對準你,Add me 會自動幫你們合成在一張照片中。這有些像攝影中常用的手法——堆棧:將相機穩定後,拍攝同一場景下不同位置的人物,再將這些拍攝的照片放入 Photoshop 或其他後期軟體中進行對齊,最後合成在一起,將不同的人物呈現在同一張照片上。使用相機進行堆棧拍攝的照片現在,在 AI 的加持下,Pixel 9 在抬手之間就能完成這個複雜流程。如果說 Add me 只是「堆棧」技術的自動化,那麼「Magic Editor」的新功能,則是將手機影像真正帶到了「真實」與「虛假」的交匯點。升級後的「Magic Editor」成為了真正的「魔術編輯器」:除了前代的改變畫面曝光、去除背景與移動畫面元素外,只需要輸入相應的文字,就能創造出根據用戶腦海中的畫面。簡而言之,這就是我們常說的文生圖模型。文生圖,已經不算是 AI 技術中的「新鮮」傢伙了,例如 OpenAI 開發的 DALL-E 與開源的 Stable Diffusion 等模型都早已是我們熟悉的作圖幫手,經過多次疊代,各類創作可以說是信手拈來。使用 Midjourney 生成的圖片不過,傳統的模型都需要我們使用網頁或是 Discord 等渠道才能訪問,更有甚者需要自己配置本地的操作界面,才能順利使用,而 Pixel 9 系列則簡單多了——你只需要解鎖手機後輸入文字,Magic Editor 就可以幫你完成這一切。這離不開 Google 對於生成式 AI 的技術儲備——Google 旗下的 Imagen 從 2022 年 5 月開始,就為使用者提供 AI 圖像生成服務,例如我們最討厭的人機驗證程序。作為 Android 陣營的嫡長子,Pixel 一直以來都比較低調,但誰也不能忽視它的存在——Google 有任何新技術,總是第一時間交給它,久而久之,Pixel 變成了一種指路標:Add me 與 Magic Editor 兩個新功能,也許會是未來一段時間內 Android 對於 AI 攝影技術運用的方向。
AI 手機,可能為時尚早
今年以來,我們已經看過不少打著 AI 手機噱頭的發布會,Google Pixel 9 系列交出的這份答卷雖有不少驚喜,但總體上也沒有脫離以往的框架,AI 要成為影響消費者購買的主要因素還為時尚早。與蘋果 WWDC 大會上精心策劃的演示相比,以往飽受 PPT 畫餅詬病的 Google 明顯多了幾分鬆弛感,至少敢在發布會現場向世人掏出實打實的真傢伙。這種從容自信也融入到今天發布的產品上。Google 在系統級 AI 集成方面的成熟度,使其在圖像處理、語音助手和智能搜索等領域的表現尤為出色。就拿蘋果和 Google 在 AI 功能上的效果來說,蘋果有升級版 Siri,Google 有更自然對話的 Gemini Live,蘋果 Image Playground 允許用戶在資訊等應用中創作圖像,生成素描、插圖和動畫等樣式的圖像,而 Google Pixel Studio 也允許用戶創作個性化的貼紙……甚至 Google 的 Add Me 功能通過 AI 集成不同照片中的人,確保每個人都能出現在合影中,也都是相當實用的功能。基於這些先發底氣,這或許也是 Google 在發布會上明里暗裡頻繁 cue 蘋果的重要原因。不過,即便去年 Google 先蘋果一步推出了搭載不少 AI 功能的 Pixel 8 系列,但市場反應並非總是與技術進步成正比。一份來自國際數據公司 IDC 的報告顯示,2023 年 Pixel 手機在美國市場的份額僅為 4.6%。這也反映了當下 AI 手機的痛點:AI 功能固然重要,但尚未成為絕大多數消費者決策的核心因素。而在端側模型的能力還沒突破到一個理想的水平之前,所有硬體廠商都要面臨的問題是,長久以來依賴雲端模型實現的 AI 功能,比起端側模型整合在系統層面上的體驗還要遜上一籌。Google 的翻身仗或許還要再晚上一陣,但憑藉軟硬體的技術閉環,誰也指不准 Google Pixel 會不會很快就攻守易形態也,而這同樣也是其他全力押注 AI 手機廠商的最大野心。文 | 周奕旨 莫崇宇