Gemini 1.5 Pro模型公開預覽，Imagen 2文本轉圖像可生成GIF動圖

一年一度Cloud Next 2024大會上，Google公開Gemini及其他模型最新進展。

贊助商廣告

Gemini 1.5 Pro模型提供128K token、1000K token兩種上下文長度，Google Cloud客戶可用它處理大量資訊，包含1小時影片、11小時音頻、超過3萬行程序代碼，或者70萬個以上字詞。

Gemini依照模型大小分Ultra、Pro、Nano三種，Gemini 1.5 Pro在Gemini屬於中量級，但在性能測試上已經超越規模最大、性能最強的Gemini Ultra 1.0。現在Gemini 1.5 Pro進入公開預覽版階段，通過Vertex AI、AI Studio平台提供大眾使用。

此外，Gemini Code Assist是Google專為企業客戶打造的AI程序代碼編寫輔助功能，測試下發現完成一般開發工作所需時間加快40%。隨著Gemini Code Assist導入Gemini 1.5 Pro，運用最高1000K token上下文長度處理大量數據，以提供更準確的程序代碼建議。

（Source：Google Blog）

Imagen 2模型具備多種圖像生成功能，可協助企業客戶產出符合品牌需求的AI圖像，加上SynthID數字浮水印，也能幫助強化受爭議停用的Gemini圖像生成功能。

現在Imagen 2進一步提供文本轉即時圖像（text-to-live images）功能，幫助營銷和創意人員輕鬆產生如GIF的4秒動畫，同時配備安全篩選和數字浮水印。這類似於Runway、Pika等AI生成剪輯工具，但目前Imagen 2生成的解析度僅360×640，Google承諾未來改善這一點。此外，Google也為Imagen 2推出高端圖像編輯功能，包含圖像修復、圖像擴展。

Our generative technology Imagen 2 can now create short, 4-second live images from a single prompt.
It's available to use in@GoogleCloud's#VertexAIplatform. →https://t.co/CLMN3wNmeP#GoogleCloudNextpic.twitter.com/B4RocdDXrk
— Google DeepMind (@GoogleDeepMind)April 9, 2024

Imagen 2加入可產生GIF動圖的文本轉即時圖像功能。

（首圖來源：Google Blog）