一年一度Cloud Next 2024大會上,Google公開Gemini及其他模型最新進展。
Gemini 1.5 Pro模型提供128K token、1000K token兩種上下文長度,Google Cloud客戶可用它處理大量資訊,包含1小時影片、11小時音頻、超過3萬行程序代碼,或者70萬個以上字詞。
Gemini依照模型大小分Ultra、Pro、Nano三種,Gemini 1.5 Pro在Gemini屬於中量級,但在性能測試上已經超越規模最大、性能最強的Gemini Ultra 1.0。現在Gemini 1.5 Pro進入公開預覽版階段,通過Vertex AI、AI Studio平台提供大眾使用。
此外,Gemini Code Assist是Google專為企業客戶打造的AI程序代碼編寫輔助功能,測試下發現完成一般開發工作所需時間加快40%。隨著Gemini Code Assist導入Gemini 1.5 Pro,運用最高1000K token上下文長度處理大量數據,以提供更準確的程序代碼建議。
(Source:Google Blog)
Imagen 2模型具備多種圖像生成功能,可協助企業客戶產出符合品牌需求的AI圖像,加上SynthID數字浮水印,也能幫助強化受爭議停用的Gemini圖像生成功能。
現在Imagen 2進一步提供文本轉即時圖像(text-to-live images)功能,幫助營銷和創意人員輕鬆產生如GIF的4秒動畫,同時配備安全篩選和數字浮水印。這類似於Runway、Pika等AI生成剪輯工具,但目前Imagen 2生成的解析度僅360×640,Google承諾未來改善這一點。此外,Google也為Imagen 2推出高端圖像編輯功能,包含圖像修復、圖像擴展。
Our generative technology Imagen 2 can now create short, 4-second live images from a single prompt.It's available to use in@GoogleCloud's#VertexAIplatform. →https://t.co/CLMN3wNmeP#GoogleCloudNextpic.twitter.com/B4RocdDXrk
— Google DeepMind (@GoogleDeepMind)April 9, 2024
Imagen 2加入可產生GIF動圖的文本轉即時圖像功能。
(首圖來源:Google Blog)