宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

谷歌開源Gemma,為端側AI澆了桶油

2024年02月22日 首頁 » 熱門科技

2月21日,谷歌正式對外發布開源大模型Gemma。

這距離谷歌上一次大模型Gemini 1.5的發布,還不到一周的時間,事關大模型的競爭愈演愈烈。

2月15日,OpenAI發布Sora,Sora文生影片的能力,再度震驚整個行業。

彼時,就連此前在文生影片領域攪弄風雲的Runway、Pika等公司的創始人,也都不得不甘拜下風。

Sora在全球形成的「病毒式」傳播,再次證明了OpenAI奧特曼的天才營銷能力,也讓僅僅早於Sora兩小時發布的Gemini 1.5沒能在最佳傳播時間裡獲得本應屬於它的全球關注度。

谷歌開源Gemma,為端側AI澆了桶油

無論二者同期發布是奧特曼有意為之,還是一場意外,在巨頭之間的大模型競爭已經到了白熱化的現在,谷歌都需要再亮出一張底牌,重新贏得市場的關注。

顯然,昨天發布的Gemma就是谷歌的又一張底牌,不過,這次谷歌瞄準的是開源大模型。

這次谷歌發布的Gemma包含兩個「小」模型,Gemma 2B和Gemma 7B,由於參數規模分別為20億和70億,參數規模並不大,谷歌將這兩個模型歸為輕量級開放模型系列。

谷歌開源Gemma,為端側AI澆了桶油

值得注意的是,Gemma採用了和谷歌此前發布的主力大模型Gemini相同的技術架構,同時這也是一個可以直接下放到筆記本和台式機上運行的端側大模型。

在此之前,谷歌在2023年12月首次對外發布Gemini大模型時,谷歌CEO Sundar Pichai就一口氣對外公布了Ultra、Pro、Nano三個版本,並稱,「這些是進入Gemini時代第一個模型,也是Google DeepMind成立時的願景。」

這其中,Gemini Nano參數規模為1.8B和3.25B,正是被谷歌用作端側大模型。

實際上,在2023年更早些時候谷歌發布的Pixel 8 Pro,已經因顯著的AI特性被視為劃時代的智慧型手機,站穩AI手機潮頭後的谷歌,又在今年將Gemini Nano放到了三星Galaxy S24中,幫助三星進入到了「Galaxy AI時代」。

谷歌開源Gemma,為端側AI澆了桶油

至頂網認為,在手機廠商、PC廠商聯合晶片廠商一同全力推進端側AI的這一年,谷歌此次發布的2B、7B開源大模型Gemma,更重要的功效預計將會在端側AI領域體現出來。

從開源方面來看,谷歌Gemma並不是第一個開源大模型。

早在2023年7月,Meta就對外發布了免費可商用的大模型Llama 2,而這一動作其實是Meta和微軟合作的傑作,擁有7B、13B、70B三個參數級版本的Llama 2,當時被視為是OpenAI的ChatGPT的平替產品。

就在Meta開源Llama 2時,Yann LeCun不無感慨地公開表示,Llama 2的開源可商用將極大地改變大模型的市場格局。

谷歌開源Gemma,為端側AI澆了桶油

而從國內來看,阿里是另一個開源大模型的推動者。

2023年8月,阿里雲對外開源了通義千問7B大模型,成為國內最早推動大模型開源的企業,隨後,阿里雲又先後對外開源了14B、72B、1.8B參數規模的大模型,參數規模最大的72B版本,甚至超過了Llama 2。

谷歌開源Gemma,為端側AI澆了桶油

之所以科技巨頭願意開源大模型,是為了藉助開源力量,加速技術發展。

這自然也是谷歌此次開源Gemma的主要目的。

因此,就在谷歌Gemma對外開源時,谷歌還公布了Gemma對一系列開發工具和系統的支持,以及跨設備的兼容,具體Gemma的兼容和支持情況如下:

多框架工具:Gemma提供Keras 3.0、原生PyTorch、JAX和Hugging Face Transformers多個框架的參考實現;

跨設備兼容:Gemma模型可以在筆記本電腦、台式機、物聯網、移動設備和雲端等多個主流設備類型上運行;

硬體平台支持:谷歌與NVIDIA合作,可以使用NVIDIA GPU來優化Gemma模型;

基於Google Cloud的優化:Vertex AI提供廣泛的MLOps工具集,其中包含一系列微調選項和內置推理優化的一鍵部署功能。

基於此,谷歌搶先在Meta發布Llama新版本之前,終於推出了開源大模型,谷歌官方甚至將這一模型在關鍵基準測試集上的測試表現與Llama 2進行了對比,並得出了Gemma 7B完勝Llama 2 7B和13B版本的結論。

谷歌開源Gemma,為端側AI澆了桶油

不過,出門問問創始人李志飛就谷歌開源的Gemma指出,「時間有點晚」、「開源力度不夠」、「感覺這次開源還是被動防禦」。

他還提到,谷歌在AI領域經常起大早趕晚集,這次的Sora借鑑的ViT、ViViT、NaVit、MAGVit等核心組件技術都是谷歌團隊此前的論文。

當然,無論是「攻」還是「守」,Gemma最重要的還是表明了谷歌在AI領域的開源態度。

接下來的2024,關乎大模型的競爭,也將會愈演愈烈。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新