宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

商湯日日新大模型+大裝置:解決行業痛點加速智能應用

2023年04月11日 首頁 » 熱門科技

「苟日新,日日新,又日新」商湯王勵精圖治將此言刻在自己的澡盆上提醒自己清潔身體也要警醒思想。一千兩百年後被儒家經典《禮記·大學》收錄其中,強調人們要及時反省、不斷革新。時光荏苒斗轉星移,又隔了近兩千六百年,2023年4月10日,商湯科技發布了自研的大模型,命名為「日日新」。

正如商湯科技董事長兼首席執行官徐立博士所言:「如今的大模型發展也是日新月異,模型訓練的參數以及千億記,每周以百倍的token量在增長。商湯今年的目標是訓練萬億參數的大模型,這個大模型能支持增量的訓練,同時要把訓練成本降低90%。這背後靠的是AI算力『大裝置』的支撐。利用『日日新』大模型未來將開放商湯的模型超市、模型工具,提升開發者的效率,賦能各行各業的智能化。」

商湯日日新大模型+大裝置:解決行業痛點加速智能應用

此次商湯科技發布了基於大模型的六大產品及能力:包括自然語言的商量、體現繪畫能力的秒畫、創建虛擬數字人能力的如影、構建城市級大尺度數字孿生的瓊宇、針對3D資產生成的格物以及數據智能標註系統明眸。

商湯日日新大模型+大裝置:解決行業痛點加速智能應用

關注行業痛點 發揮AI優勢

AI對話是最近大家經常談到、用到的大模型產品。商湯自研的自然語言大模型叫「SenseChat」。 徐立認為:「自然語言大模型的能力就是在於說你跟他的互動之間挖掘出解決問題的方案。它不是一個單純的問答,而是通過多次互動得到你想要的答案。」徐立幽默地形容:「我們的slogan就叫:有什麼問題『商量』都能解決。」

商量所對應的場景除了自然語言的交談,編故事、寫文案,還可以應用在醫療等專業的垂直領域。基於海量醫學知識的導診、問診、健康諮詢、輔助決策等多場景多輪會話能幫助提升醫院的診療效率以及幫助患者快速定位病症並正確找到病症所屬的科室和基本的解決方案。

數字時代,代碼能力是很多企業的核心競爭力。如何產生高質量的代碼是企業關注的重要問題。徐立尤其看重AI在代碼能力的表現。徐立認為:「這將大幅提升企業的生產效率。」他大膽預測:「AI For AI將改變軟體行業的二八定律。原來20%的代碼來自於公共庫,80%的代碼需要由人來寫。但未來,80%的代碼是通過提示詞由機器生成、衍生出來, 只有20%是通過人來最終整合。未來的程序員掌握了與AI交互編程的能力,就可以利用整個公司多年來積累的知識與經驗,生產效率必然大幅提升。」

徐立這樣的預測是根據真實的測試得到的。他表示:「我們的程序員日常辦公就用AI代碼助手,效率提升了62%,代碼一遍通率達到了40.2%。很多企業擔心自己的代碼流失,可以通過API調用的方式,企業不用擔心自己的代碼庫共享到外面去,並可以做增量訓練,還可以很好地完成代碼的補全、擴寫、翻譯、重構、修正、注釋,代碼複雜度分析、測試用例等任務。」

企業數字化營銷需求越來越大,內容創作中大家對圖片的需求既大也高。首先是圖片需求數量大、內容能用圖的絕不用字,其次是風格多樣,什麼二次元、油畫風、國潮范五花八門,最後是圖片要求質量高,既要構圖新穎、又要有細節的體現還要有景深層次展現出畫面的張力。秒畫就是針對這種繪畫要求的創作平台。然而相比於其他AI繪畫平台,秒畫平台的一大特色就是可以省去創作者思考如何寫提示詞的時間與精力。秒畫平台包含了很多風格的圖片庫,創作者除了看到圖片還能看到這張圖片的各種描述,甚至衍生的各類風格描述也可以看到,這樣創作者就可根據這些已生成的圖片和提示詞再進行二次加工,就可以快速生成自己所需的圖像。

如果遇到庫里沒有的風格,還可以通過LoRA(Low-Rank Adaptation,大型語言模型的低階自適應)方式再學習,通過你給的少量(約20張)的圖片讓模型做適當修改,形成你所期望的風格。LoRA的優勢在於讓大模型可以對特定任務進行微調,然而並不增加大模型在存儲方面的負擔,可以高效地進行任務的切換,同時不會帶來推理延遲的問題。

數字人如今成為了很多企業對外宣傳、直播帶貨的利器。商湯如影平台就是幫助這些企業製作虛擬數字人形象的平台。徐立特別介紹,:「如影這個名字就是『商量』給起的。『商量』說數字人來自如影隨形這個詞。」虛擬數字人既是人也不是人,但總跟著人與人形影不離。

通過5分鐘的手機拍攝影片就可以生成一個容貌逼真,能反映出你的音容笑貌的數字人。能結合AI文案,聲紋以各種題材,各種語言、各種風格、各種著裝去介紹產品、展現內容,為企業的營銷手段增添新形式。

瓊宇、格物則針對元宇宙上的數據資產的模型生成工具。瓊宇具備城市級大尺度的空間重建生成能力。生成的各類3D內容能夠在平台上進行再編輯再創作,通過海量高精度數字資產的生產,滿足影視創作、建築設計、商品營銷、數字孿生管理運營等行業需求。格物則針對虛擬物體進行精細化3D生成,可還原物體複雜的幾何結構、紋理、材質、光澤等細節信息,能做到實時高逼真渲染。

大裝置:千億大模型的幕後「英雄」

訓練千億大模型需要巨大的算力。徐立把這算力的重要性比作物理界的離子對撞機。徐立表示:「電子對撞機與人工智慧在1956年被同時提出,粒子對撞機已成為現代物理學重要的基礎設施,也是基礎設施中的大裝置。然而在如今動輒上千億的模型、甚至走向萬億規模的大模型背後同樣需要巨大AI算力的支撐。因此商湯把AI算力中心也稱之為AI的『大裝置』」。

商湯的『大裝置』坐落在上海自貿區臨港新片區。其總投資約56億元,由27000塊不同類型、不同型號的人工智慧專用的計算卡組成,總算力達到5000 Petaflops(1 Petaflops為每秒千萬億次浮點運算)。

很多人認為,算力就是計算資源的堆積,是暴力美學的成功。然而在商湯科技聯合創始人、主管SenseCore AI大裝置的楊帆看來,資源的堆積只是必要條件但不是充分條件。

楊帆表示:「只要肯花錢,堆積計算資源很容易。如果要把幾千張、上萬張計算卡連起來針對同一個大模型進行訓練就不是一件簡單的事,他需要大量的軟體工程和技術能力才能做到。」

「現在網上有大量的數據可以收集,但如何將這些數據提供給模型,以怎樣的順提提供給模型、以及以怎樣的數據質量、數據標提供給模型都需要具備大量知識和認知的沉澱,最終才能訓練出一個好的模型。」

目前商湯的『大裝置』不僅自用還為諸多行業提供了算力支持,包括智慧商業、智慧城市、智慧生活和智能汽車,並與眾多科研院所和高校展開了合作。

數據飛輪與智慧飛輪雙輪驅動:實現數據感知閉環和決策閉環

商湯日日新大模型+大裝置:解決行業痛點加速智能應用

由人工智慧大模型引發的海量開放的任務也帶來新的研究的範式。商湯科技首席科學家王曉剛認為,「基於超大的多模態基模型,通過人類的反饋以及強化學習,將不斷解鎖新模型的新能力。」

「通過模型與人的互動,將產生有智慧的內容,實現人機共治。現有的AI體系從前端獲取大量數據進行標註,更新模型,通過更新的模型反饋到前端能獲取高質量的數據實現了數據飛輪。"

「通過人與模型的互動,模型將不斷理解人的意圖,模型就會輸出更加高質量的內容。這樣就形成了智慧的飛輪。在這兩個飛輪的相互促進下,將實現感知和鞠策的閉環。」

以自動駕駛為例,王曉剛表示:「利用多模態的大模型生成大量的實景圖片,用環視的感知的數據,以及多模態的數據作為我們大模型的輸入,實現感知決策一體化的集成。在輸出層,通過環境的解碼器去重構汽車的3D環境,通過行為解碼器預測路徑規劃,以及動機的解碼器去解釋自動駕駛的動機。在這個大模型的推動下將來的自動駕駛的系統將是更加安全可靠,並且有可解釋性,也更加接近人的駕駛的行為預判斷。」

「因此在大模型的加持下,就能實現感知和決策數據的閉環。能大大提升數據的標註的能力。在人工智慧 1.0 的時代,主要依賴於人工標註,時間長、成本高,現在我們可以基於大模型實現自動化的標註,成本只有原先的百分之一實現快速疊代與優化。」

天有嚴寒酷暑,水有潮起潮落。AI的發展也是長江後浪推前浪:1956年的達特茅斯會議掀起了人工智慧的第一個浪潮,此後是專家系統、阿爾法狗、神經網絡,如今是大模型,每一浪來得都更急更洶湧。有人認為AI已經死在了沙灘上,有人則認為它是一輪紅日正當頭,不管你如何看AI,如果有助於降本增效,我們就應該大膽嘗試——日日新,又日新。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2024 | 服務條款 | DMCA | 聯絡我們