2022年11月30日,ChatGPT正式面向全球發布,AIGC浪潮由此席捲而來。
實際上,AIGC技術由來已久。
1957年,Lejaren Hiller和Leonard Isaacson通過將電腦程序中的控制變量改為音符,用電腦創作了音樂作品《Illiac Suite》。
2014年,美國《洛杉磯時報》記者Ken Schwencke通過編寫的算法程序,僅用3分鐘就完成了當時洛杉磯發生的一場4.4級地震的新聞報道。
那麼,當下AIGC又有了怎樣的顛覆式技術?處於一個怎樣的發展階段?產業應用如何?以及存在哪些風險?
針對這些問題,我們與中國信通院雲計算與大數據研究所副總工程師王蘊韜進行了一次深度對話,從他哪裡找到了這些問題的答案。
中國信通院雲計算與大數據研究所副總工程師 王蘊韜
大模型,再次喚醒AIGC
「和傳統基於深度學習技術的AIGC相比,以GPT為代表的生成式大模型在去年年底的出現,直接將AIGC內容質量和好用程度提升到了一個新高度,AIGC這把火由此也再次被點燃。」這是王蘊韜看到的行業變化。
大模型的出現,對各個行業都帶來了不可忽視的影響,AIGC產業也不例外。
這其中AIGC的「C」,不僅僅是指OpenAI的ChatGPT帶火的「chatbot」中的文本內容,還包括諸如圖片、影片、代碼等內容形式。
尤其過往十年人工智慧技術的快速發展,讓人工智慧技術在諸如圖像/影片修復、低代碼等領域有了一定的應用,大模型的到來才能進一步對這些產業形成一次顛覆。
關於這次對於人工智慧的技術顛覆,王蘊韜將其中的直觀感受總結為「可用」到「好用」。
對此,他進一步指出:
因為人工智慧技術路線一直是在仿人類的神經元功能演進的,在這之中,我們經歷了「低仿」到「高仿」的發展階段。
此前基於深度學習的人工智慧,是通過CNN、RNN網絡,先是做一個線性變換,再經過一個激活函數,從而實現「低仿」人類神經元的算法模型。
現在再度火起來的AIGC背後的根技術是Transformer,有點類似編碼器和解碼器,通過將編碼和解碼放在一起,從而同時吸收更長的字符串(token)來做相關的任務處理。
從深度學習到現在的大模型,我們用的依然是廣義上的深度神經網絡,只不過這個深度神經網絡基本單元發生了變化。
大模型的出現,改變了構成AIGC的基本單元,讓AIGC從「可用」跨越到了「好用」階段。
AIGC造「血」,行業內容湧現
2023年是大模型的戰場,在這個戰場上,悄悄進行了兩場軍備競賽。
第一場是關於通用大模型,包括國外的微軟、谷歌、亞馬遜,以及中國大陸的BAT等科技巨頭,都加入到了這場競賽中。
他們通過引入規模龐大的公開數據集、通過預訓練,形成了通用大語言模型。
王蘊韜稱,這個通用大語言模型,實現了大模型從0到1的構建,但實際上是「0.5版大模型」。
之後在行業大模型的競賽中,真正適合深入到應用階段的大模型才開始出現。
關於後者,王蘊韜稱,大家主要是基於「0.5版大模型」在微調,通過不斷灌輸行業知識,增加與人類專家的交互,從而將「0.5版大模型」調試得更加好用。
經此「歷練」,AIGC最終有機會進一步深入到各個行業,為各行各業造「血」。
「所有行業都需要生產內容,實際上,如今的AIGC已經在金融、電商、影視、傳媒等領域開始被規模應用。」
以影視和傳媒領域為例,這一領域各類機構和企業的核心競爭力就是提供內容,這些機構如果能夠通過AIGC低成本高質量生產內容,必然會形成一次產業顛覆。因此,我們能夠看到,現在影視行業已經在用AIGC進行後期製作,例如AI換臉就是已經被大家熟知的熱門應用。
再如在電商領域,其中的直播帶貨、客服諮詢等環節所需要內容服務都是AIGC最擅長的,而AIGC在電商內容生成上已經達到了非常理想的效果,尤其是人類很難實現的諸如直播帶貨中的24小時不間斷貨品推薦,已經在通過AIGC來實現。
據王蘊韜的觀察,「實際上,在教育、工業、醫療、法律、農業、設計、軟體,軟體編寫上,AIGC也確實已經遍地開花。」
大模型評估標準難題
AIGC及其背後大模型的到來帶來的另一個難題是,如何建立起一套全新的評判標準。
在此之前,AI模型和算法經過幾十年的發展,已經形成了一套成熟的評判標準,不過王蘊韜告訴我們,這套標準並不適用於現在的AIGC和大模型。
此前學術界會先搭建一個評測數據集,通過將這個數據集放到不同模型中並對比輸出結果,以及與相對原有數據集的差異,從而判斷AI模型的能力,諸如斯坦福等高校都是這方面權威評測機構。
然而,「這樣的評測方法僅適用於原來判別式的AI模型,無法對現在生成式AI有一個很好的評測效果。」
從目前來看,中國大陸對於大模型和AIGC一些場景應用的評測及標準,尚且處於探討和研究階段,據王蘊韜透露,「信通院專門針對大模型和AIGC的評測評估標準做了不少探索性工作,但目前這些標準主要還是圍繞功能性指標,包括一個AIGC應用全生命周期實現哪些功能,這一塊我們已經梳理出來了。」
但是針對AIGC背後大模型的性能有怎樣的突破,這仍是一個行業難題。
「大模型每次生成的東西都會有明顯的差異,如何判斷每次輸出都不一樣的開放性輸出和預想的輸出的契合度有多少,這是目前評測最難實現的點。」
王蘊韜表示,「目前我們只能通過主觀評價指標才能確定大模型究竟在性能上有多少提升,而針對相似度評估,整個產業界依舊非常欠缺。」
除此以外,王蘊韜還特別指出,如何讓大模型可管、可控,安全地工作,同樣是現在亟需解決的一個問題。
尤其是對於實時性、安全可控有高要求的行業和場景,現在尚且難以很好地應用AI大模型,「因為你完全無法預料大模型會輸出怎樣的結果。」
實際上,早在2021年,大模型剛剛興起時,產學研各界就已經注意到了人工智慧的安全可信,「我們當時做出過一個判斷:人工智慧已經進入到產業發展和治理重要度相同的新階段。」
「原來大家都只是盯著產業發展,只踩油門,不踩剎車,現在來看,因為它在賦能垂直行業過程中會產生很多倫理相關的問題,確實已經進入到了一個新階段。」
正因如此,在大模型進入對地域性、安全性較高的行業時,也出現了私有大模型這樣獨特的應用,尤其在數據安全越來越被重視的當下,私有大模型也成了通用大模型、行業大模型之外,一個更具時代特色的大模型。
現在全球對於到底什麼樣的AI是合乎科技倫理的、是可信的已經基本達成一定的共識,但是現在需要將這些宏觀的、抽象的要求轉化為企業真正在開發產品時落實的一個準則。
AIGC需要被再次顛覆
大模型帶來的技術顛覆,為人工智慧技術創新帶來了新的範式,但第一波賺到錢的,依然是「賣鏟子的人」。
王蘊韜表示,「通過堆算力的方式『堆出來』的大模型效果已經很不錯,但從商業角度來看,訓練成本和推理成本之高,消耗電量和算力之大是難以想像的。因而,現階段大模型解決的問題帶來的效益遠比它的成本投入要低。」
王蘊韜認為,針對大模型的商業化,接下來還需要供需方朝著兩個方向發力:
第一,從供給側來看,現在的大模型還有進一步壓縮成本、提高性價比的空間。
大家已經意識到了以Transformer為代表的根技術還存在很大的問題,例如每增加一個token,它需要的算力是呈指數級增長的,對於由此帶來的成本,同樣如此。因此,從供給側來看,目前仍然有很大的提升空間。
第二,從使用側來看,現在AIGC做得最好的往往是企業自身數字化轉型程度很高的,提升自身數字化程度也就成了企業高效應用AIGC的一個必然前提。
如果想要在更廣泛的領域去應用AIGC技術,我們就需要這些領域在自己的數字化方面有更好的基礎建設,這個基礎的提升同樣需要大量的資金、人力和時間的投入,先擁有更高數字化建設基礎的企業和行業,也將先受益於AIGC技術紅利。
而談到當下大模型的技術路徑,王蘊韜也特別指出,現在已經有高校和機構意識到了商業化的問題,開始思考區別於Transformer的新的技術路線。
他指出,「從『好用』到『高效』,AIGC在未來也許會再經歷一次或多次技術範式的顛覆。」