AI已經憑藉卓越的現實表現,證明了自己顛覆行業、加速科學研究的力量。而目前最具開拓性的AI研究領域,當數基礎模型與生成式AI——在其支持下,電腦能夠根據輸入數據生成大量原創內容。這項技術已被用於創作音樂、繪畫乃至虛假新聞等各種素材。
近期,OpenAI免費發布了最先進的生成式transformer模型ChatGPT。此子一經亮相便引發媒體的廣泛關注與用戶的真誠讚賞,再次凸顯出人工智慧的可觀潛力。
面對OpenAI旗下GPT-3系列模型帶來的巨大衝擊,谷歌和微軟也紛紛拿出各自的搜尋引擎AI集成計劃。OpenAI的破圈效應無疑會提升公眾對未來更先進AI產品的預期和需求,ChatGPT掀起的這股風潮也成為技術行業史上最快、最重大的顛覆性變革。
但一切科技皆當以人為本。在本文中,我們觀察了AI在創造新型抗生素及其他科學AI工具方面的實際應用,證明了AI拯救生命的潛力。基礎模型與生成式AI的創新,也將讓增加收入、優化流程和簡化知識創造/積累成為可能,同時挽救全球數以百萬計的生命。希望本文能帶大家了解AI中蘊藏的巨大潛力,同時感受到進一步擴大AI開發與部署的重要意義。
從簡單算法到突破性進展
人工智慧(AI)這個誕生於1950年代的概念其實背景並不複雜,當時代表的就是為了解決特定任務所設計出的簡單算法和數學模型。經過幾十年的發展演變,AI於1990年代迎來了向著機器學習算法的重大轉變。機器學習算法使得電腦能夠分析數據模式,並將這些知識轉移到新的應用場景以提高性能表現。這種轉變旋即引發了領域內眾多突破,包括深度學習算法的開發——這類算法徹底改變了電腦視覺與自然語言處理(NLP)的實際產出。由此帶來的新成就,又反過來堅定了人們探索AI潛力的信心。
如今,AI研究人員已經開發出能夠處理更多複雜任務的新算法和模型,不斷探索著智能科學的新邊界。AI與模型正以前所未有的速度發展,產生更像人類的反應,並不斷拓展可行的任務執行範圍。在自然語言處理、電腦視覺和機器人技術等領域,一個個前所未見的目標被達成。儘管仍存在局限和挑戰,但AI已經證明自己有資格成為跨各個行業和領域的變革性力量,全面涵蓋醫療保健、金融、交通和教育等。
IBM Master Inventor推動的前沿AI研究
IBM掌握著全球規模最大、資金最為充足的AI研究項目之一。最近,我們有幸與IBM研究院的主要研究員、IBM Master Inventor(發明大師)兼主管Payel Das博士討論了他主導的項目。
Das博士曾任哥倫比亞大學應用物理與應用數學系(APAM)兼職副教授,目前是石溪大學應用數學(AMS)的顧問委員會成員。Das博士本科就讀於印度加爾各答總統學院,碩士畢業於印度欽奈的印度理工學院。她隨後在德克薩斯州休斯頓的萊斯大學獲得理論生物物理學博士學位。Das博士曾參與合著40多篇同行評審論文,獲得哈佛貝爾弗中心TAPP 2021與IEEE開源2022獎項。在IBM之內,她先後拿下IBM傑出技術成就獎(IBM最高技術獎項)、兩項IBM Research Division獎、一項IBM Eminence and Excellence獎以及兩項IBM發明成果獎。
作為可信AI部門成員與IBM研究院生成式AI負責人,Das博士目前專注於開發新的算法、方法和工具,助力打造更多由基礎模型建立的生成式AI系統。
她的團隊還致力於通過合成數據提高AI模型的可信度,確保下游AI應用獲得更好的公平性和穩健性。
合成數據——推動AI發展的重要力量
在如今這個數據驅動的時代,合成數據已經成為AI模型測試與訓練中的重要工具。這類由電腦生成的資訊擁有更高的成本效益、具備自動標記,而且避免了用真實數據訓練深度學習模型所引發的道德、保障和隱私等爭議。
合成數據在業務應用中也發揮著至關重要的作用,能夠在真實數據匱乏甚至缺失時提供解決方案。合成數據的一大優勢在於能夠批量生成,這使其成為AI模型訓練的理想選擇。此外,還可以通過設計讓合成數據包含各種變體和示例,從而提高模型的泛化度和可用性。在這種種特性的加持下,合成數據成為推動AI發展和實際落地的關鍵工具。
更重要的是,純生成的合成數據能保證遵守用戶定義的控制要求,從而達成預期目標並將潛在風險降至最低。具體的控制要求取決於預期應用和預期的結果。只要確保合成數據與控制要求保持一致,模型在後續的實際應用中將獲得更好的有效性和安全性。
通用表示模型正在塑造未來
Transformer模型已被廣泛用於各種應用場景,並被證明對處理自然語言等複雜數據具有奇效。
最初的AI模型使用的是前饋神經網路,雖然在非序列數據建模方面表現不錯,但卻不具備處理順序數據的能力。為了克服這個限制,卷積神經網路(RNN)在1990年代被發明了出來,但直到2010年左右才得到廣泛實施。
這一技術突破擴展了AI處理順序數據的能力,也為該領域的進一步發展鋪平了道路。之後亮相的是transformer——這一AI模型家族從根本上提高了AI的執行能力。
Transformer模型首次出現在2017年穀歌發表的一篇研究論文當中,其中提出一種新的神經網路架構類型。Transformer還結合了自注意機制,讓模型能夠專注於輸入中的特定部分,藉此做出更準確的預測。
正是所謂自注意機制,將transformer與其他編碼器-解碼器架構模型區分開來。事實證明,這種機制在自然語言處理中特別有用,能讓模型掌握句子中各單詞之間的關係,並識別出相距較遠的上下文關聯。Transformer能根據與任務之間的相關性,為序列中的各個元素分配權重。如此一來,模型就能優先考慮其中最重要的部分,從而產生更多的上下文認知和明智的預測/決策。自注意機制的集成,極大改善了AI模型在自然語言處理領域的表現。
根據Das博士的介紹,近年來RNN已經不再是自然語言處理領域的首選架構。這是因為RNN往往難以訓練,而且可能出現梯度消失問題,這就讓對語言數據中相距較遠的上下文間的關聯學習變得極具挑戰。相比之下,transformer已被證明能更有效地在各類自然語言處理任務上,帶來遠超同儕的先進性能。
釋放基礎模型的力量
憑藉大規模數據加自監督技術訓練出的模型,能夠產生不特定於任何既有任務的通用表示。這些表示能夠在其他應用場景下直接使用,無需再做進一步微調。
這些模型被稱為「基礎模型」,此術語最早由斯坦福大學在2021年的一篇研究論文中提出。當今眾多基礎模型都採用了transformer架構,並被證明在廣泛的自然語言處理(NLP)任務中具備通用性。這是因為它們利用海量數據集完成了預訓練,從而生成了強大的可部署機器學習模型。基礎模型的出現,極大影響並改進了自然語言處理技術的整體面貌。
Das博士和IBM研究團隊,也參與了大量涉及基礎模型和生成式AI的研究工作。
上圖所示為以文本作為輸入數據,使用基礎模型面向不同領域構建模型。其可能使用,也可能不使用transformer架構。圖左所示為大語言模型,它能逐步將字母映射至單詞、句子乃至最終的語言。
圖右所示為化學transformer模型,它將原子與分子和化學結構聯繫起來。只要將生物或化學分子表示為文本,即可使用相同的概念來構建生物學或其他相關領域的基礎模型。
需要注意的是,transformer架構能夠適應多種領域,唯一的要求就是輸入數據必須能夠以文本形式表達。這種良好的功能泛用性,使得transformer架構成為多個領域創建機器學習模型的寶貴工具。
藉助生成式AI突破創造力的邊界
生成式模型能夠在各種應用場景下創造出新的、獨一無二的圖像/音頻/文本。這些模型還讓AI系統得以高效處理複雜數據,在廣泛的應用場景中為AI技術的落地開闢出新的可能性。
基礎模型同樣可以創建出生成式模型,因為後者的基本原理同樣是處理大量數據並從中學習。通過調整模型參數以專注於特定任務,例如生成圖像或文本,面向不同領域的全新生成式AI模型即可順利誕出。
例如,如果我們的目標是開發一套繪畫創作型生成式AI模型,則首先可以通過大量藝術圖像預訓練一套基礎模型。在訓練成功之後,它就能用於生成新的原創藝術作品。上圖所示,為用戶給出「人臉肖像」提示之後,由Dall.E2 AI程序生成的畫作示例。
克服生成式AI中的小數據挑戰
Das博士提到,「當我們第一次開始研究生成式AI時,突然想到如何從小規模數據中,學習任何特定領域或行業的應用知識。」
生成式AI模型往往需要大量數據才能準確學習和生成新的相似數據。在處理小數據集時,這類模型的性能和實用性往往會受到影響。Das博士很快意識到了這個挑戰,並發現遷移學習和數據增強等技術有助於提高模型在這類情況下的性能。
儘管小數據集確實困擾著生成式AI模型的應用,但對於上圖中的各個領域,企業其實已經掌握著大量未經標註的數據。這些數據完全可以訓練出自定義基礎模型,解決以往被認為無法解決的問題。這也跟IBM研究院專注於通過生成式AI探索AI新功能、突破AI科學邊界的思路高度一致。
更廣泛的生成式AI研究
IBM在圖中所示的各個領域都做出了重大貢獻。下面我們就簡單選取其中幾個方向。
使用生成式AI合成抑菌劑
AI有望徹底顛覆各個領域,並加速科學進步。例如,Das博士和她的研究團隊利用AI開發創新型抑菌藥物,藉此對抗致命性耐藥細菌。
抗擊超級細菌
抗生素從1940年代起,被首次用於治療嚴重感染。之後的幾十年間,抗生素挽救了數百萬人的生命並改變了現代醫學的面貌。然而,根據疾控中心的估計,每年全球的非必要抗生素治療多達4700萬例。
抗生素的過度使用已經引發嚴重問題,導致大腸桿菌、葡萄球菌等常見細菌以及金黃色葡萄球菌(MRSA)等更罕見的危險細菌出現了廣泛的耐藥性。由耐藥細菌引發的感染更難以治療,而且可能導致敗血症、器官功能障礙甚至是死亡等嚴重後果。
當傳統抗生素無法有效殺死細菌時,對感染的治療和控制將愈發艱難、甚至失去可能性。這些抗藥細菌被稱為「超級細菌」,可能迅速傳播並引發嚴重感染,令醫院等醫療機構成為交叉感染的重災區。超級細菌也可能存在於環境、食物和其他物體表面,或是在人與人間直接傳播。
面對這個威脅全球生命安全的重大問題,面對這個每年在世界範圍內造成70萬死亡的嚴峻挑戰,我們必須有所行動。到2050年,由超級細菌引發的死亡數字預計將增加到1000萬。
細菌如何戰勝抗生素
細菌和病毒能夠激活自己的先天防禦策略,通過使抗生素無效化完成向超級細菌的蛻變。這些防禦機制往往能令細菌逃脫或抵消原本對其致命的物理、化學或生物過程,包括產生使抗生素失活的酶、改變細菌細胞膜、使生物體對藥物的反應降低,或者從其他天然能夠抵抗抗生素的細菌處獲取遺傳資訊。
使用AI簡化藥物研發
用傳統方法開發出新的抗菌藥物是個漫長且昂貴的過程,往往需要耗時多年、投入大量資金。然而,AI的最新發展正在徹底改變藥物的研究和發現過程。
通過利用AI對眾多可能的候選藥物進行生成與評估,研究人員能夠快速查明最有希望的選擇,將寶貴精力集中在高價值目標身上。這將簡化藥物開發過程,降低相應的時間和成本,以遠超以往的速度推出更有效的抗菌藥物。
研究團隊提出的AI驅動方法能夠加速抗菌藥物設計,將整個周期控制在48天之內:IBM研究院,《使用可控深度生成模型與分子動力學加速抗菌藥發現》。《自然生物醫學》,2021年3月。
在Das博士及其團隊的協同努力下,有望解決細菌耐藥問題的創新解決方案正逐步成型。這項研究利用AI合成並評估了20種獨特的抗菌肽設計,最終入選的這些「種子選手」來自9萬個序列庫。
其中使用的AI模型是專為抗藥細菌這類用例所設計,結合了廣譜功效和低毒控制等要求,同時強調減緩耐藥性。這種方法帶來的解決方案不僅有助於對抗耐藥細菌,同時也將最大限度降低有害副作用,並防止目標產生更進一步的耐藥性。
該團隊針對各種革蘭氏陰性與陽性細菌進行了設計測試,最終確定了6種成功的候選藥物,並通過小鼠模型和試管完成了毒性篩查。
AI驅動下的全新可能性
Das博士對目前的成果深感欣慰,並表示其中體現了研究人員對下一代候選藥物提出的種種特性期待。隨附插圖所示,為AI加速抗菌設計過程的規劃和預期持續時長。整個過程只需一個半月即可完成,遠快於傳統上長達數年的漫長周期。
事實證明,利用AI加速抗菌藥物研發足以改變遊戲規則,大大降低研發周期和經費投入。另外,AI模型也能幫助研究人員釋放精力,專注於研究最有希望的線索。最後,生成式AI還能幫助科學家設計出繼承現有藥物優勢,同時功能更獨特、功效更出色的創新化合物。
IBM的研究人員正利用生成式AI簡化新型抗菌藥物的開發,並在AI的幫助下創建出MolFormer和MolGPT等高價值工具。這些工具可用於預測化學分子的特性,為藥物發現、材料設計等各類應用領域提供助力。
總結
如今,生成式AI已經在音樂、繪畫、醫療保健和製藥等各個領域引發關注,成為AI技術近期最激動人心的進步之一。儘管仍存在局限和挑戰,但AI確實展現出顛覆各個領域的巨大潛力。
它能夠迅速創造並測試出針對耐藥細菌和其他病原體的寶貴藥物,挽救更多病患於水火。
隨著近期OpenAI GPT-3測試的執以及谷歌和微軟的相繼跟進,新一年內不僅AI產品將全面爆發,又一輪突破也可能就此出現。融入市場的有意義AI成果,整個人類的前途就越是煥發光彩。
尾註:
有人可能會質疑,本文並未提到AI在人臉識別方面的應用。請注意,人臉識別技術跟GPT模型屬於功能和實現方法都全然有別的獨立AI技術。IBM曾是人臉識別領域的領導者,但考慮到由此引發的政治和隱私等問題,因此決定不再繼續探索這方面課題。但是,IBM仍然各級參與其他AI模式,例如語言處理、圖像識別、圖形分析、語音識別以及多模AI應用的各種組合。
這裡要具體介紹一下GPT-3發布後的市場反應。就目前的情況看,微軟的準備明確更為充分,而谷歌似乎被打了個措手不及。微軟已經規劃出如何將相關成果集成到運營體系當中,所以有望在市場上反超。之前兩家公司的搜索收入差距巨大,微軟2022年搜索收入總計220億美元,而谷歌去年單第四季度的收入就高達590億美元。考慮到GPT模型強大的搜索功能,令谷歌的總收入直降三分之一也並非沒有可能。
DALL.E2是一種前沿深度學習模型,能夠根據自然語言輸入生成數字圖像,以OpenAI GPT-3的一個版本為基礎。