IBM與MIT攜手開闢計算研究新篇章

IBM近期與蘇黎世聯邦理工學院、伊利諾伊大學及麻省理工學院分別簽署了新的合作研究協議。

贊助商廣告

短短數年間，生成式AI已從新奇事物演變為全球數百萬人用於提升工作效率、激發創造力或處理重複性認知任務的實用工具。

David Cox以IBM麻省理工學院-IBM Watson AI實驗室首任主任的身份，親歷了這段歷史性變革。2017年IBM投資創建該實驗室時，AI大多運行於人們生活的幕後，負責預測銷售額、識別可疑信用卡交易和過濾垃圾郵件。

如今，AI已成為各界熱議的焦點，甚至能夠根據用戶提示，以播客或其他任意形式生成對話內容。無論生成式AI最終是否能像網際網路一樣帶來深遠變革，它已從根本上改變了內容創作、軟體開發乃至科學探索等諸多領域。

與此同時，新一輪技術革命正在醞釀，IBM與麻省理工學院也在積極擁抱這一變化。根據上周簽署的新協議，實驗室將把研究範圍擴展至量子計算領域，並更名為MIT-IBM計算研究實驗室，以體現其更廣泛的研究方向。

十年前，IBM率先將量子電腦接入雲端，此後不斷突破里程碑。本周在Think大會上，量子中心超算的最新進展得到重點展示，包括涉及逾12,000個原子的蛋白質模擬，以及與藥物研發和核聚變能源相關的研究成果。

隨著量子計算迅速成熟為科研實用工具，這一時刻與IBM當年攜手MIT創建實驗室時頗為相似——彼時ChatGPT尚未問世，AI的潛力隱約可感卻難以明見，數據整理和單一用途模型訓練的繁瑣工作限制了其大規模普及。

如今情形已截然不同。AI幾乎滲透到日常生活的方方面面，新一輪計算範式轉變也即將到來。目前主導IBM語言模型研究的Cox將與麻省理工學院的Aude Oliva共同帶領實驗室邁入新階段。

為此，我們與Cox進行了深入交流，探討實驗室下一步的發展方向、產學研合作的成功之道，以及爵士鋼琴如何成為他的創作出口與精神疏解方式。

贊助商廣告

實驗室為何選擇此時拓展至量子計算領域？

研究視野大幅拓展。量子計算正處於快速發展軌道，未來幾年內將變得極為強大，我對其與AI的交叉融合前景持樂觀態度。有一種常見誤解認為，量子電腦在所有類型的計算上都比普通經典電腦快。實際上，對於我們日常使用電腦處理的大多數任務，很難超越現代CPU或GPU。但對於某些重要類別的問題，量子電腦能夠提供經典電腦需要極長時間才能得出的解決方案。這意味著量子電腦的價值不僅僅在於"更快"，而在於它開闢了全新的可能性空間，讓那些經典計算需要數輩子時間才能完成的運算變得觸手可及。

實驗室創立之初，您是否預見到AI與量子將走向交匯？

我們知道兩者之間會有交集，但這兩項技術各自的發展速度都超出了我們最樂觀的預期。實驗室成立之初，我們有一些量子項目，大多停留在理論層面，但如今一切都變得具體可感。量子正在邁入"新"領域，它與AI的交匯令人振奮。

大語言模型的崛起如何改變了實驗室的研究文化？

實驗室早期，我們的工作更多帶有探索性質，像是在各種技術方向上廣撒網——包括生成式AI——播下可能日後開花結果的種子。如今，哪些押注奏效已一目了然。我們仍然進行探索性和逆向思維的嘗試，但生成式AI已改變了整體格局，我們的研究方向也隨之調整。我們將研究成果轉化為產品的能力也發生了根本性變化，可以從我們的研究中清晰地看到通向用戶和客戶所使用技術的直接路徑，這讓我們的工作價值更加清晰可見。

並非所有產學合作都能取得如此成效，秘訣是什麼？

有幾個關鍵因素。最重要的是IBM在麻省理工學院校園內建立了實體研究存在。IBM還引入了真正懂行的專業人才。如果只是把錢丟過去，是行不通的——你必須有人在現場，並肩工作，讓學生能夠經常走動交流。十年期的承諾至關重要，因為這讓我們有時間建立深厚的合作關係。一位麻省理工學院教授說，他喜歡與我們合作，因為我們能引導他去思考有趣的問題。新想法往往源於嘗試解決他人從未攻克過的難題。我們有時能幫助麻省理工學院的同事發現他們此前從未考慮過的新問題，因為我們擁有不同的參照框架。從解決這些問題中獲得的認知不必過於側重應用，更多時候，所獲得的洞見具有相當普遍的意義，在科學上本身就頗具價值。

贊助商廣告

是什麼促使您離開哈佛大學的教職，加入IBM？

即使在我擔任教授期間，AI研究就已越來越多地向產業界集中，原因在於研究所需的資源規模。此後這種趨勢愈演愈烈。與其完全離開學術界，不如擁有一座連接兩者的橋樑，這對我更有吸引力。我也被這個機會從零到一的特質所吸引。多年來我聯合創辦了幾家公司，從無到有構建新事物所帶來的成就感令人無比滿足。同時，雖然實驗室是新的，但許多方面對我來說並不陌生——我在麻省理工學院完成了博士學業，因此這也有幾分回家的感覺。

您會建議今天的學生選擇業界而非學術界嗎？

我認為這並非非此即彼的選擇。一些業界工作確實是單程票，但至少在我們這裡，我們專注於推進技術前沿。從這裡走出去的人，其作品集和簡歷對於獲得教職都頗具競爭力，兩者之間可以相當靈活地轉換。即便是全職教授，也會選擇去業界休假進修或以其他方式參與其中。

據說您從學會閱讀就開始編程，這是怎麼回事？

我父親在DEC公司工作，在那個年代把一台電腦帶回了家。那是一台DECmate，螢幕散發著熒光綠的磷光，深深吸引了我。那時能寫的程序非常有限，全是文字界面，但正是這種限制讓編程變得有趣，因為你必須想出聰明的解法才能讓它做出有趣的事情。

您曾提到大語言模型領域正在出現一條類似摩爾定律的新規律，這是什麼意思？

我們和其他人都注意到，語言模型的規模與能力之間存在一個相當規律的趨勢：語言模型的"能力密度"隨時間以可預測的節奏持續提升。簡單來說，昨天700億參數的模型，今天70億參數就能達到同等能力。一年後，你可以構建一個規模縮小十倍、卻與大模型同等能力的模型。在某個節點上，繼續追求超大規模的競爭將變得得不償失——贏得這場競爭代價高昂，而領先優勢也轉瞬即逝；身後總有一批更小的模型，以低得多的成本實現同樣的效果，且時間差不過短短數月。

贊助商廣告

AI最終會更像軟體嗎？

AI模型令人驚嘆，但它的不可預測性有時令人頭疼，這一點與常規軟體截然不同。我們希望找回從傳統軟體遷移到大語言模型時所放棄的部分電腦科學嚴謹性。軟體有其原則——一致性、封裝性、抽象性和形式化保證。當你的"程序"變成一段自然語言提示詞，這些特性就消失了。你甚至無法在兩個不同的大語言模型之間移植，因為沒有人能精確描述它們之間的差異。我們現在可以用自然語言編寫指令，這是以前做不到的，但我們認為可以將軟體的可靠性與抽象性，與大語言模型帶來的"魔力"結合起來。

兼顧軟體的可靠性與AI的即興"魔力"——這就是IBM Mellea項目背後的理念嗎？

Mellea致力於構建一個類似系統編程的層級，供開發者貢獻創意。你編寫代碼調用某個函數，這個函數可能會提示模型執行某項操作，或激活一個適配器，並自動解析結果。Granite庫本質上就是這樣的存在——它們是一組可供調用的函數，例如詢問"我即將發送給用戶的這個答案是否是幻覺"。該函數可能調用大語言模型來判斷答案是否有誤，或激活一個讓模型自行判斷的適配器。用戶無需了解函數內部的運作機制，他們只需要以最低的成本獲得正確答案。

據說您是一位嚴肅的爵士鋼琴演奏者，您的創作過程是怎樣的？

如果不是在創造前所未有的東西，我便提不起興趣。我從四年級開始學鋼琴，如果只是照譜演奏，我大概早就放棄了。爵士樂的樂譜只告訴你和弦走向和旋律，其餘幾乎一切都是即興發揮。通常你演奏一遍主題旋律——他們稱之為"頭"——然後即興演奏其餘部分，大家輪流即興，最後再演奏一遍主題，就此收尾。

這有點像大語言模型回應模糊提示詞的方式！您有過職業演出經歷嗎？

高中時我曾在一個四重奏樂隊演奏，其中兩位成員後來成為職業音樂家。我雖然從未參加新英格蘭音樂學院的招生試聽，但曾為我們的貝斯手在試聽時擔任伴奏。另外兩名成員則走上了科研之路。我記得父母問我：你確定要走科研這條路嗎？難道不想追求自己的激情所在？我說，天哪，不！那是一種艱辛的生活，而我有很多其他興趣。不過玩音樂很開心，最近我又開始大量彈琴了。

贊助商廣告

是為了放鬆嗎？

說實話，有些天感覺更像是驅魔儀式。這是一種我必須去做的事，我自己也說不清楚為什麼——不是百分之百清楚。更像是一種創傷後的宣洩。但確實，結束後我會感覺好多了。我無法完全用語言表達原因，但我隱約覺得，自己突然重拾音樂、重拾即興演奏，與當下這個技術時刻有某種內在關聯。空氣中瀰漫著某種東西，與創造有關。我不知道這一切通向何方，但我正在享受這段旅程。

Q&A

Q1：MIT-IBM計算研究實驗室為什麼要擴展到量子計算領域？

A：隨著量子計算技術快速成熟，IBM與MIT認為現在是將量子納入合作研究的最佳時機。量子計算並非對所有任務都更快，但對於某些特定類型的複雜問題，它能提供經典電腦幾乎無法完成的解決方案。此外，量子與AI的交叉融合也展現出令人期待的潛力，因此實驗室更名為MIT-IBM計算研究實驗室，將研究範圍正式擴展至量子領域。

Q2：大語言模型領域的"新摩爾定律"是什麼意思？

A：IBM研究人員發現，語言模型的能力密度會隨時間以可預測的節奏提升。簡單來說，今年需要700億參數才能達到的能力，明年用70億參數的模型就能實現。這意味著一味追求超大規模模型的競爭策略性價比越來越低，因為總會有規模更小、成本更低的模型在短時間內追上來，實現同等效果。

Q3：IBM的Mellea項目想解決什麼問題？

A：Mellea旨在將軟體工程的嚴謹性與大語言模型的靈活性結合起來。傳統軟體具有一致性、封裝性和形式化保證，但大語言模型缺乏這些特性，難以預測且無法跨模型移植。Mellea構建了一個類似系統編程的層級，開發者可以通過調用函數來觸發模型行為或激活適配器，用戶無需了解底層實現，只需獲得可靠的結果，從而兼顧AI的能力與軟體的可控性。