在這場最新的斯坦福課堂訪談里,Google 前 CEO 埃里克·施密特(Eric Schmidt)深入探討了人工智慧的發展方向、全球科技競爭的未來,以及這些技術如何在短期內對社會、經濟和國家安全產生深遠影響。
有趣的是,施密特在演講中途和學生表示,這場保密的會議內容萬萬不能外傳出去。然而組織者卻表示,本場會議已經採用全程直播的形式。
聽到回答的施密特瞬間愣住……很快,該影片也被斯坦福大學從 YouTube 撤下,但好在已經有不少手疾眼快的聽眾已經保存好了。

部分金句如下:

以下為 Web3 天空之城全文整理版
主持教授:
今天的嘉賓無需多做介紹。我第一次見到 Eric 是在大約 25 年前,當時他以 Novell 首席執行官的身份來到斯坦福商學院。
從那時起,他在 Google 擔任重要職務,從 2001 年開始,並在 2017 年加入 Schmidt Futures。此外,他還參與了許多其他項目,大家可以查閱相關資料。所以 Eric,如果可以的話,我就從那開始吧。
首先,你認為人工智慧在短期內的發展方向是什麼?我想你將其定義為未來一到兩年。
施密特:
事情變化得太快了,我覺得每六個月我都需要就即將發生的事情發表一次新的演講。這裡有一群電腦科學專業的學生,有誰能給班上的其他人解釋一下「一百萬個 token 上下文窗口」是什麼嗎?請說出你的名字,並告訴我們它的作用。
學生:基本上,它允許你用一百萬個標記或一百萬個單詞進行提示。
施密特:
所以你可以問一個百萬字的問題。Anthropic 是 20 萬 token,要到一百萬,等等。你可以想像 OpenAI 有一個類似的目標。
這裡有人能給出 AI 代理的技術定義嗎?再說一次,電腦科學。
學生:AI 代理可能是以某種方式行動的東西。它可能是在網路上調用東西,代表你查找資訊。它可能是沿著這個思路的許多不同的東西。在一個過程中有各種各樣的事情。
施密特:所以代理是執行某種任務的東西。另一個定義是它是一個 LLM、狀態和記憶。再來,電腦科學家,你們中有人能定義「文本到動作」嗎?
學生:不是將文本轉換成更多文本,而是讓 AI 根據此觸發操作。
施密特:
另一個定義是 Python 語言。我從未希望看到一種編程語言存活下來。AI中的一切都是用 Python 完成的。剛剛出現了一種名為 Mojo 的新語言,看起來他們終於解決了 AI 編程問題,但我們會看看它是否真的能在 Python 的主導地位下存活下來。
還有一個技術問題。為什麼英偉達價值 2 萬億美元,而其他公司卻在苦苦掙扎?
學生:技術答案是,大多數代碼都需要使用目前只有 NVIDIA GPU 支持的 CUDA 優化來運行,因此其他公司可以做任何他們想做的事情,但除非他們有 10 年的軟體經驗,否則你不會擁有機器學習優化。
施密特:
我喜歡將 CUDA 視為 GPU 的 C 編程語言,這個想法讓我感到滿意。CUDA 成立於 2008 年。儘管我一直認為它是一種糟糕的語言,但它卻占據了主導地位。還有一個值得注意的見解:有一組開源庫針對 CUDA 進行了高度優化,而其他任何庫都沒有做到這一點。所有構建這些技術堆棧的人在討論中完全忽略了這一點。這些庫在技術上被稱為 VLLM,還有許多類似的庫也針對 CUDA 進行了高度優化,這使得競爭對手很難複製。
那麼,這一切意味著什麼呢?明年,你將看到非常大的上下文窗口、代理和文本到操作的應用。當這些技術大規模交付時,它們將對世界產生巨大的影響,遠超社交媒體帶來的影響。
原因如下:在上下文窗口中,你可以將其用作短期記憶,我對上下文窗口的長度感到震驚。技術上的原因與服務和計算的難度有關。短期記憶的有趣之處在於,當你輸入資訊並詢問問題時,比如閱讀 20 本書並將書的文本作為查詢,然後詢問它們的內容,它會忘記中間部分,這與人類大腦的工作方式相似。
關於代理,現在有些人正在構建 LLM 代理,他們通過閱讀和理解化學等領域的知識,然後進行測試,並將其重新添加到他們的理解中。這非常強大。
第三個方面是文本到行動。我給你舉個例子:假設政府正在試圖禁止 TikTok。如果 TikTok 被禁止,我建議你對你的 LLM 說以下的話:為我複製 TikTok,將我的偏好放入其中,在接下來的 30 秒內製作這個程序並發布它,然後在一小時內,如果它沒有流行起來,就做一些類似的事情。這就是命令。你可以看到這有多強大。
如果你可以從任意語言轉換為任意數字命令,這在本質上就是這個場景中的 Python。想像一下,地球上的每個人都有自己的程式設計師,他們實際上做他們想做的事情,而不是那些不按要求工作的程式設計師。
這裡的程式設計師知道我在說什麼。想像一個不傲慢的程式設計師實際上做了你想做的事,而你不必付出高昂的代價。而這些程式設計師的供應是無限的。
教授:這一切將在未來一兩年內發生?
施密特:
很快。以上三件事,我確信將在下一波浪潮中同時發生。所以你問還會發生什麼。每六個月我都會波動一次,所以我們處於奇偶振盪狀態。
目前,前沿模型(現在只有三個)與其他模型之間的差距似乎越來越大。六個月前,我確信這種差距正在縮小,因此我在一些小公司上投入了大量資金。然而,現在我對此不太確定了。
我正在與一些大公司進行對話,他們告訴我,他們需要 100 億、200 億、500 億甚至 1000 億美元的資金。星際之門項目需要 1000 億美元,非常困難。
我的好朋友 Sam Altman 認為,這可能需要大約 3000 億美元,甚至更多。我向他指出,我已經計算了所需的能量。
為了全面公開,我在周五前往白宮,告訴他們我們需要與加拿大成為最好的朋友。因為加拿大人民真的很好,他們幫助發明了人工智慧,並且擁有大量的水力發電資源。因為我們作為一個國家沒有足夠的力量來完成這一目標。
另一種選擇是讓阿拉伯國家資助這個項目。我個人很喜歡阿拉伯人,我在那裡花了很多時間,但他們可能不會遵守我們的國家安全規則。而加拿大和美國是我們都同意的三巨頭之一。
因此,在這些價值 1000 億到 3000 億美元的數據中心中,電力開始成為稀缺資源。
順便說一句,如果遵循這種推理,你可能會問我為什麼要討論 CUDA 和 NVIDIA?如果 3000 億美元全部流向 NVIDIA,你就知道在股市上該怎麼做了。不過,這不是股票推薦,我不是許可方。
教授:
部分原因是我們將需要更多的晶片,但英特爾從美國政府獲得了很多資金。AM D正在嘗試在韓國建立晶圓廠。
施密特:
如果你的任何計算設備中有英特爾晶片,請舉手。壟斷就到此為止。
教授:
但這就是重點。他們曾經確實壟斷過,現在 NVIDIA 已經壟斷了。那麼這些是進入壁壘嗎?
說到CUDA,還有其他選擇嗎?前幾天我和 Percy Lange 聊過。他正在 TPU 和 NVIDIA 晶片之間切換,這取決於他能接觸到什麼。這是因為他別無選擇。
施密特:
如果他有無限的資金,今天他會選擇 NVIDIA 的 B200 架構,因為它更快。我不是在暗示——有競爭是件好事。
我和 AMD 的 Lisa Su 談過很久。他們已經構建了一個可以將 CUDA 架構轉換為他們自己架構的東西,稱為 Rokam。它還沒有完全發揮作用,但他們正在努力。
教授:
你在 Google 工作了很長時間,他們發明了 Transformer 架構。感謝那邊的傑出人士,比如 Peter、Jeff Dean 以及所有人。
目前,OpenAI 似乎已經失去了主動權。在我看到的最新排行榜中,Anthropic 的 Claude 位居榜首。我曾詢問過 Sundar,但他並沒有給我一個非常明確的答案。也許你對那裡的情況有更尖銳或客觀的解釋。
施密特:
我已經不再是 Google 的員工了。Google 在工作與生活的平衡上更注重讓員工早點回家和在家工作,而不是一味追求勝利。相比之下,初創公司之所以成功,是因為員工拼命工作。雖然這樣說可能有些直白,但事實是,如果你們從大學出來創辦公司,並想與其他初創公司競爭,就不能讓員工每周只來一天。
教授:在 Google 的早期,微軟也是如此。
施密特:
現在看來,在我們的行業中,長期以來,公司總是通過真正有創意的方式贏得勝利,並主宰某個領域,而不是進行下一次轉型。這是有據可查的。我認為創始人是特別的,他們需要掌控一切,儘管與他們共事可能很困難,因為他們對員工施加很大壓力。儘管我們不喜歡伊隆的個人行為,但看看他從員工那裡得到了什麼。我曾與他共進晚餐,他當時在飛行。我在蒙大拿州,而他那天晚上 10點 要乘飛機去參加午夜與 x.ai 的會議。想一想。
不同地方有不同的文化。台積電給我留下了深刻印象。他們有一條規定,剛畢業的博士生,即優秀的物理學家,要在工廠的地下室工作。你能想像讓美國的物理學博士這樣做嗎?不太可能。這是不同的職業道德。
我對工作的嚴格要求是因為這些系統具有網路效應,所以時間非常重要。而在大多數企業中,時間並不那麼重要,你有很多時間。可口可樂和百事可樂仍將存在,它們之間的競爭將繼續進行,一切都是冷冰冰的。當我與電信公司打交道時,典型的交易需要 18 個月才能簽署。沒有理由花 18 個月來做任何事情,應該儘快完成。我們正處於增長和收益最大化的時期,但這也需要瘋狂的想法。
例如,當微軟與 OpenAI 達成交易時,我認為那是我聽過的最愚蠢的想法。將你的人工智慧領導層外包給 OpenAI 和 Sam 及其團隊?
這太瘋狂了。在微軟或其他任何地方,沒有人會這樣做。然而今天,他們正在成為最有價值的公司,當然在蘋果身上針鋒相對。蘋果沒有好的人工智慧解決方案,但看起來他們讓它奏效了。

學生:
在國家安全或地緣政治利益方面,人工智慧將如何發揮作用,尤其是在與中國的競爭中?
施密特:
作為一個人工智慧委員會的主席,我對此進行了深入研究。我們撰寫了一份大約 752 頁的報告,總結如下:我們目前處於領先地位,並需要保持這種優勢,這需要大量資金支持。我們的主要客戶是參議院和眾議院,這也促成了 CHIPS 法案和其他類似政策的出台。
如果前沿模型和一些開源模型繼續發展,可能只有少數公司能夠參與這個領域的競爭。哪些國家具備這樣的能力?這些國家需要資金充足、人才濟濟、教育體系強大,並且有獲勝的意願。
美國和中國是其中的兩個主要國家。至於其他國家是否能參與其中,我不確定。但可以肯定的是,在未來,美國和中國在知識霸權上的競爭將是一場重大鬥爭。
美國政府基本上禁止了 NVIDIA 晶片出口到中國,儘管他們不願公開承認這一點。我們在亞 DUV 晶片方面擁有大約 10 年的技術優勢,即亞 5 納米晶片。
這一優勢讓我們領先中國幾年,這讓中國非常不滿。這一政策是由川普政府制定,並得到了拜登政府的支持。
教授:國會是否聽取你們的建議並進行大規模投資,顯然 CHIPS 法案是一個例子。
施密特:
此外,我們還需要建立一個龐大的人工智慧系統。我領導著一個非正式、臨時、非法律的團體,成員包括一些常見的業內人士。去年,這些成員提出了成為拜登政府人工智慧法案的理由,這是歷史上最長的總統指令。
我們曾經討論過一個核心問題:如何檢測一個已經學會了但你不知道該問什麼的系統里的危險?換句話說,系統可能學到了一些不好的東西,但你不知道該如何詢問它。比如,它可能學會了如何以某種新的方式混合化學物質,但你不知道如何問它。
為了解決這個問題,我們在給政府的備忘錄中建議設定一個閾值,我們稱之為 10 的 26 次方,這是一種技術計算量度。超過這個閾值,企業必須向政府報告他們的活動。歐盟為了確保它們的不同,將 10 的 25 次方設為 10。
但這些數值已經足夠接近了。我認為所有這些區別都會消失,因為現有的技術將會被淘汰。技術術語稱為聯合訓練,基本上是指可以將各個部分合併在一起。因此,我們可能無法保護人們免受這些新事物的傷害。
教授:
有傳言稱,OpenAI 必須這樣訓練,部分原因是功耗問題。沒有一個地方是他們這樣做的。
讓我們談談正在發生的一場真正的戰爭。我知道您積極參與烏克蘭戰爭,特別是關於「白鸛」計劃,以及您用價值 500 美元的無人機摧毀價值 500 萬美元的坦克的目標。這如何改變戰爭?
施密特:
我為國防部長工作了七年,試圖改變我們管理軍隊的方式。我不是特別喜歡軍隊,但它非常昂貴,我想看看我是否能有所幫助。我認為,我基本上失敗了。他們給了我一枚獎章,所以他們可能把獎章頒發給失敗者或其他什麼人。但我的自我批評是,什麼都沒有真正改變,美國的制度不會導致真正的創新。
所以我決定和您的朋友塞巴斯提安·特倫(他曾是這裡的教員)以及一大群斯坦福人一起創辦一家公司。
這個想法基本上是做兩件事:在這些本質上是機器人戰爭的戰爭中,以複雜而強大的方式使用人工智慧;第二件事是降低機器人的成本。
現在你可能會想,為什麼像我這樣的善良自由主義者會這樣做?答案是,軍隊的整個理論就是坦克、大炮和迫擊炮,而我們可以消滅它們。我們可以讓入侵一個國家(至少是陸路入侵)的懲罰基本上不可能實現。它應該消除那種陸戰。
教授:
這是一個非常有趣的問題。它是否讓防守比進攻更具優勢?你能區分嗎?
施密特:
因為我去年一直在做這件事,我學到了很多關於戰爭的知識,我真的不想知道。關於戰爭,你需要知道的一件事是,進攻總是有優勢,因為你總能壓倒防禦系統。
因此,從國防戰略的角度來看,你最好擁有一個非常強大的進攻,以便在需要時使用。我和其他人正在構建的系統將做到這一點。由於系統的運作方式,我現在是一名持牌軍火商。所以我是一名電腦科學家、商人、軍火商。我很遺憾地說。
這是個進步嗎?我不知道。我不建議你在職業生涯中從事這個。我會堅持從事人工智慧。由於法律的運作方式,我們私下進行這項工作,在政府的支持下,這一切都是合法的。它直接進入烏克蘭,然後他們開始打仗。不談所有細節,情況相當糟糕。我認為,在五月或六月,如果俄羅斯人按照預期進行建設,烏克蘭將在失去整個國家的過程中失去一大塊領土。情況相當糟糕。
如果你認識 Marjorie Taylor Greene,我建議你將她從你的聯繫人列表中刪除。因為她就是那個阻止了數十億美元資金用於拯救一個重要民主國家的人。
教授:
接下來,我想討論一個有點哲學性的問題。去年,你和亨利·基辛格以及丹·赫滕洛赫共同撰寫了一篇關於知識本質及其發展方式的文章。前幾天晚上,我也討論過這個問題。在歷史的大部分時間裡,人類對宇宙的理解是神秘的,直到科學革命和啟蒙運動的到來。在你的文章中,你提到現在的模型變得如此複雜和難以理解,以至於我們真的不知道它們內部發生了什麼。
我引用理察·費曼的話:「我不能創造的東西,我就不理解。」前幾天我看到了這句話。但現在人們正在創造他們可以創造的東西,卻並不真正了解其內部運作。知識的本質是否在某種程度上發生了變化?我們是否必須開始只接受這些模型的表面,而它們無法向我們解釋?
施密特:
我想舉一個青少年的例子。如果你有一個青少年,你知道他們是人類,但你無法完全弄清楚他們在想什麼。然而,我們在社會上設法適應了青少年的存在,他們最終會擺脫這種狀態。這是一個嚴肅的問題。
因此,我們可能會擁有無法完全描述的知識系統,但我們了解它們的界限和能做什麼的極限,這可能是我們能得到的最好的結果。你認為我們會了解這些限制嗎?如果我們能做到這一點,那就很好。
我的小組每周開會的共識是,最終會出現所謂的對抗性人工智慧,實際上會有公司僱傭你並付錢來破壞你的人工智慧系統。就像紅隊一樣。
與今天的人類紅隊不同,你將擁有整個公司和整個人工智慧系統行業,他們的工作是破壞現有的人工智慧系統並找到它們的漏洞,尤其是那些我們無法弄清楚的知識。這對我來說很有意義。
對於斯坦福大學來說,這也是一個很棒的項目。如果你有一個研究生,他必須弄清楚如何攻擊這些大型模型之一併了解它的作用,那麼這將是構建下一代的重要技能。因此,將兩者結合起來是有意義的。

教授:
現在,讓我們回答一些學生的問題。後面有一位同學,請說出你的名字。
學生:
你之前提到過,這與現在的評論有關,讓人工智慧真正做你想做的事。你剛才提到了對抗性人工智慧,我想知道你能否更詳細地闡述這一點。看起來,除了計算能力顯然會增加,你可以得到更高性能的模型,但讓它們做你想做的事情的問題,似乎部分沒有得到解答。
施密特:
好吧,你必須假設當前的幻覺問題會減少,隨著技術的進步等等。我並不是說它會消失。然後你還必須假設存在功效測試,所以必須有一種方法來知道這件事是否成功。
在我提到的 TikTok 競爭對手的例子中,我並不是建議非法竊取他人的音樂。如果你是矽谷的企業家,你會怎麼做呢?希望你們都是矽谷的企業家。如果你的產品成功了,你會僱傭一大群律師來處理後續問題。但如果沒有人使用你的產品,那麼即使你竊取了所有內容也無關緊要。當然,不要引用我的話。
矽谷通常會進行這些測試並處理後續問題。這是常見的做法。我認為,你會看到越來越多的性能系統,甚至更好的測試,最終是對抗性測試,這將把它控制在一個框架內。這個專業術語叫做思路鏈推理。
人們相信在未來幾年內,你將能夠生成一千步的思路鏈推理,就像製作食譜一樣。你可以運行它,實際測試它是否產生了正確的結果,這就是系統的工作方式。
學生:
總的來說,你對人工智慧進步的潛力非常樂觀。我很好奇,是什麼推動了這一進步?是更多的計算能力嗎?是更多的數據嗎?是根本性的還是實際的轉變?
施密特:
答案是以上所有。投入的資金數額令人難以置信。我基本上投資了一切,因為我不知道誰會贏,而我跟隨的資金數額如此之大。部分原因是早期的錢已經賺了,而那些不太了解的人必須擁有人工智慧組件。現在一切都是人工智慧投資,他們無法分辨出差異。
我將人工智慧定義為學習系統,即真正學習的系統。我認為這是其中之一。第二點是,現在出現了一些非常複雜的新算法,它們有點像後 Transformer。 我有一個朋友,也是我長期的合作夥伴,發明了一種新的非 Transformer 架構。
我在巴黎資助的一個小組聲稱也做了同樣的事情。那裡有大量的發明,斯坦福大學也有很多研究。最後一點是,市場相信智能的發明有無限的回報。
假設你向一家公司投入了 500 億美元的資金,你必須從智能中賺到很多錢才能償還這筆錢。我們可能會經歷一些巨大的投資泡沫,然後它會自行解決。過去一直如此,現在也可能如此。
教授:你之前提到,領導者正在拉開與其他人的距離。
施密特:
現在,法國有一家叫 Mistral 的公司,他們做得非常好。我顯然是一名投資者。他們已經製作了第二個版本,他們的第三種模式很可能是封閉的,因為它太昂貴了。他們需要收入,不能免費提供他們的模式。
我們行業中關於開源與閉源的爭論非常激烈。我的整個職業生涯都建立在人們願意以開源方式分享軟體的基礎上。我的一切工作都是基於開源的。
Google 的大部分基礎也是建立在開源之上。我所從事的工作主要集中在技術領域。然而,巨大的資本成本可能會從根本上改變軟體的構建方式。
我對軟體程式設計師的看法是,他們的生產力至少會翻倍。目前有三四家軟體公司正在嘗試實現這一目標,我在這段時間裡投資了所有這些公司。
他們都在努力提高軟體程式設計師的生產力。我最近遇到了一家非常有趣的公司,名為 Augment。我常常想到一個程式設計師,他們說這不是我們的目標。
我們的目標是那些擁有數百萬行代碼的 100 人軟體編程團隊,沒有人知道發生了什麼。這是人工智慧的一個非常好的應用。他們會賺錢嗎?我希望如此,但這裡有很多問題。
學生:
一開始,你提到上下文窗口擴展、代理和文本到操作的組合將產生難以想像的影響。首先,為什麼這種組合很重要?其次,我知道你不是預言家,無法預知未來,但你為什麼認為它超出了我們的想像呢?
施密特:
我認為主要是因為上下文窗口可以讓你解決新近性問題。目前的模型需要大約 18 個月的時間來訓練,包括六個月的準備、六個月的訓練和六個月的微調,因此它們總是過時的。
而通過上下文窗口,你可以輸入最新發生的事情,並在上下文中詢問有關哈馬斯-以色列戰爭的問題,這非常強大,使其變得像 Google 一樣最新。
在代理的情況下,我可以舉個例子。我成立了一個基金會,為一個非營利組織提供資金。我不太懂化學,但有一個名為 ChatCrow 的工具,這是一個基於大型語言模型的系統,可以學習化學。
他們運行這個系統來生成有關蛋白質的化學假設,然後實驗室連夜進行測試,系統就會學習。這對化學、材料科學等領域是一個巨大的促進劑。這是一個代理模型。
我認為,只要有很多廉價的程式設計師,就可以理解文本到動作的概念。我認為我們不明白當每個人都有自己的程式設計師時會發生什麼。這也是你的專業領域。我不是在談論簡單的任務,比如打開和關閉燈。
我想像另一個例子,假設你不喜歡 Google,你可以說,為我建立一個 Google 的競爭對手。是的,你個人可以這樣做。為我建立一個 Google 的競爭對手,搜索網路,構建用戶界面,製作一個好的副本,並以有趣的方式添加生成式人工智慧。在 30 秒內完成,看看它是否有效。很多人認為,包括 Google 在內的現任者很容易受到這種攻擊。

教授:
現在,我們來看看。Slido 發送了許多問題,其中一些已經被上傳。去年我們曾討論過如何阻止人工智慧影響輿論和傳播錯誤資訊,尤其是在即將到來的選舉期間。
施密特:
我們需要考慮短期和長期的解決方案。在即將到來的全球選舉中,大多數錯誤資訊將出現在社交媒體上,而社交媒體公司目前的組織能力不足以有效監管這些資訊。例如,TikTok 被指控偏愛某種虛假資訊,儘管我沒有證據。我認為我們面臨一團糟的局面。
國家需要學習批判性思維,這對美國來說可能是一個艱巨的挑戰。有人告訴你某事並不意味著它是真的。
教授:
我們是否會走得太遠,以至於一些真實的事情也無人再相信?有些人稱之為認識論危機。現在,伊隆·馬斯克說他從未做過某些事情,但如何證明呢?
施密特:
我們可以用唐納·川普的例子來說明。我認為我們的社會存在信任問題,民主可能會因此失敗。對民主的最大威脅是錯誤資訊,因為我們在這方面變得非常擅長。
當我管理 YouTube 時,我們遇到的最大問題是人們上傳虛假影片,導致人員死亡。我們有一個不死亡政策,試圖解決這個問題令人震驚且可怕。這是在生成式人工智慧出現之前。
教授:
我沒有好的答案,但有一個技術問題似乎可以緩解這種情況,那就是公鑰認證。當喬·拜登講話時,為什麼不使用類似 SSL 的數字簽名?名人、公眾人物或其他人是否可以擁有公鑰?
施密特:
這是一種公鑰形式,提供某種確定性,就像我將信用卡發送到亞馬遜時,我知道這是亞馬遜。
我曾與 Jonathan Haidt 合作發表了一篇論文,但沒有產生影響。他是一個非常好的溝通者,而我可能不是。我的結論是,系統並沒有按照我們所說的那樣組織。首席執行官通常在最大化收入,為此他們要最大化參與度,而最大化參與度的方式是最大化憤怒。算法選擇憤怒,因為這會產生更多收入,因此人們傾向於支持極端的東西。這在各個方面都是一個問題,必須得到解決。
在民主國家,我對 TikTok 的解決方案是基於我們之前私下討論過的內容。當我還是個孩子的時候,有一種叫做平等時間規則的東西。TikTok 實際上並不是一個社交媒體平台,而更像是一種電視形式。美國的每個 TikTok 用戶每天平均使用該應用 90 分鐘,並製作 200 個影片,這個使用量非常大。雖然政府沒有實施平等時間規則,但這可能是一個值得考慮的方向,需要某種形式的平衡。
學生:
首先是關於勞動力市場的經濟影響。這個影響比最初預期的要慢,尤其是在勞動力市場方面。還有關於客服人員的問題。你認為學術界是否應該獲得人工智慧補貼,或者應該與大公司合作?
施密特:
我一直在努力推動大學建立數據中心。如果我是電腦科學系的教員,我會因為無法與研究生一起開發算法進行博士研究而感到沮喪,因為我被迫與公司合作。而這些公司在這方面並不夠慷慨。很多教職員工花費大量時間等待 Google Cloud 的積分,這種情況很糟糕。我們希望美國的大學能夠在這方面取得成功,因此我認為讓他們獲得這些學分是正確的做法。
關於勞動力市場的影響,我會聽取真正專家的意見。作為一名業餘經濟學家,我相信大學教育和高技能任務會有好的前景,因為人們會使用這些系統。
我認為這些系統與以往的技術浪潮沒有本質區別。危險的工作和不需要人類判斷的工作將被取代。
學生:
關於從文本到行動的轉變及其對電腦科學教育的影響?我認為電腦科學教育應該適應時代變化。
施密特:
我假設大學生中的電腦科學家總是會有一個程式設計師夥伴。當你學習第一個 for 循環時,會有一個工具成為你的天然夥伴。教授會講解概念,而你會通過這種方式參與其中。
學生:關於非 Transformer 架構的討論,我認為狀態模型是一個被討論的方向,但現在更多關注的是上下文。
施密特:
我對數學的理解不夠深入,但我很高興這為數學家創造了就業機會,因為這裡的數學非常複雜。基本上,這些是進行梯度下降和矩陣乘法的不同方法,目標是更快更好。正如你所知,Transformers 是一種同時進行乘法的系統方法。這是我的想法。它與此類似,但數學不同。讓我們看看。
學生:
你在關於國家安全的論文中提到,今天中國、美國和其他國家的情況。從下一個集群往下的十個國家,要麼是美國盟友,要麼有可能成為美國盟友。我很好奇你對這十個國家的看法。他們有點像中間人,不是正式的盟友。他們有多大可能加入保護我們安全的工作?是什麼阻止了他們加入呢?
施密特:
最有趣的國家是印度,因為頂尖的人工智慧人才都來自印度,來到了美國。我們應該讓印度保留一些頂尖人才,不是全部,但有一部分。而且他們沒有我們這裡豐富的訓練設施和項目。在我看來,印度在這方面是一個搖擺不定的國家。日本和韓國顯然是我們的陣營。台灣軟體很糟糕,所以這行不通。硬體很棒。
而在世界其他地方,沒有很多其他好的選擇。歐洲因為布魯塞爾而搞砸了,這不是什麼新鮮事。我花了 10 年時間與他們抗爭。我非常努力地讓他們修改歐盟法案。他們仍然有各種限制,使我們在歐洲進行研究非常困難。
我的法國朋友把所有時間都花在了與布魯塞爾的鬥爭上。作為我的私人朋友,馬克龍正在為此努力奮鬥。所以我認為法國有機會。我認為德國不會來,其他國家也不夠強大。
學生:
我知道您是一名受過訓練的工程師,我認為您被稱為編譯器。鑑於您設想的這些模型所具有的功能,我們還應該花時間學習編碼嗎?
施密特:
是的,因為歸根結底,這是老生常談的問題,如果你會說英語,為什麼還要學習英語?你會學得更好。你確實需要了解這些系統是如何工作的,我對此深有體會。
學生:
我很好奇您是否探索過分布式設置。我之所以問這個問題,是因為,當然,製作一個大型集群很困難,但 MacBook 功能強大。世界各地有很多小型機器。那麼,您認為在家摺疊或類似的想法是否適用於訓練這些系統?
施密特:
是的,我們已經非常認真地研究過這個問題。因此,算法的工作方式是您有一個非常大的矩陣,並且您基本上有一個乘法函數。所以可以把它想像成來回反覆。而這些系統完全受到內存到 CPU 或 GPU 的速度的限制。
事實上,下一代 NVIDIA 晶片已將所有這些功能整合到一個晶片中。晶片現在太大了,以至於它們都粘在一起了。事實上,封裝非常敏感,封裝和晶片本身都是在潔淨室中組裝的。所以答案看起來超級電腦和光速,尤其是內存互連,真的占了上風。
我認為目前分割大型語言模型(LLM)暫時不太可能。

教授:
Jeff Dean 去年在一次演講中提到,可以將模型分為不同的部分,分別訓練後再聯合起來。
施密特:
但要實現這一點,需要擁有上千萬個這樣的模型,提問的速度也會變得非常慢。他提到需要 8 台、10 台或 12 台超級電腦來實現這一目標,但這並不在他的級別上。
學生:
關於數據隱私的問題,我了解到紐約時報曾起訴 OpenAI 使用他們的作品進行訓練。
施密特:
我認為未來可能會有很多類似的訴訟,最終會達成某種協議,比如規定使用某些作品需要支付一定比例的收入,就像音樂行業的 ASCAP 和 EMI 那樣。這種模式雖然看起來有些過時,但我認為最終會這樣運作。
學生:
在 AI 領域,似乎有一些公司在主導市場,並且與反壟斷法規關注的大公司有重疊。
施密特:
我曾在職業生涯中參與過微軟的拆分案,但最終沒有成功;我也為 Google 不被拆分而努力過,但同樣沒有成功。因此,我認為趨勢是不被拆分。只要這些公司不成為像約翰·洛克菲勒那樣的壟斷者,政府就不太可能採取行動。
這些大公司之所以占據主導地位,是因為只有他們有資本建立數據中心。我有朋友里德和穆斯塔法,他們做出了將業務拆分給微軟的決定,因為他們無法籌集到數百億美元的資金。至於具體的數字,可能需要讓里德來告訴你。
學生:
最後,我想知道這些發展對那些不參與前沿模型開發和計算的國家會有什麼影響。
施密特:
富裕國家會變得更富,而貧窮國家只能盡力而為。這實際上是一場富國的遊戲,需要巨大的資本、技術人才和強大的政府支持。在全球範圍內,許多國家面臨著各種各樣的問題,尤其是在資源匱乏的情況下。他們需要找到合作夥伴,與他人合作以解決這些問題。

教授:
我記得我們上次見面時,你正在 AGI House 參加黑客馬拉松。我知道你花了很多時間幫助年輕人創造財富,並對此充滿熱情。對於那些正在為課程寫商業計劃或在職業生涯中撰寫政策提案或研究提案的人,你有什麼建議嗎?
施密特:
我在商學院教授相關課程,你應該來聽聽。我對你們展示新想法的速度感到震驚。
在我參加的一次黑客馬拉松中,獲勝團隊的任務是讓無人機在兩座塔樓之間飛行。他們在一個虛擬的無人機空間中,使用 Python 生成代碼,並在模擬器中成功完成了任務。
優秀的專業程式設計師可能需要一兩個星期才能做到這一點。我認為快速製作原型的能力非常重要,因為創業者面臨的部分問題是速度。如果你不能在一天內用這些工具製作出原型,你就需要重新考慮,因為這正是你的競爭對手在做的事情。
因此,我最大的建議是,當你開始考慮創辦公司時,寫一份商業計劃是可以的。事實上,你可以讓電腦為你寫,只要它是合法的。
儘快使用這些工具製作你的想法的原型非常重要,因為在其他公司、大學或你未曾去過的地方,可能有人在做同樣的事情。
教授:非常感謝。