Vince Kellen是美國加州大學聖地亞哥分校(UCSD)的首席資訊官,他深知ChatGPT、DALL-E和其他生成式AI技術有據可查的局限性:生成的答案可能並不真實,生成的圖像也可能缺乏完整性,輸出可能存在偏差。但無論如何他都在向前推進,他表示,員工們已經在使用ChatGPT來編寫代碼和工作內容描述了。
OpenAI的文本生成技術ChatGPT以及圖像生成技術DALL-E在一系列吸引了公眾想像力的大型語言模型(也稱為生成語言模型或者生成式AI)中是最突出的,這些模型響應書面請求以生成從文本文檔和圖像到編程代碼的各種回答內容。
Kellen認為,由ChatGPT生成的代碼是一種提高生產力的工具,就像編譯器是對匯編語言的改進一樣。他說:「生成庫和軟體的東西和搜索GitHub沒有什麼不同,我們還使用它來編寫對內容和格式敏感的職位內容描述。然後你可以非常快速地繼續編輯,尋找錯誤和存在混淆的地方。」雖然這項技術還處於早期階段,但對於某些企業應用(例如那些內容和工作流密集型的應用)來說,不可否認的是它已經帶來了一定的影響,但是你要謹慎行事。
為恰當的應用做好準備
DB SYSTEL公司的首席資訊官兼產品負責人Oliver Wittmaier表示,生成式AI已經準備好可以用於編碼、管理工作流、數據細化和簡單用例(例如預填表格),DB SYSTEL是DB AG的全資子公司,也是所有集團公司的數字化合作夥伴。他說,在運輸行業,「人工智慧可以直接地或者間接地影響運輸過程中的擁塞避免、轉向和管理。」
內容生成也是Mitre公司創新和實驗總監Michal Cenkl特別感興趣的領域。目前,他的團隊正在研究該技術在知識和專業領域的兩個用途。「首先,是如果我想給我們的一位贊助商寫一封電子郵件,總結我們所做的工作以及和他們相關的工作,而且這是在我們已經與他們進行過溝通的背景下寫這封郵件的。這項技術展現出難以置信的強大。」
其次是項目人員配備。通常,Cenkl會查看簡歷並根據技能標籤進行搜索,找到和項目匹配的人選。生成式AI可以幫助做到這一點。「例如,我可能想問,『Michael在這個項目上能做什麼』,根據他現在正在做的事情,總結出他能做什麼工作,這樣就不需要我從簡歷中進行搜索了。」
二手車零售商CarMax一年多來一直在使用生成式AI,利用OpenAI的API將客戶評論文本整合為更易於管理和閱讀的摘要。但該公司首席資訊官Shamim Mohammad表示,他的團隊也已經把這項技術應用到其他領域了。
其中,車輛成像可有助於改善客戶體驗。他說,AI可以優化他們添加到庫存中的每輛車的圖像,在任何給定時間內,庫存車輛在50000輛到60000輛。「我們讓每一幅圖像都儘可能逼真,同時又不失有效性。」例如,他們的數據科學家創建了一個「數字清掃器」模型,模型用一張顯示了汽車停在乾淨地板上的圖像,替換了一張汽車停在髒地板上的照片。「雖然還是同一輛車,但是照片看起來更好了,這對客戶來說也是更好的體驗。」
同樣地,Forrester分析師Rowan Curran表示,耐克一直在使用生成式AI來生成產品原型圖像。他說:「你可以使用從文本到3D的建模器,在3D空間中進行測試,更直觀地了解它在現實世界中的外觀——所有這些都是輕而易舉的。」
潛在回報最大的應用
Mohammad說,創建代碼和改善客戶體驗是當今企業使用生成式AI的主要領域,在提高效率方面具有最大的潛在回報。
TruStone Financial Credit Union執行副總裁、首席資訊官Gary Jeter表示,這也正是他的開發人員通過GitHub實施OpenAI Codex希望做到的。而且,使用生成式AI編碼的效果很好。Cenkl說,生成式AI模型在編碼方面的效果要好於人類語言,因為編程語言更加結構化。「它可以梳理出這種結構,因此效果更好。」
CarMax正在測試GitHub的Copilot,他說,工程師在某些情況下可能會生成高達40%的代碼。「進化發展的速度很快,但如果你使用它來創建軟體的話,就必須要確保沒有侵犯版權、生成虛假內容或者是嵌入了惡意軟體。」你不能在沒有監督的情況下插入這些代碼。
Curran說,其他領域也已經發展成熟到可以運用企業應用了,例如生成營銷文案、圖像、設計、以及創建更好的數據摘要以便人們更有效地使用數據。他說:「有些人甚至使用這些大型語言模型來清理非結構化數據。」他說,接下來生成AI功能可能會開始出現在一些企業軟體中,例如技術支持軟體以及微軟Office應用。
不輕易信任,先進行驗證
CarMax的Mohammad警告說,除了能帶來好處之外,部署這種技術的CIO們還需要了解與生成的內容輸出有關的潛在智慧財產權問題。生成式模型(例如基於網際網路數據進行訓練的DALL-E)會生成可能侵犯版權的內容,這就是為什麼Getty Images最近就AI驅動的藝術生成工具Stable Diffusion起訴了Stability AI。
這項技術還需要人類的監督。Cenkl說:「像ChatGPT這樣的系統並不知道他們創作的是什麼,而且這些系統非常擅長讓你相信他們所說的是準確的,即使事實並非如此。」沒有哪個AI可以保證——沒有屬性或者參考資訊讓你知道它是如何得出響應的,也沒有AI可解釋性,表明為什麼某些東西是這樣寫出來的。「你不知道底層基礎是什麼,也不知道訓練集的哪些部分正在影響著模型,你得到的純粹是基於現有數據集的分析,因此你不僅有可能出現偏見,還有可能出現事實上的錯誤。」
Wittmaier很看好這項技術,但仍然認為這是一項早期技術,可以用於面向客戶的部署。他說,在這一點上,辦公套件環境、客戶聯繫聊天機器人、技術支持功能和一般文件都有短期潛力,但就運輸公司業務中與安全相關的領域而言,答案顯然是否定的。他說:「我們還有很多東西需要學習和改進,才能將生成式AI納入這些敏感的領域。」
Jeter也有類似的擔憂。雖然他的團隊使用了ChatGPT來識別代碼修復,並在30分鐘內將其部署到網站,「如果沒有 ChatGPT,這將花費更長的時間」,而且他認為ChatGPT對於起草合同條款和條件也很有用,但這些都尚未得到完全的驗證。「我們不會向外部成員公開任何生成式AI,在這個領域TruStone不會沖在最前面。」
他補充說,當TruStone最終開始使用該技術為其成員帶來利益的時候,將是通過人工和自動審查來監控對話以保護成員和品牌的。
美國加州大學聖地亞哥分校的Kellen表示,如今,成功部署的關鍵仍然是有人類在循環中對生成內容的準確性和合規性進行審查。「確保機器做出正確的決定,這將成為一個重要的訴訟點,企業組織使用該技術進行任何高風險的事情——例如醫療診斷——都還需要很長一段時間。但是生成式AI可以很好地生成評論摘要之類的東西,前提是有人類監督。這讓我們放慢了一點速度,但這麼做是正確的。最終,我們將找到自動化的方法來確保質量。但現在,你必須有一個審查程序來確保生成的內容是準確的。」
除了準確性之外,另一個有據可查的風險是從訓練數據中心引入的模型可能存在偏見。Kellen說,當生成式AI使用來自網際網路的內容時,這一點尤其成問題——就像ChatGPT所做的那樣。但是當你是根據自己私有公司的數據對模型進行訓練的話,你就可以檢查潛在的偏見,這可能就不成問題了。他說:「你越是深入企業,那裡的數據類別越受限制、越普通,生成式AI就越有用。」
Cenkl說,關於大型語言模型你要知道的一點是,這些機器在某種程度上就是專家。「他們不懂,但他們非常擅長計算。」
工作職責和角色的變化
「技術能讓事情變得更好,但也為我們帶來了很多額外的工作。」不過,他認為生成式AI是不同的。「這一點很令人興奮,因為它會帶走一些我們不喜歡做的事情,讓我們變得更聰明,它能讓人類變得更強大。」
但Curran指出,生成式AI不會在短期內完全取代任何角色。他說:「它可能會減少執行某個角色所需的人數,例如內容開發、產品資訊管理或者是軟體開發,但總是需要有人類參與其中的。」Mohammad補充說,生成式AI技術可以編寫和總結,也始終需要人類的智能來確保內容質量,並控制生成的內容以使其變得更好。
開始起步吧
Kellen說,現在是加快生成式AI技術並開始試驗的時候了。他說:「CIO們必須在被那些將技術嵌入到他們企業軟體產品中的廠商迷惑之前先解決這個難題,如果你在明年繼續拖延下去的話,你在整個曲線中就處於落後狀態了。」
Curran說,重要的是去了解這種技術,深入探索而非圍繞ChatGPT展開公眾熱議,從而了解這項技術比應用要複雜得多。然後開始考慮生成式AI對可能提高現有流程效率或者質量有哪些用途。最後,問問你自己,你需要什麼類型的功能,你是從廠商那裡獲得還是自己構建。
接下來,就是測試技術和考慮潛在的用例。Cenkl說:「你的很多系統,無論使用的是結構化數據還是非結構化數據,都將至少具有自然語言和對話界面的某些組件。想想你擁有的數據,想想這些技術可以增強其中的哪些部分,」然後展示其潛力。例如,Jeter說他生成了一個條款和條件模板,並將其發送給合規部門,以展示他們是如何使用該技術的。
Curran說,生成式AI模型很大,從頭開始訓練模型成本極高,因此最好的入門方法是使用其中一種雲服務。例如,CarMax使用帶有GPT 3.5的微軟Azure OpenAI服務。Mohammad表示:「我們加載的數據是我們自己的——不會與他人共享,我們可以擁有大量數據並快速處理這些數據以運行我們的模型。如果你有一個小團隊,或者有業務問題可能用得上生成式AI技術,那就試一試吧。」