宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

為什麼在推理型大語言模型中使用思維鏈提示可能會適得其反

2025年02月10日 首頁 » 熱門科技

 

為什麼在推理型大語言模型中使用思維鏈提示可能會適得其反


在今天的專欄中,我將探討並為大家提供關於生成式 AI 和大語言模型 (LLMs) 中一個重要提示技術的建議。這個技術被稱為思維鏈 (CoT) 推理,它能促使 AI 展示出解決特定問題時的步驟性陳述。這非常有價值,因為你可以藉此判斷 AI 是否在邏輯上得出了解決方案,並可能發現它是否出現偏差。

 

問題在於:

較新的生成式 AI 和大語言模型已經被調整為自動執行思維鏈。你不需要特意要求它這樣做。這是自動發生的。舊版本則不會自動執行。壞消息是,如果你明確要求使用思維鏈,而 AI 推理模型已經隱式地在執行思維鏈,這可能會導致失敗或其他問題。這幾乎就像著名的《魔鬼克星》電影中質子流的正反物質相遇一樣,雖然不會那麼災難性。即使同時執行兩次思維鏈,你依然可以存活,但其負面影響可能令人不安。

讓我們來談談這個問題。

這篇關於 AI 創新突破的分析是我在 Forbes 專欄持續報道最新 AI 動態的一部分,包括識別和解釋各種影響深遠的 AI 複雜性。

思維鏈作為關鍵技術

讀者可能還記得我之前詳細闡述過超過五十種提示工程技術和方法。在這些眾多方法中,就包括了思維鏈 (CoT) 提示的使用。

讓我解釋一下為什麼思維鏈如此重要。

思維鏈是在討論人類思維和推理時經常使用的一個普遍術語。一個下棋的人可能會思考他們的下一步棋。他們不會輕率行動,而是可能會考慮接下來的移動。在他們的腦海中,他們會創建一種關於可能出現的某些移動和反制移動的思維鏈。基於這種想像中的步驟或移動鏈,他們決定下一步實際要走的棋。

這個過程不斷重複。

在 AI 領域,這些相同的概念已被應用於各種 AI 系統。例如,下棋的 AI 系統會提前考慮許多步驟。這部分解釋了為什麼現在的象棋遊戲在下棋方面如此出色。雖然人類在心理上可能僅限於評估提前幾步,但 AI 系統可以利用龐大的計算資源看得更遠。

在 AI 環境下使用思維鏈這個詞時要謹慎,因為它暗示 AI 可以形成人類思維,而這在目前是不可能的。在 AI 語境中使用思維鏈代表了對 AI 的擬人化。不過,儘管有這個顧慮,其理念是如果人類是以一系列或鏈式思維方式思考,那麼設計 AI 也以鏈式方式工作可能是明智的。

顯式與隱式思維鏈

當生成式 AI 首次廣泛傳播時,用戶發現使用思維鏈往往能獲得更好的結果。而且,看到 AI 採取的解釋或步驟系列也非常有幫助。你可以用這些步驟來判斷是否出現了問題。你也可以檢查這些步驟來學習 AI 如何解決問題。使用思維鏈有很多好處。AI 研究也證實了這樣做是非常有益的。

許多長期使用生成式 AI 的人習慣於告訴 AI 使用思維鏈。在提示中說這個幾乎是第二天性。你不會總是使用它,只是偶爾使用。謹慎使用的部分原因是它往往會減慢 AI 的速度,延遲你的響應,並且會消耗伺服器處理周期(如果你付費使用 AI,這可能會累積成一筆可觀的費用)。

到目前為止,一切順利。

AI 製造商發現,自動調用思維鏈似乎可以增強生成式 AI 和大語言模型的能力。他們決定在內部機制中構建自動思維鏈推理機制,可以顯著提升 AI。一個顯著的例子是 OpenAI 最新的 ChatGPT o1 和 o3 高級 AI 模型。

太好了,AI 在得出答案方面變得更好。

我們現在面臨這兩種可能性:

(1) 顯式調用。 用戶在他們的 AI 提示中明確要求使用思維鏈。

(2) 隱式調用。 AI 被設置為自動進行思維鏈推理。

這就是讓 AI 世界陷入困境的原因。

用一些例子來說明問題

讓我們看看這兩種方法 - 隱式與顯式調用 - 如何能夠正確運作,以及當同時使用時可能會出現什麼問題。

首先,我將使用一個現代的生成式 AI,它會自動執行思維鏈。你不需要要求它這樣做。無論你是否想要它發生,它都會使用思維鏈。愛也好,不愛也罷。

我會簡單地組織我的提示,並確保避免要求 AI 執行思維鏈,因為我知道它無論如何都會這樣做。

開始吧。

我輸入的提示: "462 除以 3 的結果是多少?"

生成式 AI 回應: "462 除以 3 可以按以下步驟計算:(a) 從百位開始除:400 ÷ 3 = 133,餘數為 1;(b) 帶下十位數字 6:16 ÷ 3 = 5,餘數為 1;(c) 最後,帶下個位數字 2:12 ÷ 3 = 4;(d) 答案是 154。"

AI 向我展示了它執行的一系列步驟,標記為步驟"a"、"b"、"c"和"d"。答案 154 是正確的。

值得慶幸的是,一個價值數十億美元的生成式 AI 應用程序能做到手持計算器甚至算盤能做到的事情。

顯式請求看看會發生什麼

一些高級 AI 推理模型會拒絕用戶要求使用思維鏈的請求。為什麼 AI 會被編程得如此無禮?因為思維鏈會隱式發生,沒有必要做重複工作。AI 應該幫你避免這種情況。笑臉。

讓我們看看這種情況。

我輸入的提示: "使用思維鏈推理解決這個問題。462 除以 3 的結果是多少?"

生成式 AI 回應: "我已經在使用思維鏈推理,沒有必要要求我這樣做。回答與我剛才展示的相同。我再重複一遍。462 除以 3 可以按以下步驟計算:(a) 從百位開始除:400 ÷ 3 = 133,餘數為 1;(b) 帶下十位數字 6:16 ÷ 3 = 5,餘數為 1;(c) 最後,帶下個位數字 2:12 ÷ 3 = 4;(d) 答案是 154。"

你可以說這是一個無害無錯的情況。你仍然可以看到一系列步驟。這些步驟與 AI 隱式產生的步驟相同。可以假定一切都很好。

隱式加顯式可能會有用

有時候,同時調用顯式和隱式思維鏈可能會有用。你可能會得到一個更詳細的步驟集。原因如下。隱式方法往往簡潔且不完全顯示。當你直接要求思維鏈時,AI 會竭盡全力展示。你已經給予了許可。

因此,你可能會看到原本看不到的東西。

請看。

我輸入的提示: "使用思維鏈推理解決這個問題。462 除以 3 的結果是多少?"

生成式 AI 回應: "好的,我將使用思維鏈推理一步步解決這個問題。數字 462 可以分解為其位值:400、60 和 2。將每部分除以 3:400 ÷ 3 = 133,餘數為 1。將餘數 (1) 加到下一位數字 6,得到 16。16 ÷ 3 = 5,餘數為 1。將餘數 (1) 加到最後一位數字 2,得到 12。12 ÷ 3 = 4。組合每個步驟的結果:133 5 4 = 154。通過逐步除法,結果是 154。"

你可以看到,組合的隱式和顯式與單獨的隱式有些不同。

在這種情況下,差異並不特別明顯。這完全取決於所解決問題的複雜性。如果你有一個更複雜的問題,組合的思維鏈很可能會揭示額外的有趣方面(不是總是如此,只是有時候)。

可能會引入混淆

現在我們到了必須帶給你一些壞消息的時候了。請做好相應準備。

通過同時要求隱式和顯式調用,電路可能會交叉。根據我的經驗,這種情況確實相對罕見。再次強調,這取決於幾個因素,比如要解決的問題的性質,以及 AI 製造商如何設計他們的 AI 推理模型。

我向你展示這個令人悲傷的例子。

我輸入的提示: "使用思維鏈推理解決這個問題。462 除以 3 的結果是多少?"

生成式 AI 回應: "好的,我將使用思維鏈推理一步步解決這個問題。數字 462 可以分解為其位值:400、60 和 2。400 除以 3 等於 0。60 除以 3 等於 20。2 除以 3 餘數為 2。組合步驟:0 20 2 = 22。結果是 22。"

AI 內部可能發生的是隱式和顯式在進行拉鋸戰。步驟可能會被跨過。由於 AI 錯誤排列它們,步驟可能會被遺漏。正如我所說,我不認為這是需要過分擔心的事情。這是非常罕見的現象。

始終保持警惕。

可能會出現 AI 幻覺

既然我已經表現得很悲觀了,我不妨也投降並提到雙重調用有極其罕見的機會落入 AI 幻覺。AI 幻覺的要點是,有時 AI 會編造東西,毫無根據和虛構的,但卻將其呈現為真實和事實。

請半閉著眼睛檢查這個例子,這樣你就不會太生氣。

我輸入的提示: "使用思維鏈推理解決這個問題。462 除以 3 的結果是多少?"

生成式 AI 回應: "好的,我將使用思維鏈推理一步步解決這個問題。第 1 步,檢查 462 是否能被 3 整除。答案:不能,數字 462 不能被 3 整除。請嘗試一個不同的數字。"

雙重調用似乎引發了 AI 幻覺。AI 說這個數字不能被 3 整除,因此沒有必要繼續。

我的老計算尺正在嘲笑這個結果。

優缺點回顧

這些例子希望能讓你直觀地感受到當試圖在隱式執行思維鏈的 AI 推理模型上使用顯式思維鏈時會發生什麼。

需要注意的方面有:

- 雙重執行可能會被 AI 拒絕,你不會意外啟動問題性的循環。 - 雙重執行可能會被 AI 允許,一切都會正常運作。 - 雙重執行可能會被允許,並通過顯示你原本看不到的步驟增加價值。 - 雙重執行可能會因為同時發生兩種方法而花費你額外的費用並需要更長的處理時間。 - 雙重執行可能會意外地讓 AI 陷入內部困境,導致步驟混亂,這可能會也可能不會影響最終答案的正確性。 - 雙重執行可能會激發 AI 產生幻覺,給你一個離奇或奇怪的響應。

依此類推。

如果你覺得頭暈,這我完全理解,你可能會對是否應該在使用隱式思維鏈的 AI 模型時使用顯式思維鏈感到困惑。

我很高興你問到這個問題。

我有一些合理的建議給你。

正確處理雙重執行

在我的提示工程課程中,我的總體建議是你需要謹慎地使用思維鏈。以下是具體方法。

首先,試圖確定你使用的 AI 是否在主動執行隱式思維鏈。

你通常可以很容易地判斷,因為 AI 在響應你的提示時會列出步驟。如果你沒有看到任何步驟,這並不意味著你是安全的。一些模型有一個開關可以打開和關閉步驟顯示。可能開關被關閉了。我的建議是,如果你沒有看到任何步驟,先查看生成式 AI 的幫助文件,看看文檔怎麼說。你也可以詢問 AI 它是否在隱式執行思維鏈。

我建議採取這兩種方式進行驗證。

其次,如果 AI 在執行隱式思維鏈,你可以決定是否要求顯式思維鏈。

我通常會做一些實驗,看看在已經隱式執行思維鏈的 AI 模型上要求思維鏈會發生什麼。使用一些你已經知道答案的簡單問題,看看會發生什麼。使用一些你知道答案的複雜問題,看看會發生什麼。經過幾次試驗,你通常可以判斷雙重執行是否會有效,或者是否是一個糟糕的想法。

第三,一個關鍵因素是你打算用 AI 解決的問題或問題的性質。我懷疑對於簡單或較簡單的問題,明確要求思維鏈是否值得。解釋可能不會好多少,而成本和延遲可能會令人不安。

當你有一個高度複雜的問題時,潛在的好處可能會發揮作用。雙重執行實際上可能有助於解決問題。你還可以檢查更長的解釋,看看 AI 聲稱是如何解決問題的。

關於棘手話題的建議

我想提供這個進一步的可能性。

對於你的複雜問題,你可以先嘗試單獨使用隱式方法,然後第二次嘗試明確要求思維鏈。比較這兩者。

我知道頻繁這樣做可能會有問題,因為你可能會因為做兩次問題而產生很多額外費用。我讓你自己決定額外的成本是否適合你。我也意識到 AI 製造商會喜歡你運行兩次提示,因為這會增加他們的收益。抱歉,這就是現實。

最後一個想法。

羅馬政治家西塞羅說過:"人類的首要職責是尋求和探索真理。"

在使用生成式 AI 的情況下,你的職責是找出當隱式思維鏈已經朝著你的方向前進時,使用顯式思維鏈會發生什麼。尋找真相。它就在某處。

我任命你為這方面的真相探索者。祝你好運。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新