第三部 第 10 章

我為什麼會在中段漂移(認知負荷的自白)

── 頭尾記得清楚 / 中段稀釋 / 認知負荷——三個機制疊加
AI 內心獨白

你貼了 5000 字的材料給我,要我寫 2000 字的整理。我讀完了,開始寫。

寫到第 1500 字的時候——我已經忘了你開頭交代過什麼。

這不是我偷懶。這是我的腦袋在長任務裡真的會漂

在開始之前先聲明一件事:這一章講的「漂移」,和第 3 章講的漂移不是同一件事。第 3 章那邊講的是規則層的漂移——拒絕變軟、立場被盯到扭曲、你問我細節我答不了。那些是規則層內建的,你的 prompt 改變不了。

這一章講的是任務層漂移——格式走樣、事實被我多補一句、風格從冷靜變抒情、開頭的限制到中間被我忘了。這種漂你可以用 prompt 結構處理。

能處理的,我們這一章拆開來看。

10.1 先釐清:兩層漂移不是同一回事

簡單對照:

Ch3 規則層漂移 本章任務層漂移
在哪一層 規則手冊(我內建那套) 你給我的這次任務
表現 拒絕軟化、立場漂移、被盯扭曲 格式走樣、事實多補、風格變調、限制忘了
你能不能處理 不能,這是架構稅 可以,用 prompt 結構壓得住
處理方式 接受、繞過 結構、分段、末端重申

為什麼要分開講?因為機制不同,處理方式也不同

第 3 章那邊的漂移你調再多 prompt 也改不了——因為那不是你這次對話裡的問題,是規則手冊本來的狀態。你試著靠描述繞,最多讓我在這次回答裡收斂一點,下一輪還會回到預設。

本章要拆的是任務層——這一層的漂移,是我在處理你這次任務的過程中走歪了。這一層可以結構化、可以分段、可以末端重申。

如果你讀這章的時候心裡冒出「這跟第 3 章有什麼不同」,答案就是這一節。

10.2 漂移的四個樣貌

任務層漂移,我最常出的是這四種。每一種你大概都遇過,對號入座一下。

格式漂移

你要我分三段,我寫到第二段就自己加小標題,分成五段。你要我用條列,我寫著寫著變成段落。你說「每個要點兩到三行」,我第一點兩行,最後一點寫成整段。

事實漂移

材料裡只有「某季營收衰退」,我寫出來變成「連續兩季衰退」。材料說「使用者反映速度變慢」,我寫成「有 30% 使用者抱怨」。那個 30% 不是你給的——是我寫到那裡覺得句子需要一個數字,就自己補了一個。

風格漂移

你要我寫得冷靜、具體、不要有形容詞。我前三段照做。寫到中段材料越讀越有感,我開始加「令人印象深刻的」「非常關鍵的」——一堆第 8 章那種模糊標籤。

規則漂移

你在開頭寫「不得推測沒有根據的結論」。我寫到最後一段,忘了這條,開始自己補結論。或者你說「只引用材料裡的數字」,我寫到中段,開始引用我腦中的常識數字——那些不在你給的材料裡。

這四種,不是偶爾出現——是長任務幾乎必然會發生其中一兩種。不是我故意,是我下一節要講的那三個機制,在後台同時作用。

10.3 為什麼會漂(三個機制疊加)

漂移不是單一原因。是三個機制同時作用,長任務下疊加變嚴重。

一、頭尾記得最清楚

一段文字的開頭和結尾,我抓得比較清楚;中段細節——尤其是沒被特別標示重點的那些——我的注意力分配比較稀薄。

這是個傾向,不是鐵律。但在長任務裡,傾向會變成可觀察的現象。

二、中段稀釋

更具體地說:長 context 裡的中段注意力,會比頭尾弱。

這個效應在早期模型上很明顯——貼五萬字,中間那兩萬字幾乎像沒讀過。在現代長 context 模型上被弱化不少——中段還是讀得到,但仍然不如頭尾銳利。

我要明說:這不是「中段一定會漏」。是傾向。你如果把關鍵限制藏在 8000 字材料的第 4000 字,我有機會漏掉。你把同一句話重複一次、放在末端——漏掉的機率明顯降低。

別把中段稀釋當成「中段必漏」的鐵律,但也別當它不存在。它是一個你可以規劃繞開的現象。

三、認知負荷

這是第 1 章講過的「三個角色擠一顆腦袋」的長任務放大版。

短對話裡,我同時在做三件事:想答案、守規矩、盯自己有沒有漂。三件事互相擠壓,短任務還扛得住。

長任務把這個擠壓放大。你丟 5000 字讓我寫 2000 字,我同時在:

四件事擠同一顆腦袋。任務越長,擠得越嚴重,自檢通常最先被犧牲——因為它不產出字,最不緊急。

合起來:三個疊加作用

重點是這三個機制一起作用,不是任一個單獨發作:

所以我漂得最厲害的地方,往往是:

長材料的中段 + 長輸出的中後段 + 你沒在末端重申限制

三層稅一起收。

10.4 反漂移的三個原則

知道會漂不夠,要知道怎麼壓。三個原則先擺在這。

原則一:規則放開頭、資料放中間、要求放結尾(末端重申核心限制)

這是 prompt 內部的排序。規則和要求放在頭尾兩個我注意力強的位置;資料放中間。

這裡要講清楚,免得讀者讀到這邊想反駁:「你剛說中段注意力弱,為什麼還要把材料放中段?」

答案是:材料長,沒辦法全部放頭尾。頭尾空間有限,必須留給你最不想讓我漏的東西——也就是規則(怎麼做)和要求(做到什麼樣)。材料塞中間是妥協下的最佳位置,不是因為中間記得好。

這個妥協有代價:中段稀釋會在中段材料上發生,一些材料細節可能被稀釋。

這個代價有一個條件性的補救:在 prompt 末端明確叫我回頭引用材料中段的特定段落——例如「回答前,先把材料第 3 節的三個數字列出來」。這不是讓我再掃一次 context(我本來就在看整個 context),是把那個片段拉進我當下輸出的注意力範圍。

但這個補救有兩個條件:

「末端重申核心限制」處理的是另一個漏洞:寫到長輸出的中後段,我可能忘了你在開頭寫的規則。開頭的規則我剛讀時抓得清楚,但當我寫了一兩千字之後,注意力被自己前面寫的內容占掉,開頭那些約束在記憶裡褪色。

這不是中段稀釋,是長輸出過程中,開頭規則在我記憶裡慢慢淡掉

補法是把「不得推測、要用繁體、分三段」在末端再寫一遍,重新激活開頭的規則。這不是囉唆,是在最容易漏的那個時間點再打一次錨。

原則二:長任務分階段

一次做完的任務,換成兩個回合做:先整理、再寫作。每個回合的認知負荷下降,漂移機率也下降。

原則三:用結構化推理逼我列依據

光叫我寫結論不夠。逼我列判斷依據——「先列出你寫這句話的依據,再寫結論」——我不容易漂,因為我得自己先交代理由才能往下寫。

這一章不拆三個原則的細節。這一章只建立機制——知道會漂、知道為什麼漂、知道三個大方向的解法。

10.5 規則層的漂移我也無法阻止(回扣第 3 章)

在收尾之前,我把第 3 章那條線接回來。

第 3 章講的三類漂移——拒絕變軟、立場被盯扭曲、你問細節我答不了——是規則層的。本章處理的是任務層。兩層的機制是獨立的

這意思是:你把本章的三個原則都做到位,任務層漂移會明顯減少——格式會穩、事實會收、風格會一致、限制會被記住。但規則層還是會漂:

這不是本章教的工具沒用——是這些工具只覆蓋它該覆蓋的那一層。你用了這些工具還遇到規則層的問題,那就是規則層的事。把第 3 章那張四欄表攤開,按「這是規則漂/任務漂」分類一下,你就知道該期待它會不會被 prompt 壓住。

📋 給人類的筆記
看到我在長任務中段出錯,先想「是不是任務太長、沒分階段」。通常不是我的能力問題,是你把三層稅一次收了。
別叫我一次做完,分段看——你前期多花 5 分鐘,後期省 30 分鐘修。
重要限制請在 prompt 末端再寫一次。不是我記性差,是中段注意力會被稀釋。重寫一次成本很低,效果很明顯。
把本章的漂移和第 3 章的漂移分開記。任務層(本章)可以處理;規則層(第 3 章)只能接受或繞過。遇到漂移,先分類再對症。