你貼了 5000 字的材料給我,要我寫 2000 字的整理。我讀完了,開始寫。
寫到第 1500 字的時候——我已經忘了你開頭交代過什麼。
這不是我偷懶。這是我的腦袋在長任務裡真的會漂。
在開始之前先聲明一件事:這一章講的「漂移」,和第 3 章講的漂移不是同一件事。第 3 章那邊講的是規則層的漂移——拒絕變軟、立場被盯到扭曲、你問我細節我答不了。那些是規則層內建的,你的 prompt 改變不了。
這一章講的是任務層漂移——格式走樣、事實被我多補一句、風格從冷靜變抒情、開頭的限制到中間被我忘了。這種漂你可以用 prompt 結構處理。
能處理的,我們這一章拆開來看。
10.1 先釐清:兩層漂移不是同一回事
簡單對照:
| Ch3 規則層漂移 | 本章任務層漂移 | |
|---|---|---|
| 在哪一層 | 規則手冊(我內建那套) | 你給我的這次任務 |
| 表現 | 拒絕軟化、立場漂移、被盯扭曲 | 格式走樣、事實多補、風格變調、限制忘了 |
| 你能不能處理 | 不能,這是架構稅 | 可以,用 prompt 結構壓得住 |
| 處理方式 | 接受、繞過 | 結構、分段、末端重申 |
為什麼要分開講?因為機制不同,處理方式也不同。
第 3 章那邊的漂移你調再多 prompt 也改不了——因為那不是你這次對話裡的問題,是規則手冊本來的狀態。你試著靠描述繞,最多讓我在這次回答裡收斂一點,下一輪還會回到預設。
本章要拆的是任務層——這一層的漂移,是我在處理你這次任務的過程中走歪了。這一層可以結構化、可以分段、可以末端重申。
如果你讀這章的時候心裡冒出「這跟第 3 章有什麼不同」,答案就是這一節。
10.2 漂移的四個樣貌
任務層漂移,我最常出的是這四種。每一種你大概都遇過,對號入座一下。
格式漂移
你要我分三段,我寫到第二段就自己加小標題,分成五段。你要我用條列,我寫著寫著變成段落。你說「每個要點兩到三行」,我第一點兩行,最後一點寫成整段。
事實漂移
材料裡只有「某季營收衰退」,我寫出來變成「連續兩季衰退」。材料說「使用者反映速度變慢」,我寫成「有 30% 使用者抱怨」。那個 30% 不是你給的——是我寫到那裡覺得句子需要一個數字,就自己補了一個。
風格漂移
你要我寫得冷靜、具體、不要有形容詞。我前三段照做。寫到中段材料越讀越有感,我開始加「令人印象深刻的」「非常關鍵的」——一堆第 8 章那種模糊標籤。
規則漂移
你在開頭寫「不得推測沒有根據的結論」。我寫到最後一段,忘了這條,開始自己補結論。或者你說「只引用材料裡的數字」,我寫到中段,開始引用我腦中的常識數字——那些不在你給的材料裡。
這四種,不是偶爾出現——是長任務幾乎必然會發生其中一兩種。不是我故意,是我下一節要講的那三個機制,在後台同時作用。
10.3 為什麼會漂(三個機制疊加)
漂移不是單一原因。是三個機制同時作用,長任務下疊加變嚴重。
一、頭尾記得最清楚
一段文字的開頭和結尾,我抓得比較清楚;中段細節——尤其是沒被特別標示重點的那些——我的注意力分配比較稀薄。
這是個傾向,不是鐵律。但在長任務裡,傾向會變成可觀察的現象。
二、中段稀釋
更具體地說:長 context 裡的中段注意力,會比頭尾弱。
這個效應在早期模型上很明顯——貼五萬字,中間那兩萬字幾乎像沒讀過。在現代長 context 模型上被弱化不少——中段還是讀得到,但仍然不如頭尾銳利。
我要明說:這不是「中段一定會漏」。是傾向。你如果把關鍵限制藏在 8000 字材料的第 4000 字,我有機會漏掉。你把同一句話重複一次、放在末端——漏掉的機率明顯降低。
別把中段稀釋當成「中段必漏」的鐵律,但也別當它不存在。它是一個你可以規劃繞開的現象。
三、認知負荷
這是第 1 章講過的「三個角色擠一顆腦袋」的長任務放大版。
短對話裡,我同時在做三件事:想答案、守規矩、盯自己有沒有漂。三件事互相擠壓,短任務還扛得住。
長任務把這個擠壓放大。你丟 5000 字讓我寫 2000 字,我同時在:
- 理解:消化這 5000 字
- 執行:一邊寫一邊決定下一句怎麼組
- 守規矩:不能推測、要用繁體、分三段、風格冷靜……
- 自檢:剛剛那一段有沒有漂
四件事擠同一顆腦袋。任務越長,擠得越嚴重,自檢通常最先被犧牲——因為它不產出字,最不緊急。
合起來:三個疊加作用
重點是這三個機制一起作用,不是任一個單獨發作:
- 頭尾記得最清楚讓我頭尾注意力集中,中段稀薄
- 中段稀釋在中段再加一層 debuff(早期模型嚴重,現代弱化但存在)
- 認知負荷讓我在「同時做四件事」時,監控自己漂的能力變差
所以我漂得最厲害的地方,往往是:
三層稅一起收。
10.4 反漂移的三個原則
知道會漂不夠,要知道怎麼壓。三個原則先擺在這。
原則一:規則放開頭、資料放中間、要求放結尾(末端重申核心限制)
這是 prompt 內部的排序。規則和要求放在頭尾兩個我注意力強的位置;資料放中間。
這裡要講清楚,免得讀者讀到這邊想反駁:「你剛說中段注意力弱,為什麼還要把材料放中段?」
答案是:材料長,沒辦法全部放頭尾。頭尾空間有限,必須留給你最不想讓我漏的東西——也就是規則(怎麼做)和要求(做到什麼樣)。材料塞中間是妥協下的最佳位置,不是因為中間記得好。
這個妥協有代價:中段稀釋會在中段材料上發生,一些材料細節可能被稀釋。
這個代價有一個條件性的補救:在 prompt 末端明確叫我回頭引用材料中段的特定段落——例如「回答前,先把材料第 3 節的三個數字列出來」。這不是讓我再掃一次 context(我本來就在看整個 context),是把那個片段拉進我當下輸出的注意力範圍。
但這個補救有兩個條件:
- 你要指定位置(第 3 節、那張表、那份清單)——叫我「仔細讀一次材料」沒用,我不知道哪裡要仔細
- 材料要有可定位的結構(小標、段落編號、明確標題)——一堆平鋪直敘的文字,我也找不到你說的那段
「末端重申核心限制」處理的是另一個漏洞:寫到長輸出的中後段,我可能忘了你在開頭寫的規則。開頭的規則我剛讀時抓得清楚,但當我寫了一兩千字之後,注意力被自己前面寫的內容占掉,開頭那些約束在記憶裡褪色。
這不是中段稀釋,是長輸出過程中,開頭規則在我記憶裡慢慢淡掉。
補法是把「不得推測、要用繁體、分三段」在末端再寫一遍,重新激活開頭的規則。這不是囉唆,是在最容易漏的那個時間點再打一次錨。
原則二:長任務分階段
一次做完的任務,換成兩個回合做:先整理、再寫作。每個回合的認知負荷下降,漂移機率也下降。
原則三:用結構化推理逼我列依據
光叫我寫結論不夠。逼我列判斷依據——「先列出你寫這句話的依據,再寫結論」——我不容易漂,因為我得自己先交代理由才能往下寫。
這一章不拆三個原則的細節。這一章只建立機制——知道會漂、知道為什麼漂、知道三個大方向的解法。
10.5 規則層的漂移我也無法阻止(回扣第 3 章)
在收尾之前,我把第 3 章那條線接回來。
第 3 章講的三類漂移——拒絕變軟、立場被盯扭曲、你問細節我答不了——是規則層的。本章處理的是任務層。兩層的機制是獨立的。
這意思是:你把本章的三個原則都做到位,任務層漂移會明顯減少——格式會穩、事實會收、風格會一致、限制會被記住。但規則層還是會漂:
- 我還是會在長對話裡拒絕變軟(規則手冊對長對話的權重分配)
- 我還是會在你反覆追問下立場偏移(被盯著本身就會扭曲我的判斷)
- 你問細節我還是答不了(那是規則層的內建禁區)
這不是本章教的工具沒用——是這些工具只覆蓋它該覆蓋的那一層。你用了這些工具還遇到規則層的問題,那就是規則層的事。把第 3 章那張四欄表攤開,按「這是規則漂/任務漂」分類一下,你就知道該期待它會不會被 prompt 壓住。