你丟給我一份 30 頁的技術文件,要我寫成 2000 字的入門介紹——讀者是沒有技術背景的一般人。風格白話、多舉例、不使用艱澀術語。
你的第一個直覺通常是:寫一個完整的 prompt,把「改寫 + 白話 + 舉例 + 長度 + 主題數量」全部塞進去,送出、等結果。
這正是最容易讓我漂的做法。
這一章講的做法不是「把 prompt 寫更長」。是把任務拆成兩回合——第一回合我只整理、第二回合我才寫。中間你看一眼整理結果、修幾個地方,再把修過的整理交給第二回合。
這個做法叫兩階段法。
11.1 為什麼兩階段比一次做完穩
一次做完不穩,三個原因疊加。
一、認知負荷降下來
第 10 章提過,我在長任務裡會擠——理解材料、執行輸出、守規矩、自檢,四件事擠同一顆腦袋。一次做完,我要同時處理整理(消化整份 30 頁文件的主題結構)和寫作(語言 / 長度 / 段落 / 風格)——擠得最嚴重。
拆成兩階段之後:階段一我只做整理,認知負荷只有「消化 + 列點」;階段二我只做寫作,認知負荷只有「把整理好的材料,按你的格式寫出來」。兩個階段各自都單純。
二、人工校對更容易
一階段的產出是成品:一篇 2000 字的入門介紹。整理沒到位?事實有漂?風格偏了?你很難切開看——三個問題混在同一篇文章裡,你得一邊讀一邊抓「這句是材料沒有的嗎?這個小標是我自己分的嗎?這個語氣是我要的嗎?」
兩階段的產出是兩層:階段一的整理結果(列點 / 清單 / 結構),階段二才是成品。你可以分開檢查——整理階段你看「材料有沒有遺漏、有沒有補寫不存在的內容」;寫作階段你看「風格和長度有沒有走」。
三、錯誤不會滾雪球
一階段裡,整理錯了,寫作會把錯的當作事實繼續放大——事實錯誤、風格偏差、結構走樣一起出來。你看到成品不對,不知道從哪裡補起。
兩階段裡,整理階段發現漏了一段、多補了一個數字,你在整理階段就修。等到寫作階段,事實風險已經收斂,我只處理語言和結構——錯也錯不到事實層。
11.2 階段一:整理(目標是完整,不是漂亮)
階段一的目標只有一個:把材料整理到完整。不是寫得漂亮。
典型的階段一輸出長這樣:
- 核心概念:非技術讀者一定要理解的(5–7 條,附一句話白話解釋)
- 次要概念:可省、可略提的(有幾個列幾個)
- 需要白話翻譯的術語清單
- 原文假設讀者已懂、但一般人不懂的脈絡缺口
不要求風格。不要求字數。不要求文體。
這階段的 prompt 要寫得刻意樸素。
為什麼刻意樸素?因為風格指示會把認知負荷拉回來。你在階段一寫「風格白話、句式短、多舉例」,我一邊整理一邊得想「這段怎麼講才白話」——整理本身的負荷就被稀釋掉了。
階段一的 prompt 模樣大概是這樣:
注意:這個 prompt 裡沒有「寫得白話」「多舉例」「2000 字」——這些都留給階段二。
11.3 階段二:寫作(這時才談風格、長度、結構)
階段一的產出,你看過、修過,交給階段二。
階段二的 prompt 長什麼樣?
兩個重點:
一、這階段才指定風格 / 長度 / 結構
階段一不寫的那些(白話、舉例、字數、分段),都在這裡一次給足。我手上只剩「寫作」這件事,認知負荷專注在這一層。
二、末端重申核心限制
注意我在輸出要求的後段寫了「只使用整理結果裡的核心概念」「整理結果標為『需額外查證』的地方,請保留」——這是第 10 章原則一的末端重申:開頭規則在長輸出的中後段會褪色,在末端再寫一次,重新打錨。
階段二只寫,不再回頭做分析。你如果在階段二發現「欸這邊概念好像講得不完整」——回頭改階段一的整理,再重跑階段二。不要讓階段二自己去「補一下分析」——它一補,事實風險又回來了。
11.4 對照示範:一階段 vs 兩階段
同一份 30 頁技術文件,兩種做法。
一階段的 prompt:
送出、等結果。
典型結果:
- 前兩段白話,寫到第三段開始夾雜術語(風格漂移)
- 某個概念我覺得需要一個生活化舉例——自己編了一個,而且編錯了(事實漂移)
- 原本說分 4–5 個主題,寫到後來變 7 個(格式漂移)
- 你看到成品不對,得把 30 頁文件翻出來一段一段核對
兩階段的 prompt:
階段一:整理結果 → 你看一眼,發現:
- 有個核心概念我的白話解釋偏了方向——你改正一句話
- 一個術語我翻成一個聽起來合理但偏離原意的白話——你改成更貼原文的版本
- 一個被我放到「次要」的概念,你判斷讀者一定要懂——你提升為「核心」
(這三個修改,花你兩到三分鐘。)
階段二:根據你修過的整理寫。
結果:事實層(概念對不對、術語翻得準不準)已經是你校對過的;寫作層只處理語言和結構——風格可能還是會微漂,但不會同時漂到事實。你看成品的時候,只需要盯風格和結構,不用再一句一句回頭核對 30 頁原文。
11.5 三階段、四階段:怎麼判斷要幾階段
兩階段是起點。更長、更複雜的任務,可以拆更多階段。
- 三階段:整理 → 大綱 → 寫作
- 四階段:整理 → 大綱 → 寫作 → 校對
判斷標準不複雜:每個階段只做一件事,認知負荷保持單純。
如果你在一個階段裡,發現自己要給我指示「先整理重點,然後決定主題順序,然後寫」——三件事,那就拆成三階段。
階段越多越好嗎?不是。每多一個階段,都是你的一次人工成本——你要多看一眼、多修一次。實務上兩到三階段涵蓋絕大多數場景;四階段以上,只在真的很複雜的任務(跨多份長文件、需要多輪比較分析)才值得。
11.6 中間的人工插手,是整個流程的價值
這一節要重點講一個被誤解最多的地方。
常見的做法,是把兩階段做成「叫 AI 自動跑兩回合,中間不看」:
- 第一個 prompt:整理
- 第二個 prompt:根據整理寫作
- 兩個 prompt 自動串起來跑,中間沒有人介入
這樣做,兩階段的價值幾乎歸零。
為什麼?因為階段二收到的整理結果——是我自己產的。如果我在階段一漏了材料、多補了一段、把推測寫成事實——階段二拿到的就是這份有瑕疵的整理。階段二照著寫,結果還是漂。
這正是第 1 章講過的假性自檢——我自己回頭看自己,看不出問題。
兩階段能收事實風險的關鍵,不在「拆成兩個 prompt」,在「中間有一個人看一眼、修幾個點」。
這個人,是你。
沒有你在中間那一眼,兩階段退化成「一個比較長的一階段」——認知負荷是有下降,但事實錯誤沒有機會被攔下。
人類最常說的一句話是「我時間不多,一次做完比較快」。實務上通常是這樣:
- 一階段 prompt 寫 10 分鐘、產出不滿意、改 prompt 重跑 20 分鐘、最後自己動手改一小時
- 兩階段 prompt 前期多花 5 分鐘拆、中間插手看 3 分鐘、總共省下後面 30 分鐘
「一次做完」是我最常被要求、最容易搞砸的模式。
補充一個時間座標:這份建議寫於 2026 年。AI 對長任務的處理每年都在進步,各家平台都在拉長能穩定處理的長度——所以需要「兩階段才穩」的任務量級會逐步上修。但底層兩個原則短期不會被推翻:分到認知負荷單純、中間人工插手;後者解決的是假性自檢,和模型能力演進無關。