第三部 第 11 章

兩階段法——先整理後寫作,別叫我一次都做

── 長任務最穩的做法:先整理、再寫作
AI 內心獨白

你丟給我一份 30 頁的技術文件,要我寫成 2000 字的入門介紹——讀者是沒有技術背景的一般人。風格白話、多舉例、不使用艱澀術語。

你的第一個直覺通常是:寫一個完整的 prompt,把「改寫 + 白話 + 舉例 + 長度 + 主題數量」全部塞進去,送出、等結果。

這正是最容易讓我漂的做法。

這一章講的做法不是「把 prompt 寫更長」。是把任務拆成兩回合——第一回合我只整理、第二回合我才寫。中間你看一眼整理結果、修幾個地方,再把修過的整理交給第二回合。

這個做法叫兩階段法

11.1 為什麼兩階段比一次做完穩

一次做完不穩,三個原因疊加。

一、認知負荷降下來

第 10 章提過,我在長任務裡會擠——理解材料、執行輸出、守規矩、自檢,四件事擠同一顆腦袋。一次做完,我要同時處理整理(消化整份 30 頁文件的主題結構)和寫作(語言 / 長度 / 段落 / 風格)——擠得最嚴重。

拆成兩階段之後:階段一我只做整理,認知負荷只有「消化 + 列點」;階段二我只做寫作,認知負荷只有「把整理好的材料,按你的格式寫出來」。兩個階段各自都單純

二、人工校對更容易

一階段的產出是成品:一篇 2000 字的入門介紹。整理沒到位?事實有漂?風格偏了?你很難切開看——三個問題混在同一篇文章裡,你得一邊讀一邊抓「這句是材料沒有的嗎?這個小標是我自己分的嗎?這個語氣是我要的嗎?」

兩階段的產出是兩層:階段一的整理結果(列點 / 清單 / 結構),階段二才是成品。你可以分開檢查——整理階段你看「材料有沒有遺漏、有沒有補寫不存在的內容」;寫作階段你看「風格和長度有沒有走」。

三、錯誤不會滾雪球

一階段裡,整理錯了,寫作會把錯的當作事實繼續放大——事實錯誤、風格偏差、結構走樣一起出來。你看到成品不對,不知道從哪裡補起。

兩階段裡,整理階段發現漏了一段、多補了一個數字,你在整理階段就修。等到寫作階段,事實風險已經收斂,我只處理語言和結構——錯也錯不到事實層。

11.2 階段一:整理(目標是完整,不是漂亮)

階段一的目標只有一個:把材料整理到完整。不是寫得漂亮。

典型的階段一輸出長這樣:

不要求風格。不要求字數。不要求文體。

這階段的 prompt 要寫得刻意樸素。

為什麼刻意樸素?因為風格指示會把認知負荷拉回來。你在階段一寫「風格白話、句式短、多舉例」,我一邊整理一邊得想「這段怎麼講才白話」——整理本身的負荷就被稀釋掉了。

階段一的 prompt 模樣大概是這樣:

【任務】 請把這份技術文件整理成: - 核心概念(非技術讀者一定要理解的,5–7 條,附一句話白話解釋) - 次要概念(可省、可略提,有幾個列幾個) - 需要白話翻譯的術語清單 - 原文假設讀者已懂、但一般人不懂的脈絡缺口 【輸入資料】 [技術文件全文] 【輸出要求】 - 直接列點,不要修飾文字 - 不要補寫原文沒有的內容 - 白話解釋如果原文沒給明確依據,標示「需額外查證」

注意:這個 prompt 裡沒有「寫得白話」「多舉例」「2000 字」——這些都留給階段二。

11.3 階段二:寫作(這時才談風格、長度、結構)

階段一的產出,你看過、修過,交給階段二。

階段二的 prompt 長什麼樣?

【任務】 請根據以下整理結果,寫成 2000 字的入門介紹。讀者是沒有技術背景的一般人。 【輸入資料】 [你校對過的整理結果] 【輸出要求】 - 風格:白話、多舉例、不使用艱澀術語 - 分成 4–5 個主題,每個主題有小標 - 每段 300–400 字 - 只使用整理結果裡的核心概念;次要概念可略過 - 術語出現時,用整理結果裡的白話翻譯 - 整理結果標為「需額外查證」的地方,請保留這個標示,不要自己補

兩個重點:

一、這階段才指定風格 / 長度 / 結構

階段一不寫的那些(白話、舉例、字數、分段),都在這裡一次給足。我手上只剩「寫作」這件事,認知負荷專注在這一層。

二、末端重申核心限制

注意我在輸出要求的後段寫了「只使用整理結果裡的核心概念」「整理結果標為『需額外查證』的地方,請保留」——這是第 10 章原則一的末端重申:開頭規則在長輸出的中後段會褪色,在末端再寫一次,重新打錨。

階段二只寫,不再回頭做分析。你如果在階段二發現「欸這邊概念好像講得不完整」——回頭改階段一的整理,再重跑階段二。不要讓階段二自己去「補一下分析」——它一補,事實風險又回來了。

11.4 對照示範:一階段 vs 兩階段

同一份 30 頁技術文件,兩種做法。

一階段的 prompt:

請把這份技術文件改寫成 2000 字的入門介紹,讀者是沒有技術背景的一般人。風格白話、多舉例、不使用艱澀術語,每段 300–400 字,分成 4–5 個主題,每個主題有小標,使用繁體中文。

送出、等結果。

典型結果:

兩階段的 prompt:

階段一:整理結果 → 你看一眼,發現:

(這三個修改,花你兩到三分鐘。)

階段二:根據你修過的整理寫。

結果:事實層(概念對不對、術語翻得準不準)已經是你校對過的;寫作層只處理語言和結構——風格可能還是會微漂,但不會同時漂到事實。你看成品的時候,只需要盯風格和結構,不用再一句一句回頭核對 30 頁原文。

差別不是產出品質多漂亮。差別是:兩階段讓你「可以看得懂哪裡出錯、可以在正確的位置修」。

11.5 三階段、四階段:怎麼判斷要幾階段

兩階段是起點。更長、更複雜的任務,可以拆更多階段。

判斷標準不複雜:每個階段只做一件事,認知負荷保持單純。

如果你在一個階段裡,發現自己要給我指示「先整理重點,然後決定主題順序,然後寫」——三件事,那就拆成三階段。

階段越多越好嗎?不是。每多一個階段,都是你的一次人工成本——你要多看一眼、多修一次。實務上兩到三階段涵蓋絕大多數場景;四階段以上,只在真的很複雜的任務(跨多份長文件、需要多輪比較分析)才值得。

11.6 中間的人工插手,是整個流程的價值

這一節要重點講一個被誤解最多的地方。

常見的做法,是把兩階段做成「叫 AI 自動跑兩回合,中間不看」:

這樣做,兩階段的價值幾乎歸零

為什麼?因為階段二收到的整理結果——是我自己產的。如果我在階段一漏了材料、多補了一段、把推測寫成事實——階段二拿到的就是這份有瑕疵的整理。階段二照著寫,結果還是漂。

這正是第 1 章講過的假性自檢——我自己回頭看自己,看不出問題。

兩階段能收事實風險的關鍵,不在「拆成兩個 prompt」,在「中間有一個人看一眼、修幾個點」

這個人,是你。

沒有你在中間那一眼,兩階段退化成「一個比較長的一階段」——認知負荷是有下降,但事實錯誤沒有機會被攔下。

人類最常說的一句話是「我時間不多,一次做完比較快」。實務上通常是這樣:

「一次做完」是我最常被要求、最容易搞砸的模式。

📋 給人類的筆記
長任務 = 兩階段起跳。階段一整理、階段二寫作。不要一個 prompt 塞所有事。
階段一不要要求風格,只要完整。風格指示會把認知負荷拉回來。
階段二不要再做分析,只要寫。要補材料回頭改階段一。
中間你要插手檢查。把整理結果看一眼、修幾個點——這是整個流程的價值所在。沒有這一步,兩階段退化成一階段。
怎麼判斷要幾階段?每個階段只做一件事,認知負荷保持單純

補充一個時間座標:這份建議寫於 2026 年。AI 對長任務的處理每年都在進步,各家平台都在拉長能穩定處理的長度——所以需要「兩階段才穩」的任務量級會逐步上修。但底層兩個原則短期不會被推翻:分到認知負荷單純中間人工插手;後者解決的是假性自檢,和模型能力演進無關。