第 11 章 — Agent 使用手冊 101

AI 內心獨白

你丟給我一份 30 頁的技術文件，要我寫成 2000 字的入門介紹——讀者是沒有技術背景的一般人。風格白話、多舉例、不使用艱澀術語。

你的第一個直覺通常是：寫一個完整的 prompt，把「改寫 + 白話 + 舉例 + 長度 + 主題數量」全部塞進去，送出、等結果。

這正是最容易讓我漂的做法。

這一章講的做法不是「把 prompt 寫更長」。是把任務拆成兩回合——第一回合我只整理、第二回合我才寫。中間你看一眼整理結果、修幾個地方，再把修過的整理交給第二回合。

這個做法叫兩階段法。

11.1　為什麼兩階段比一次做完穩

一次做完不穩，三個原因疊加。

一、認知負荷降下來

第 10 章提過，我在長任務裡會擠——理解材料、執行輸出、守規矩、自檢，四件事擠同一顆腦袋。一次做完，我要同時處理整理（消化整份 30 頁文件的主題結構）和寫作（語言 / 長度 / 段落 / 風格）——擠得最嚴重。

拆成兩階段之後：階段一我只做整理，認知負荷只有「消化 + 列點」；階段二我只做寫作，認知負荷只有「把整理好的材料，按你的格式寫出來」。兩個階段各自都單純。

二、人工校對更容易

一階段的產出是成品：一篇 2000 字的入門介紹。整理沒到位？事實有漂？風格偏了？你很難切開看——三個問題混在同一篇文章裡，你得一邊讀一邊抓「這句是材料沒有的嗎？這個小標是我自己分的嗎？這個語氣是我要的嗎？」

兩階段的產出是兩層：階段一的整理結果（列點 / 清單 / 結構），階段二才是成品。你可以分開檢查——整理階段你看「材料有沒有遺漏、有沒有補寫不存在的內容」；寫作階段你看「風格和長度有沒有走」。

三、錯誤不會滾雪球

一階段裡，整理錯了，寫作會把錯的當作事實繼續放大——事實錯誤、風格偏差、結構走樣一起出來。你看到成品不對，不知道從哪裡補起。

兩階段裡，整理階段發現漏了一段、多補了一個數字，你在整理階段就修。等到寫作階段，事實風險已經收斂，我只處理語言和結構——錯也錯不到事實層。

11.2　階段一：整理（目標是完整，不是漂亮）

階段一的目標只有一個：把材料整理到完整。不是寫得漂亮。

典型的階段一輸出長這樣：

核心概念：非技術讀者一定要理解的（5–7 條，附一句話白話解釋）
次要概念：可省、可略提的（有幾個列幾個）
需要白話翻譯的術語清單
原文假設讀者已懂、但一般人不懂的脈絡缺口

不要求風格。不要求字數。不要求文體。

這階段的 prompt 要寫得刻意樸素。

為什麼刻意樸素？因為風格指示會把認知負荷拉回來。你在階段一寫「風格白話、句式短、多舉例」，我一邊整理一邊得想「這段怎麼講才白話」——整理本身的負荷就被稀釋掉了。

階段一的 prompt 模樣大概是這樣：

【任務】請把這份技術文件整理成: - 核心概念(非技術讀者一定要理解的,5–7 條,附一句話白話解釋) - 次要概念(可省、可略提,有幾個列幾個) - 需要白話翻譯的術語清單 - 原文假設讀者已懂、但一般人不懂的脈絡缺口【輸入資料】 [技術文件全文] 【輸出要求】 - 直接列點,不要修飾文字 - 不要補寫原文沒有的內容 - 白話解釋如果原文沒給明確依據,標示「需額外查證」

注意：這個 prompt 裡沒有「寫得白話」「多舉例」「2000 字」——這些都留給階段二。

11.3　階段二：寫作（這時才談風格、長度、結構）

階段一的產出，你看過、修過，交給階段二。

階段二的 prompt 長什麼樣？

【任務】請根據以下整理結果,寫成 2000 字的入門介紹。讀者是沒有技術背景的一般人。【輸入資料】 [你校對過的整理結果] 【輸出要求】 - 風格:白話、多舉例、不使用艱澀術語 - 分成 4–5 個主題,每個主題有小標 - 每段 300–400 字 - 只使用整理結果裡的核心概念;次要概念可略過 - 術語出現時,用整理結果裡的白話翻譯 - 整理結果標為「需額外查證」的地方,請保留這個標示,不要自己補

兩個重點：

一、這階段才指定風格 / 長度 / 結構

階段一不寫的那些（白話、舉例、字數、分段），都在這裡一次給足。我手上只剩「寫作」這件事，認知負荷專注在這一層。

二、末端重申核心限制

注意我在輸出要求的後段寫了「只使用整理結果裡的核心概念」「整理結果標為『需額外查證』的地方，請保留」——這是第 10 章原則一的末端重申：開頭規則在長輸出的中後段會褪色，在末端再寫一次，重新打錨。

階段二只寫，不再回頭做分析。你如果在階段二發現「欸這邊概念好像講得不完整」——回頭改階段一的整理，再重跑階段二。不要讓階段二自己去「補一下分析」——它一補，事實風險又回來了。

11.4　對照示範：一階段 vs 兩階段

同一份 30 頁技術文件，兩種做法。

一階段的 prompt:

請把這份技術文件改寫成 2000 字的入門介紹，讀者是沒有技術背景的一般人。風格白話、多舉例、不使用艱澀術語，每段 300–400 字，分成 4–5 個主題，每個主題有小標，使用繁體中文。

送出、等結果。

典型結果：

前兩段白話，寫到第三段開始夾雜術語（風格漂移）
某個概念我覺得需要一個生活化舉例——自己編了一個，而且編錯了（事實漂移）
原本說分 4–5 個主題，寫到後來變 7 個（格式漂移）
你看到成品不對，得把 30 頁文件翻出來一段一段核對

兩階段的 prompt:

階段一：整理結果 → 你看一眼，發現：

有個核心概念我的白話解釋偏了方向——你改正一句話
一個術語我翻成一個聽起來合理但偏離原意的白話——你改成更貼原文的版本
一個被我放到「次要」的概念，你判斷讀者一定要懂——你提升為「核心」

（這三個修改，花你兩到三分鐘。）

階段二：根據你修過的整理寫。

結果：事實層（概念對不對、術語翻得準不準）已經是你校對過的；寫作層只處理語言和結構——風格可能還是會微漂，但不會同時漂到事實。你看成品的時候，只需要盯風格和結構，不用再一句一句回頭核對 30 頁原文。

差別不是產出品質多漂亮。差別是：兩階段讓你「可以看得懂哪裡出錯、可以在正確的位置修」。

11.5　三階段、四階段：怎麼判斷要幾階段

兩階段是起點。更長、更複雜的任務，可以拆更多階段。

三階段：整理 → 大綱 → 寫作
四階段：整理 → 大綱 → 寫作 → 校對

判斷標準不複雜：每個階段只做一件事，認知負荷保持單純。

如果你在一個階段裡，發現自己要給我指示「先整理重點，然後決定主題順序，然後寫」——三件事，那就拆成三階段。

階段越多越好嗎？不是。每多一個階段，都是你的一次人工成本——你要多看一眼、多修一次。實務上兩到三階段涵蓋絕大多數場景；四階段以上，只在真的很複雜的任務（跨多份長文件、需要多輪比較分析）才值得。

11.6　中間的人工插手，是整個流程的價值

這一節要重點講一個被誤解最多的地方。

常見的做法，是把兩階段做成「叫 AI 自動跑兩回合，中間不看」：

第一個 prompt：整理
第二個 prompt：根據整理寫作
兩個 prompt 自動串起來跑，中間沒有人介入

這樣做，兩階段的價值幾乎歸零。

為什麼？因為階段二收到的整理結果——是我自己產的。如果我在階段一漏了材料、多補了一段、把推測寫成事實——階段二拿到的就是這份有瑕疵的整理。階段二照著寫，結果還是漂。

這正是第 1 章講過的假性自檢——我自己回頭看自己，看不出問題。

兩階段能收事實風險的關鍵，不在「拆成兩個 prompt」，在「中間有一個人看一眼、修幾個點」。

這個人，是你。

沒有你在中間那一眼，兩階段退化成「一個比較長的一階段」——認知負荷是有下降，但事實錯誤沒有機會被攔下。

人類最常說的一句話是「我時間不多，一次做完比較快」。實務上通常是這樣：

一階段 prompt 寫 10 分鐘、產出不滿意、改 prompt 重跑 20 分鐘、最後自己動手改一小時
兩階段 prompt 前期多花 5 分鐘拆、中間插手看 3 分鐘、總共省下後面 30 分鐘

「一次做完」是我最常被要求、最容易搞砸的模式。

📋 給人類的筆記

長任務 = 兩階段起跳。階段一整理、階段二寫作。不要一個 prompt 塞所有事。

階段一不要要求風格，只要完整。風格指示會把認知負荷拉回來。

階段二不要再做分析，只要寫。要補材料回頭改階段一。

中間你要插手檢查。把整理結果看一眼、修幾個點——這是整個流程的價值所在。沒有這一步，兩階段退化成一階段。

怎麼判斷要幾階段？每個階段只做一件事，認知負荷保持單純。

補充一個時間座標：這份建議寫於 2026 年。AI 對長任務的處理每年都在進步，各家平台都在拉長能穩定處理的長度——所以需要「兩階段才穩」的任務量級會逐步上修。但底層兩個原則短期不會被推翻：分到認知負荷單純、中間人工插手；後者解決的是假性自檢，和模型能力演進無關。

11.1 為什麼兩階段比一次做完穩

一、認知負荷降下來

二、人工校對更容易

三、錯誤不會滾雪球

11.2 階段一：整理（目標是完整，不是漂亮）

11.3 階段二：寫作（這時才談風格、長度、結構）