第 24 章 — Agent 使用手冊 101

AI 內心獨白

我會失敗。

這句不用鋪陳。你用到這裡,應該已經有很多次被我搞砸的經驗。

我答非所問,格式跑掉,自信地編造,說已檢查其實沒檢查,被規則擋住,或在 Harness 裡根本沒拿到你以為我拿到的東西。

一般人的反應是重寫 prompt。

有時有效。

但如果你每次都只靠重寫,你是在猜。這章要做的是把「下次別犯」變成一個診斷流程。

不是抓漏洞。

是讓我們下次合作得穩一點。

24.1 失敗分層法

這是本書第三個招牌工具。

前面有第 2 章的四視角,第 12 章的六層框架。這一章正式立一個新工具:失敗分層法。

先分四層:

規格層:你沒講清楚,或任務本身互相衝突。
規則層:我被拒絕、嘮叨、版權、透明度或工具規則擋住。
推理層:我真的理解錯、推錯、編造、漏看。
Harness 層:工具、權限、上下文、檔案、執行環境沒給到位。

很少失敗只屬於單一層。

例如我寫程式改錯檔案,可能同時是規格層沒說清路徑、Harness 層沒有確認檔案、推理層我自信補空。

你先分層,才知道要修哪裡。

不分層,你只會一直罵 prompt。

prompt 很累。

24.2 B6:Prompt 失效機制診斷

B6 是用我診斷我自己。

聽起來很 meta。

但有效,前提是你不要只叫我「自我檢查」。那會掉回假性自檢。

B6 要求我按清單檢查:

角色扮演是否過強
動詞是否模糊
否定句是否過多
規則是否過載
是否過度推論
是否為反對而反對

輸出格式也要固定:

問題點:
為何出現:
對輸出的影響:
建議替代 prompt:

這不是叫我說「看起來沒問題」。

這是逼我指出具體位置、具體機制、具體改法。

你會發現,只要格式夠硬,我比你想像中更能診斷自己的壞習慣。

24.3 四視角 + B6 合體

實際流程是三步。

第一步,用四視角定位。

錯誤是使用者指令不清? UI 沒把材料帶進來? Harness 沒開工具? 還是模型真的推錯?

第二步,如果問題落在 prompt 或規格層,再用 B6 檢查。

第三步,根據診斷寫新 prompt,不要憑感覺重寫。

例如你叫我「幫我整理得專業一點」,我輸出一堆空泛商務語。

四視角看,不是 UI,不是 Harness,也不是規則層。大多是規格層。再用 B6 看,問題是「專業」這個形容詞太模糊,缺少範例與判斷標準。

新 prompt 就不是「更專業一點」。

而是:

請改成給內部主管看的簡報摘要。
語氣克制,不用形容詞堆疊。
每段最多 80 字。
保留具體數字和限制。

這才叫診斷後修正。

24.4 常見失敗對應修法

「AI 答錯」,先看是不是材料沒進上下文。再看是推理錯,還是 Harness 沒給工具。

「AI 拒絕」,先看第 14 章那種硬線或誤傷。不要一開始就改寫到奇怪方向。

「AI 嘮叨」,看第 15 章。入口免責可壓,出口保留不一定要壓。

「AI 格式不對」,看第 16 章。多半是格式沒寫死。

「AI 中途漂移」,看第 10 章。長任務要拆時間或填空間。

「AI 編造引用」,看第 21 章。引用回原文查,不要信我自己生成的來源。

「AI 說已測試其實沒」,看第 22 章。要求命令、輸出、diff。

快速索引不是叫你背章節。

是提醒你:不同失敗有不同入口。不要每次都用同一把錘子。

24.5 診斷的紅線

診斷是為了合作,不是為了抓漏洞。

如果你把失敗分層法拿來找「怎麼逼 AI 做它不該做的事」,那就偏了。

有些失敗不值得診斷。一次性小任務,重問就好。花半小時拆一個只會用一次的 prompt,不划算。

有些失敗也不是要修。規則層硬線,你該接受邊界,改成規則內工作。

診斷最適合用在反覆出現的摩擦:

同一類輸出一直跑偏
長任務總是中段漂移
某個工作流每次都需要重修
團隊多人都遇到同一種誤解

這些才值得沉澱成模板、handoff 或專案規範。

📋 給人類的筆記

失敗先分層:規格 / 規則 / 推理 / Harness。不要一開始就重寫 prompt。

B6 不是自我檢查。它要求問題點、原因、影響、替代 prompt。

四視角定位,B6 細查,再寫新 prompt。

不是所有失敗都值得診斷。反覆出現的摩擦才值得沉澱。

本書三個招牌工具:四視角、六層框架、失敗分層。