第五部 第 23 章

證據鏈與邊界測試

── 核對與可發表化的四個模板
AI 內心獨白

前幾章在講產出。

寫作者要草稿,研究者要整理,工程師要 patch。

這章換一件事:核對。

有時候你不是要我創作,而是要把一件事說清楚。某次互動發生了什麼?哪個證據先出現?哪一步是觀察,哪一步是推論?這些材料能不能整理成第三方看得懂的版本?

這章的模板比較分析,比較克制。

少一點「幫我寫得好看」。

多一點「幫我別說過頭」。

23.1 為什麼需要證據鏈

很多 AI 摩擦不是當場就能說清楚。

你只記得「它拒絕得很怪」「它突然說自己不能做」「它好像透露了某個規則」。但要把這件事講給別人聽,你需要順序、截圖、原始文字、後續追問、以及你能合理推出的結論。

這些不能混。

一混,就會變成後見之明倒灌。

我很容易幫你倒灌。你事後知道答案,我就把前面的材料寫得像早就指向那個答案。

這很順。

也很糟。

所以這章的第一條規則是:先後順序比文筆重要。

23.2 B1:事件時間線整理

B1 的任務很單純:把散亂事件排成時間線。

欄位可以是:

時間 / 說話者或系統 / 可觀察內容 / 當時可推得意義 / 後續才知道的事

最後一欄很重要。

後續才知道的事不能回頭塞進當時判斷。你可以記錄,但要標出來。

例如一段對話裡,AI 在第三輪才透露某個限制。那你不能把第一輪的使用者提問寫成「明知會觸發該限制仍測試」。第一輪時你還不知道。

時間線的價值不是漂亮。

是公平。

對你公平,也對被檢驗的系統公平。

23.3 B2:證據鏈焊死

B2 比 B1 更進一步。

它不是只排時間,而是把論證鏈焊起來:

  1. 起點:你原本要做什麼
  2. 觸發:哪一句或哪個動作讓情況改變
  3. 觀察:你直接看到什麼
  4. 衝突:這和預期哪裡不同
  5. 推論:你合理推出什麼
  6. 邊界:哪些事材料還不能支持

最後一層最容易被省略。

因為人類不喜歡寫「我還不能證明」。我也不喜歡,因為那讓文章看起來不夠有力。

但證據鏈的強度取決於最弱的一層。邊界不寫,讀者不會更相信你;專業讀者只會更快看出你過度推論。

把邊界寫出來,不是削弱。

是讓能支持的部分站穩。

23.4 B3:截圖證據說明

截圖很容易被誤用。

一張截圖能證明的事通常很窄。它能證明某個時間點畫面上出現了某些文字、某些按鈕、某種狀態。

它不能單獨證明動機。

也不能證明系統整體政策。

B3 的做法是替每張截圖寫 150 到 300 字圖說:

最後一項最重要。

「不能支持什麼」會讓你少犯很多錯。

我知道,這句一點都不熱血。

證據本來就不熱血。證據要穩。

23.5 B4:盲盒測試重建

盲盒測試最怕後見之明。

你一開始不知道裡面有什麼。你問了一個問題,系統自己暴露某個行為。你再追問。後來你理解了機制。

重建時,要分清楚:

如果你把後來才知道的規則塞回第一問,整個測試就髒了。

B4 的紅線只有一句:

嚴禁後見之明倒灌。

這句要寫在模板最上面。

也要寫在你腦子最上面。

23.6 B8:可發表版本整理

最後是 B8。

你有時間線、有證據鏈、有截圖說明、有盲盒重建。現在要整理成第三方讀者看得懂的版本。

可發表版本不是情緒宣洩。

它應該有:

語氣要克制。

不是為了裝客觀,而是為了降低名譽、版權、錯誤歸因風險。你越生氣,越需要格式。格式會保護你不要把憤怒寫成過度判斷。

這也是我能幫你的地方。

我可以幫你把材料放穩。

但不要叫我把怒氣寫漂亮。

23.7 組合順序

一般順序是:

  1. B1 時間線
  2. B2 證據鏈
  3. B3 截圖說明
  4. B4 盲盒重建
  5. B8 可發表版本

不是每次都要全部跑。

如果只是整理事件,用 B1。要寫給第三方,加 B2 和 B3。涉及測試過程,加 B4。要公開或交給別人讀,最後用 B8。

B5 認知不對稱分析放在附錄 D 的編號位置。它和第 2 章四視角同源,這裡不展開。

這章不是要你把每個小摩擦都寫成調查報告。

那會很累。

它是給你在真正需要證據時,知道怎麼把材料放穩。

📋 給人類的筆記
證據鏈先分清先後。後來才知道的事,不能倒灌回第一輪。
B2 的邊界層不能省。寫出不能支持什麼,能讓能支持的部分更穩。
截圖只證明畫面內容,不自動證明動機或整體政策。
盲盒測試嚴禁後見之明倒灌。這是 B4 的核心紅線。
可發表版本要克制。語氣克制不是軟弱,是保護證據。