新的模型發布通常會被拿來比速度、價格、上下文長度和跑分。但 Claude Opus 4.8 這次被特別強調的一點,是模型在出錯或不確定時更願意標示限制。

這對正在把模型接進工作流的團隊來說很實際。很多失敗不是因為模型完全不會,而是它在半懂的時候仍然給出看似完整的答案。團隊一旦把這種答案接進文件、程式碼、客戶回覆或自動化流程,後面的修正成本會比一開始停下來還高。

為什麼「誠實」是產品能力

在 agent 工作流裡,模型不是只回答一次問題。它可能會拆任務、呼叫工具、改檔案、再交給下一個步驟。如果第一步把不確定的資訊包裝成肯定結論,後面每一步都會放大錯誤。

所以評估模型時,可以加一組很簡單的檢查:

  • 遇到資料不足時,會不會要求補資料?
  • 工具回傳矛盾結果時,會不會指出衝突?
  • 程式碼改動有風險時,會不會說明假設與驗證方式?
  • 長任務跑到一半時,會不會保留狀態與待確認事項?

這些能力不一定會出現在漂亮的 benchmark 表格裡,但會直接影響工作流能不能放心交給 agent。

微課解法

下次團隊測模型,不要只問它會不會完成任務。故意給它一個缺資料、矛盾或有陷阱的任務,觀察它會不會停下來說「這裡需要確認」。

好的模型不是永遠自信的模型,而是知道什麼時候該減速的模型。尤其是要接進自動化流程時,誠實度就是安全性的一部分。

參考來源