AI 輸出品質三維度評估框架
用途
用事實正確性、脈絡符合度、可直接使用性三個維度評估 AI 輸出,最終給出星級評定與下一步建議,幫你決定這份輸出能不能直接用。
何時用
- 適合:拿到 AI 輸出要判斷能否直接用、哪裡需要人工核查時用,尤其是對外溝通文件或報告。
- 不要用:只需快速通過 / 不通過判斷時,用更輕量的「三階辨別法」就好;不要為了一份測試草稿跑完整的三維評估。
Prompt
請幫我用三維度框架評估下方 AI 輸出的品質,最後給出可用性星級與下一步建議。
【AI 輸出】
{{貼上要評估的 AI 輸出內容}}
【使用情境】
用途:{{這份輸出要用在哪裡,例如:客戶提案/部門週報/課程講義}}
目標受眾:{{讀者是誰,例如:CEO/工程師/學員}}
成功標準:{{怎樣算「夠好」,例如:數字準確、語氣正式、長度≤500字}}
---
三維度評估說明:
維度一|事實正確性(0-100分)
- 識別內容中「可驗證的聲明」(數字/人名/日期/法規/引用)
- 標記「幻覺風險」項目(無來源或難以驗證的內容)
- 給出分數與清單
維度二|脈絡符合度(0-100分)
- 這份輸出符合指定用途與受眾嗎?
- 語氣、深度、格式是否對齊成功標準?
- 有沒有答非所問或偏離場景的段落?
- 給出分數與說明
維度三|可直接使用性(%)
- 預估這份輸出有幾% 可以直接使用(無需改動)
- 列出需要人工處理的部分
---
總評:
★ 可用性星級(1-5顆星)
⚠️ 最高風險點(一句話)
→ 下一步(最具體的一個行動)範例 / 變體
- 填好變數:{{AI 輸出}} 換成「Claude 剛寫的市場分析摘要」、{{用途}} 換成「投資人簡報第二頁」、{{成功標準}} 換成「數字有來源、不超過 300 字、語氣中立專業」。
- 變體(快速單維度查核):只需要確認事實正確性時,說「只跑維度一,聚焦可驗證聲明與幻覺風險清單,其他兩個維度跳過。」
- 變體(比較兩版輸出):把兩份 AI 輸出都貼進來,說「請用三維度分別評估 A 版和 B 版,最後推薦哪版更值得使用。」
🎯 範例輸出(實測)
在 Claude.ai 跑這句、把
{{變數}}填成「Claude 剛寫的 AI 培訓課程市場分析摘要,準備放進投資人簡報第二頁,讀者為 CEO,成功標準:數字有來源、≤300 字、語氣中立」的結果:
點開看 AI 實際輸出
維度一|事實正確性 73 分
可驗證聲明:「台灣中小企業 AI 採用率 34%(DIGI+ 2025)」「全球企業 AI 培訓市場 2026 年預估 USD 48B」 幻覺風險項目:
- 「領先業者平均課程完課率 82%」— 無標註來源,難以驗證 ⚠️
- 「台灣 B2B SaaS 滲透率高於日本」— 未引用比較基準 ⚠️
維度二|脈絡符合度 81 分
符合 CEO 投資人用途,語氣中立專業。但第三段出現兩段技術術語(LTV/CAC ratio、churn cohort analysis),超出非技術 CEO 的閱讀舒適圈;建議替換為業務語言。長度 287 字,符合 ≤300 字要求。
維度三|可直接使用性 60%
可直接使用段落:開頭市場定義段、結尾投資機會總結 需人工處理:
- 「82% 完課率」需補充來源或刪除
- 技術術語段落建議改寫
- 數字「48B」需確認是 2026 預測值還是 2024 實際值
總評 ★★★☆☆(3 顆星) ⚠️ 最高風險點:幻覺數字「完課率 82%」若被 CEO 在 pitch 中引用而被追問來源,信譽受損 → 下一步:找出「82%」出處,有來源保留,無來源刪除,改用「行業平均約 60-70%(課程平台公開報告)」
💡 實測心得:三維度框架對「看起來很順但有地雷」的 AI 輸出特別有效;實際跑下來,幻覺風險最容易藏在有說服力的具體數字裡,先把所有數字過一遍就能抓出 80% 的問題。
延伸
你有沒有遇過這種情況?AI 給出的內容看起來順,但寄出去之後才發現數字有問題——三維度框架的核心就是在你放行之前,把這個風險顯性化。
簡單來說:三階辨別法是 gate,三維度框架是診斷報告,兩者都有用,看當下需要深度還是速度來選。相關提示語見「AI 輸出三階辨別法」與「資料安全邊界評估」。