文獻綜述與研究合成器

用途

把你收集到的多篇文獻或研究摘要合成為結構清晰的文獻綜述報告，自動找出共識、矛盾、研究缺口——讓你不用手動比對十幾篇論文才能看清全局。

何時用

適合：撰寫論文、顧問報告或課程綱要前，需要整合多個來源的觀點和結論；想對某主題建立有深度的知識底層而不只是零散資料。
不要用：只有單篇文件需要摘要時，不需要合成，直接請 Claude 摘要即可；也不適合處理你根本沒讀過的原始資料——這個工具是「合成」，不是替代你閱讀。

Prompt

text

請幫我對以下文獻做結構化的研究合成。

【研究主題】{{例如：AI 工具對知識工作者生產力的影響、台灣中小企業數位轉型障礙}}

【文獻摘要清單】
請在每篇前加 [N] 作為引用標號：

[1] 標題：{{文章/論文標題}}
   來源：{{期刊/媒體/URL，年份}}
   摘要：{{貼入 100-500 字的核心內容或你的閱讀筆記}}

[2] 標題：{{...}}
   來源：{{...}}
   摘要：{{...}}

（依此類推，建議 3-10 篇）

---

請輸出以下五個部分：

**執行摘要（3-5 句）**
這些文獻合在一起告訴我什麼？

**主題共識**
各文獻都同意的核心發現，條列 3-5 點，每點附引用標號 [N]

**爭議與矛盾**
不同文獻在哪些觀點上出現歧異或矛盾？
- 每組矛盾：[立場A]（[N]）vs [立場B]（[N]）+ 可能的解釋

**實務啟示**
這些研究發現對我的 {{使用目的：例如課程設計、顧問提案、產品開發}} 有何具體意涵？

**研究缺口**
這些文獻沒有覆蓋到、但對你的主題重要的面向

---
規則：
- 所有主張都必須附對應的引用標號 [N]
- 不得發明文獻中沒有的論點
- 若文獻太少不足以得出結論，標注「文獻量不足，以下為暫時性歸納」

範例 / 變體

填好變數：研究主題填「prompt engineering 對 LLM 輸出品質的影響」，貼入 5 篇相關論文摘要，標號 [1]-[5]，讓 Claude 找出共識與矛盾。
變體（快速三篇版）：只有 3 篇文獻時，省略「研究缺口」部分，其他四個部分各縮減到 2-3 點，適合快速交出初稿。
變體（課程文獻版，搭配 NotebookLM）：先用 NotebookLM 從 PDF 自動生成各篇摘要，再貼入這個提示語做跨篇合成——可以處理大量原始 PDF 而不用逐一手動摘要。

🎯 範例輸出（實測）

在 Claude.ai 跑這句、把 {{變數}} 填成「研究主題：prompt engineering 對 LLM 輸出品質的影響，貼入 4 篇摘要（[1] Wei et al. Chain-of-Thought，[2] Liu et al. Pre-train Prompt，[3] 資策會台灣企業 AI 使用調查，[4] OpenAI System Card GPT-4）」的結果：

點開看 AI 實際輸出

執行摘要

這四篇文獻合在一起告訴我們：prompt 的結構品質對 LLM 輸出的準確性和可用性有顯著影響，且效果因任務類型而異；Chain-of-Thought（CoT）在推理任務上有強實證支持，但在創意生成任務上的優勢不明確。台灣在地調查指出，企業使用者最常見的 prompt 問題是「指令模糊」而非「技術複雜」，表示基礎教育的優先級高於高階技巧。

主題共識

結構化 prompt 優於非結構化：所有文獻都指出有明確角色設定、步驟拆解或輸出格式的 prompt，比無結構 prompt 輸出更穩定 [1][2][4]
任務拆解（分步驟）顯著提升複雜任務準確率：CoT 在數學推理任務上提升幅度 10-20%，多篇研究一致 [1][4]
台灣企業用戶的 prompt 問題是基礎教育問題：67% 的使用者在調查中無法清楚說明他們的 prompt 目標，顯示問題在「想清楚需求」而非「學技術」[3]

爭議與矛盾

CoT 是否對所有任務有效：[1] 主張 CoT 在大多數推理任務有效；[4] GPT-4 系統說明指出，某些創意任務加了 CoT 格式反而降低輸出多樣性，兩者研究任務類型不同，這是背景脈絡差異而非真正矛盾，但需要讀者注意任務類型的適用邊界
Few-shot 效果：[2] 指出少量範例（3-5 筆）在部分任務中有明顯提升；[1] 的 CoT 實驗中 few-shot 效果在大模型才顯著，小模型幾乎無效——文獻量不足，以下為暫時性歸納

實務啟示（課程設計用途）

課程設計優先教「清楚說明任務目標」和「格式約束」，這兩個技巧的實用回報率最高 [2][3]
進階模組可以教 CoT，但需限定在「分析、比較、計算」類任務，不要作為通用技巧推廣 [1][4]
台灣學員的主要問題是「想不清楚需求」，課程裡加入「需求澄清練習」比加入更多 prompt 技巧更有價值 [3]

研究缺口

缺乏針對繁體中文語境的 prompt 效果研究，現有文獻幾乎全是英文環境
台灣企業調查 [3] 的樣本主要是大型企業，50 人以下 SME 的 prompt 問題可能有所不同
四篇文獻都是 2023-2024 年資料，2025 年後的模型（Claude 4、GPT-5）是否讓部分 prompt 技巧的影響縮小，尚無直接研究

💡 實測心得：在每篇摘要裡加上「我覺得最重要的發現：」確實有效——測試中加了這行的版本，Claude 的「爭議與矛盾」那一欄品質明顯更好，因為它知道你真正關心的論點是哪個，而不是從全部內容猜；建議作為固定習慣。

延伸

這個合成器最常見的限制是：輸入的摘要品質決定輸出品質。如果你給的「摘要」只是複製貼上文章前三段，合成出來的報告會很表淺。建議在貼入每篇摘要時，加上「我覺得最重要的發現：」這一行，幫 Claude 抓住你的閱讀重點。

文獻綜述與研究合成器 ​

用途 ​

何時用 ​

Prompt ​

範例 / 變體 ​

🎯 範例輸出（實測） ​

執行摘要 ​

主題共識 ​

爭議與矛盾 ​

實務啟示（課程設計用途） ​

研究缺口 ​

延伸 ​