成功 Success > 數位工具
feature picture

把問題「說 2 次」,AI 會答得更好?Google 研究證實:這些題目準確率暴增

2026-01-21 數位時代 李先泰
分享
收藏
已完成
已取消

在當前 AI 競爭圖譜中,效能提升往往與算力成本、推理延遲掛鉤。然而,Google Research 團隊最新的研究卻提出了一個反直覺的「低成本」方案:僅透過重複輸入指令(Prompt Repetition),即可在不增加輸出長度的前提下,顯著優化跨模型的效能表現。

要強調的是,這項技術不僅僅是「重複一遍」,它是對因果語言模型(Causal LLMs)注意力機制缺陷的一種技術性補償,為企業級 AI 部署提供了一條極高性價比的升級路徑。

延伸閱讀:當人類不再是思想的創造者,而是中階管理者!AI 時代的「思考外包」有多可怕?

因果語言模型的「單向注意力」瓶頸

為什麼「說兩次」就會對AI的生成結果有幫助?

這是因為當前主流 LLM 架構多為 Causal Language Model,其處理序列的底層邏輯存在一個物理限制:因果性遮罩(Causal Masking)。在模型處理過程中,第 N 個 Token 只能觀察到第 1 至 N-1 個 Token,無法預見「未來的資訊」。

不要慌!這邊所謂的「未來資訊」,主要是指「輸入提示詞(Input Prompt)中尚未讀到的後半段內容」

假設提示詞結構: 「<問題> <文章背景>」

那所謂的因果性遮罩,就是指AI模型讀到開頭的 「<問題>」 時,它在運算當下完全看不到後面還有 「<文章背景>」,因為模型在讀取提示詞時,跟人類一樣也是由左至右、一個字一個字讀的。這對模型理解問題造成了困難,因為它必須在缺乏背景資訊的情況下先處理「問題」。

這就是為什麼提示詞的順序會影響表現。如果您把問題放在最後,模型讀到問題時已經看過文章了;但如果把問題放在最前,模型就「看不到未來(後面的文章)」。無論是哪種順序,都還是讓AI的注意力維持單向。

提示詞重複如何破解「單向注意力」瓶頸?

根據這份報告的發現,所謂的「提示詞重複」(Prompt Repetition)操作非常直觀且簡單。報告中明確指出,這項技術的核心是將原本的輸入 「<提示詞>」 轉換為 「<提示詞><提示詞>」。操作原理如下:

調整後提示詞結構: 「<問題><文章背景> <問題><文章背景>」

其效果就是,當模型讀到第二遍的開頭(即第二個 <問題>)時,原本屬於「未來」的 <文章背景>(在第一遍中),現在已經變成了「過去」的歷史資訊。

報告中提到,這種近乎土炮的方式之所以有用,是因為讓提示詞中的每一個 Token 都能夠「注意到(Attend to)」提示詞中的其他所有 Token,從而模擬出雙向注意力(Bidirectional Attention)的效果。

這種提示詞「說兩次」的招數,適用於哪些情境?

研究針對 Gemini 2.0、GPT-4o、Claude 3.7 及 DeepSeek V3 等 7 種模型進行測試,在 70 項基準測試中取得了 47 勝 0 敗 的驚人紀錄。

以下歸納出最適合使用此招數的兩大情境:

不要求模型推論時

這是最關鍵的判斷標準。如果您的應用場景不需要模型「一步步思考」(Chain of Thought, CoT),這招效果最好。

  • 適用原因: 當模型不進行 CoT 推理時,它往往是一次性直出答案。報告顯示,在這種「非推理模式」下,提示詞重複在 70 個測試中贏了 47 次,且0 次失敗
  • 反之: 如果您已經使用了「Think step by step」等提示詞,重複輸入的效果會變成中性或僅些微提升(5 勝 1 敗 22 平),因為 CoT 本身就會讓模型在輸出時自我重複部分資訊,使得輸入端的重複變得多餘。
模型比較
研究用多個熱門模型(Gemini、GPT、Claude、DeepSeek)和七種基準測試驗證,結果顯示「不開啟推理」時,重複提示在 70 組測試裡贏了 47 組、零敗。
Google

長文本中的「精確檢索」與「定位」

如果您的任務是要求模型在一段很長的文字中,找出某個特定的資訊,這招的效果最為驚人。

具體案例:

  • 找名字(NameIndex): 例如給定 50 個名字,問「第 25 個名字是誰?」。在 Gemini 2.0 Flash-Lite 的測試中,準確率從原本的 21.33% 飆升至 97.33%

  • 找夾心(MiddleMatch): 例如給定一長串名單,問「誰位於某甲和某乙的中間?」。這類任務需要模型精確定位前後關係,重複提示詞帶來的增益非常強勁。

  • 建議: 對於這類較困難的查找任務,報告甚至建議可以考慮重複 2 次(即總共輸入 3 遍,Repetition x3),效果可能比標準的重複 1 次更好。

延伸閱讀:用 AI 取代基層員工,為什麼偏蠢?AWS 執行長:老闆少做一件事,小心「自我毀滅」

重複提示詞不是萬靈丹?

根據這份報告的實驗結果與文獻回顧,雖然「提示詞重複」在許多情況下能顯著提升效能,但在以下 2種特定情境中,此方法可能無效:

已經啟用「推論模式」或思維鏈 (CoT) 時

這是最主要的不適用情境。如果您在提示詞中加入了「一步步思考」(Think step by step)或是使用了像 OpenAI o1 、Gemini 3 這類內建強大推理能力的模型,重複提示詞的效果會大打折扣。

  • 效果判定: 結果呈現中性至僅些微正面(實驗中為 5 勝 1 敗 22 平),不再具有壓倒性優勢,。

  • 原因: 報告指出,當模型進行推理(Reasoning)時,它們通常會在輸出的過程中自己重複提示詞的關鍵部分。既然模型已經會在輸出端「自我重複」,那麼在輸入端手動重複就顯得多餘且沒必要了。

提示詞已經「極度」過長

雖然報告強調「重複提示詞」通常不影響生成延遲,但在極端情況下會有物理限制。例如原本的提示詞已經非常接近模型的 Context Window(上下文視窗)上限,再重複一次可能會導致超出長度限制而無法執行

報告在附錄中提到,對於 Anthropic 的模型(Claude Haiku 和 Sonnet),當處理非常長的請求(例如 NameIndex 任務搭配 3 次重複)時,延遲確實會增加。這可能是因為「預填充(Prefill)」階段的運算時間變長了。

操作要點:真的重複貼上就好

若原本的提示詞包含了「背景資訊(Context)」與「問題(Question)」,操作上真的只需要將這整段內容完整複製並貼上一次即可。

通用公式:

最終提示詞 = [完整原始提示詞] + [完整原始提示詞]

舉例而言,一段沒有重複的原始提示詞如下:

這裡有一份名單:Dale Lopez, Peter Sanchez, Allen Harris...(略)。 請問名單上的第 25 個名字是誰?

那麼,符合報告定義的「重複提示詞」如下:

這裡有一份名單:Dale Lopez, Peter Sanchez, Allen Harris...(略)。 請問名單上的第 25 個名字是誰? 這裡有一份名單:Dale Lopez, Peter Sanchez, Allen Harris...(略)。 請問名單上的第 25 個名字是誰?

值得注意的是,重複的範圍必須是整個提示詞。如果只是單純重複「問題」部分(例如只重複問句而不重複文章背景),在相關研究中顯示並無效果。

結語:懂推論的模型就別用這招了

總結來說,報告測試並驗證了以下模型適用於「重複提示詞」的技巧,可以發現幾乎都是API成本較低的非推論模型。

  • Google: Gemini 2.0 Flash, Gemini 2.0 Flash Lite
  • OpenAI: GPT-4o, GPT-4o-mini
  • Anthropic: Claude 3 Haiku, Claude 3.7 Sonnet
  • DeepSeek: Deepseek V3

要注意的是,若您原本使用的就是 Gemini 3 這類推論模型,「重複提示詞」的效果可能就不會這麼顯著。

最後,Prompt Repetition 可說是 LLM 應用層的一次「優雅補救」。它餘解決了因果模型先天的結構短板。在追求 AGI 的路上,回歸底層邏輯的簡單方案,往往才是最具商業穿透力的破局點。

(本文出自數位時代

繼續閱讀 生成式 AI
相關文章
feature picture
photoAc

你以為自己做比較快,其實是大腦在「走捷徑」!3 個交辦習慣,幫主管跳出救火循環

2026-06-05
分享
收藏
已完成
已取消

身為剛帶團隊不久的主管,你在部門週會前,把下個月活動提案交給 Kevin。你告訴他:「先照過去的格式整理一版,週會前給我看。」

兩天後,Kevin 把提案傳回來。你當初交代的,他都做了:照舊格式整理活動流程、排出時程,也補上預算表。但你讀到一半才發現,這份提案還不能直接拿去週會討論,因為它只回答了「活動要怎麼辦」,沒有整理出「主管現在需要決定什麼」。

這時再請 Kevin 重做,時間已經不太夠。你只好自己把受眾選擇、預算取捨和宣傳排序補上。改到一半,那個熟悉的念頭又浮出來:這不是第一次了,明明交出去的工作,為什麼最後又回到自己手上?

延伸閱讀:聰明主管都知道的領導矩陣:這樣分配工作,部屬能做得快又好

救火的習慣,是一次一次練出來的

這和大腦的省力機制有關。神經科學裡有一個概念叫做組塊化(chunking),當某些行為反覆一起出現,大腦會把它們打包成一套自動流程,不需要每次重新思考。背後的原理是突觸可塑性(synaptic plasticity),一條路走得愈多,大腦就愈會把它當成預設選項。管理工作也會形成一樣的慣性。

如果你過去是靠專業能力升上主管,遇到問題時,最熟悉的處理方式通常是自己下場。部屬做得慢,你補上;成果不如預期,你修改;時間快來不及,你直接接手。每一次救火,都讓「我來處理」這條路徑更順。

要改掉這個習慣,不能只靠提醒自己下次要放手。主管需要把交辦拆成幾個動作,在真實工作裡反覆練習。

習慣 1:部屬沒做到位,先問自己說清楚了嗎?

交辦失敗,常從一句看似清楚的指令開始。

「幫我做一份提案」「整理一下資料」「把客戶名單更新好」,這些說法在主管腦中可能有很明確的畫面,但部屬聽到的只是任務名稱。他不知道這份提案要協助主管做什麼決策,資料要整理到什麼程度,客戶名單更新後要拿來判斷哪件事。

比較好的做法,是在交辦前先把成果講清楚。主管可以說:「這份提案明天會用在部門週會,我需要判斷活動主打對象、預算取捨,以及哪個宣傳管道要先投入。你整理時,請把這 3 件事放在前面。」

這樣一來,部屬不只知道要做一份提案,也知道主管真正要拿這份資料做什麼。

習慣 2:交出去之後,設好 3 個回報點

有些主管擔心自己管太多,交出去後就盡量不問;等到期限前才發現方向偏了,又只好自己收尾。也有些主管剛好相反,一天問好幾次進度,最後部屬覺得自己只是照主管指令做事。

設立檢查點可以避開這兩種極端。 第一次回報,可以確認部屬是否理解任務;中段回報,可以看方向有沒有偏;完成前回報,則用來確認品質是否接近期待。 這些檢查點不是為了盯人,而是讓主管在還來得及調整的時候看到問題,也讓部屬知道什麼時候該同步,不必等到最後才猜主管滿不滿意。

習慣 3:任務交出去,資源也要跟著給

部屬第一次做某項任務,通常不會和主管一樣快。如果任務牽涉跨部門協作,或對方手上同時有其他工作,所需時間還會再拉長。這時,主管如果只用自己過去的速度估期限,很容易把部屬推進不可能完成的節奏裡。

交辦時可以先問:「你完成這件事需要哪些資料?有沒有過去範本可以參考?需要我先幫你和哪個部門溝通?」 缺資料,就給範本;缺經驗,就安排資深同事協助;卡在跨部門,就由主管先把路打通。當資源條件被說清楚,部屬才比較有機會把責任接住。

延伸閱讀:主管愈遲鈍,部屬愈能成長!懂交辦的好主管都做這 2 件事

方法都懂,為何回到工作現場還是改不了?

經理人

知道要交辦,和真正能在工作現場做出來,中間常差了一段練習。特別是時間緊急、品質要求高的時候,主管很容易又回到「我自己改比較快」的舊習慣。《經理人》商管 LAB 推出《高績效主管的交辦學》線上課程搭配 4 週陪跑方案,陪你把交辦放回真實任務裡練習:

1. 改掉自己做比較快的舊反射: 很多主管知道要放手,卻會在時間壓力和成果落差出現時自動接手。陪跑設計透過每週任務與實戰作業,讓你在真實工作中練習重新定義成果、分配責任、留下檢查點。下次遇到類似狀況時,比較不會第一時間把工作接回自己手上。

2. 讓團隊真的接得住任務: 交辦失敗常來自目標、標準、權限與資源沒有說清楚。課程會帶你使用模板與情境練習,拆解交辦前、中、後該說什麼、問什麼、追蹤什麼,讓部屬更清楚自己要負責到哪裡,也知道遇到問題時該怎麼回報。

3. 有人陪你校準交辦盲點: 回到辦公室後,主管最容易卡在「我這樣算微管理嗎?」「現在該不該介入?」陪跑設計透過問題回覆與直播 QA,協助你把真實情境拿出來討論,慢慢抓到放手、支持與介入之間的分寸。

繼續閱讀 領導帶人

Manager AI 幫你提問:

從 25000+管理文章與 800+深度專題為你找答案

內容由AI根據經理人知識庫輔助生成,提問請勿輸入機密資料,請自行判斷準確性。

相關文章

解鎖更多提問機會!

請先登入會員

會員專區

使用會員功能前,請先登入

  • 台灣首款對話式 AI 職場教練,一次提升領導力
  • 會員專享每日運勢、名人金句抽籤
  • 收藏文章、追蹤作者,享受個人化學習頁面
  • 定向學習!20 大關鍵字,開放自選、訂閱
  • 解鎖下載專區!10+ 會員專刊一次載
訂閱方案