林柏源
維基百科不忍了!公布「抓包 AI 味指南」:這些用字,6 句型、語氣與格式都上榜
分享
隨著生成式人工智慧(AI)技術普及,維基百科正面臨內容維護的新挑戰。維基百科社群近期整理了《人工智慧寫作跡象》(Wikipedia:Signs of AI writing)指南,協助人們識別並處理 AI 生成的內容。
指南指出,大型語言模型(LLM)如 ChatGPT、Gemini、Claude 等,雖然能生成流暢的文本,但因為運作邏輯基於統計預測,導致寫作風格、格式編排及邏輯表達上,經常暴露出與人類寫作不同的特徵。
解讀這份長達數萬字的內部文件,《經理人》梳理出識別 AI 內容的核心邏輯:
LLM 的原理是預測,導致「平庸」成為特色、空洞成為日常
首先,我們要理解大型語言模型(LLM)的運作原理。
LLM 是基於機率預測下一個字,導致 AI 傾向寫出「統計上最安全」的句子。所以 AI 容易濾掉具體、獨特、帶有稜角的事實,轉而使用宏大、正面但空洞的描述。
舉個例子,如果一個人發明了某種火車掛鉤,人類會寫:「他發明了第一種連接火車的裝置。」但 AI 可能會寫:「他是工業界的革命性巨頭,其遺產對現代交通產生了不可磨滅的影響。」
這就是 AI 的第一個特徵:過度強調象徵意義與重要性。
你會發現,在 AI 筆下,哪怕是一個小鎮的購物中心,也會被描述成「文化遺產的中心」,甚至是「社區團結的燈塔」。這種將具體事實「平滑化」為通用讚美的做法,是識別 AI 最直觀的信號。
AI 是「廢話文學」大師?從用字就能看出來
在編輯台,我們常告誡自己要「言之有物」,AI 則是「廢話文學」的大師。
維基百科《人工智慧寫作跡象》中列出了一系列 AI 慣用的「詞彙黑名單」。
最著名的例子是 "Delve"(深入研究)。在 ChatGPT 普及前,這個詞在日常寫作中並不常見,但在 2023 年後,它的使用率呈指數級暴增。
此外,像是 "Testament"(見證)、"Underscore"(強調)這些詞,如果你在一篇介紹地方小吃的文章中看到它們頻繁出現,那幾乎可以斷定是 AI 的傑作。
另一個有趣的特徵是 「錯誤的範圍」(False Ranges)。AI 喜歡用「從 X 到 Y」的句式來展現廣度,但往往缺乏邏輯。例如:「從宇宙大爆炸的奇點到數位行銷的最新趨勢」。
這種跨度極大、邏輯斷裂的修辭,是 AI 試圖用華麗辭藻掩蓋內容空洞的典型表現。
AI 有「結構強迫症」,從結尾處能看得更明顯
除了文字風格,AI 在格式上也常露出馬腳。
維基百科使用的是一種特殊的語法(Wikitext),但大多數 AI 模型(如 ChatGPT)是基於 Markdown 語法訓練的。
因此,你會在條目中看到奇怪的 "##" 符號(Markdown 的標題格式),或是過度使用粗體字來強調每一項重點。
更明顯的是結構強迫症。AI 生成的文章往往會有一個僵化的結尾,通常是「結論」或「未來展望」。
AI 也喜歡用「儘管面臨挑戰,但⋯⋯」這樣的句式來結尾,試圖給出一個圓滿的、面面俱到的總結。
最危險的幻覺:被偽造的知識、甚至是虛假的來源
最令內容生產者感到恐懼的,是 AI 對於參考文獻的偽造。
AI 會捏造看起來極其逼真的引用來源。它會給出正確的書名、作者,甚至是真實存在的 ISBN 編號,但當你翻開那本書的第 120 頁,會發現根本沒有它引用的那段話。
這種「一本正經地胡說八道」,是 AI 寫作對知識傳播的威脅之一;不僅散播了錯誤的資訊,還偽造了驗證資訊的路徑。
AI 寫作特徵速查表:慣用詞、慣用句型與語氣
根據維基百科《人工智慧寫作跡象》,以下是 AI(特別是大型語言模型如 ChatGPT)常見的寫作習慣、詞彙與格式特徵:
一、慣用詞彙(AI Vocabulary)
| 詞彙(英文) | 中文常見對應 | 使用情境與特徵 |
|---|---|---|
| Delve | 深入研究、鑽研 | 2023 至 2024 年間極度氾濫,2025 年才開始下降。 |
| Testament | 見證、證明 | 常見於「is a testament to」用法(是…的有力見證)。 |
| Landscape | 格局、全局 | 用於抽象概念,如「數位行銷的格局」。 |
| Underscore | 強調、凸顯 | 常誤讓「事件/事實」當主詞來「強調」某事。 |
| Highlight | 突出、強調 | AI 常用於膚淺分析,如「這突出了…的重要性」。 |
| Pivotal | 關鍵的、至關重要的 | 過度用於形容任何轉折,即使事件不重要。 |
| Intricate | 錯綜複雜的 | 形容設計、歷史、風味等。 |
| Nuanced | 細緻入微的 | 即使內容單薄,仍說成「細緻、有層次」。 |
| Vibrant / Bustling | 充滿活力的 | 描寫城市、市集、社區的標準模板。 |
| Showcase | 展示 | 行銷語氣,如「展示品牌的承諾」。 |
| Foster | 促進、培養 | 「促進團結」「培養創新精神」等。 |
| Align with | 與…一致 | 多出現在商業、政策描述。 |
| Enduring / Lasting | 持久的、不朽的 | 如「留下不可磨滅的印記」「持久的遺產」。 |
二、慣用句型與語氣(Sentence Structures & Tone)
1. 否定平行結構 (Negative Parallelisms)
句型: "Not only X, but also Y"(不僅是 X,更是 Y)或 "It is not just about X, it is about Y"。
特徵: 試圖賦予平凡事物深刻意義。
例句: 「這不僅是一幅畫,更是一份記錄她心理敘事的視覺文獻。」
2. 虛假範圍 (False Ranges)
句型: "From X to Y"(從 X 到 Y)。
特徵: X 和 Y 往往風馬牛不相及,或者是從具體到抽象的硬湊。
例句: 「從解決問題的工具,到科學發現的藝術表達。」
3. 說教式免責聲明 (Didactic Disclaimers)
句型: "It is important to note/remember..."(值得注意的是/重要的是要記住...)。
特徵: 像教科書一樣指導讀者該怎麼想,常見於段落開頭或結尾。
4. 模糊歸因 (Vague Attributions)
句型: "Critics argue..."(批評者認為...)、"Observers have cited..."(觀察家指出...)。
特徵: 使用「黃鼠狼話術」(Weasel words),不指名道姓,製造有來源的假象。
5. 三段式排比 (Rule of Three)
句型: 列舉三個形容詞或短語。
例句: 「它融合了歷史的深度、文化的豐富性與現代的活力。」
6. 僵化的結尾 (The "In Conclusion")
句型: "In summary..."(總結來說)、"Overall..."(整體來看)。
特徵:AI 習慣寫小作文,最後一定要來個昇華。
三、標點與格式(Punctuation & Formatting)
| 類型 | 常見行為 | 說明 |
|---|---|---|
| 破折號過度使用 | 句中大量插入補述 | 形成 AI 文風 |
| 標題大小寫異常 | 全部單字首字母大寫 | 不符合維基百科的標準 |
| 粗體使用過多 | 將許多文字敘述加粗 | 過多強化論述 |
| 垂直列表與小標格式 | 標題:說明 | 例如 歷史背景:... |
| Markdown 殘留 | ## 或 ** 未清除 | 反映模型預設輸出格式 |
| Emoji 出現 | 🚀🧠📘 | 在正式文章異常醒目 |
AI 是一個強大的工具,但目前還無法取代人類對於「真實」的感知。作為讀者,當看到一篇文章充滿了「AI 味」時,請多一份警惕。
真正的知識,往往是樸實、具體且有稜角的。在這個 AI 生成內容氾濫的年代,辨識出「人味」,或將成為我們最寶貴的能力之一。
參考資料:wikipedia;本文初稿由 AI 協助整理,編輯:林柏源