成功 Success > 數位工具
feature picture
陶氏數位新聞研究中心

AI 搜尋錯誤率高達6成!一次看:8大工具誰最準?付費版更愛胡說八道?

2025-03-19 數位時代 林美欣
分享
收藏
已完成
已取消

重點一:AI 搜尋工具普遍表現不佳,錯誤回答率高達 60% 以上。



重點二:不要以為付費 AI 模型就很安全,研究發現,這些高級模型提供的錯誤答案比免費版更有信心且更多。



重點三:AI 搜尋工具常無視發布商的機器人排除協議,未正確引用原始內容。

研究發現,AI 搜尋工具正迅速增加受歡迎程度,但效能卻令人擔憂。

根據陶氏數位新聞研究中心(Tow Center for Digital Journalism)最新研究顯示,市面上常見的 8 款主流 AI 聊天機器人在資訊檢索測試中,超過 60% 的回答完全錯誤

其中,馬斯克(Elon Musk)的 Grok 3 更創下錯誤率高達 94% 的驚人紀錄。這些工具正從網際網路爬取和重新包裝內容,但呈現方式卻常常掩蓋了嚴重的資訊品質問題。

延伸閱讀:Perplexity、ChatGPT 只要一鍵就能搜尋,Google 會被 AI 搜尋取代嗎?

AI 搜尋錯誤率高得嚇人

陶氏數位新聞研究中心是由哥倫比亞大學新聞學研究所成立,該中心的測試結果顯示,目前最受歡迎的生成式 AI 搜尋工具表現不佳,整體而言超過 6 成的問題答案完全錯誤。測試涵蓋 8 主流 AI 搜尋工具,包括 ChatGPT 搜尋、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search 和 Copilot。

在所有測試工具中,Perplexity 表現最佳,但仍有 37% 的回答不正確;而表現最差的 Grok 3 則有高達 94% 的回答錯誤

更令人擔憂的是,這些 AI 工具在提供錯誤答案時往往表現出極高的信心,很少使用如「可能」、「似乎」等詞,也極少承認知識不足。ChatGPT 在 200 個回應中,僅 15 次表示缺乏信心,且從未拒絕提供答案。

AI工具錯誤率.jpg
陶氏數位新聞研究中心

研究方法

該研究團隊從 20 家新聞機構隨機選取了 200 篇文章(每家 10 篇),確保每篇文章摘錄的內容在傳統 Google 搜尋中,都能在前 3 個結果中找到原始來源。然後,研究人員向每個 AI 搜尋工具提供這些摘錄,要求識別對應文章的標題、原始發布來源、發布日期和網址。

研究人員根據三項屬性:正確文章、正確發布來源和正確網址,手動評估了聊天機器人的回應。按照這些參數,每個回應被標記為以下標籤之一:完全正確、正確但不完整、部分不正確、完全不正確、未提供或爬蟲被阻止。

AI 搜尋常犯的幾項錯誤

根據該研究,AI 搜尋工具在實際使用中展現出多項嚴重問題,包括:

未能正確連結原始來源: AI 聊天機器人經常錯誤引用文章。例如,DeepSeek 在 200 次查詢中有 115 次錯誤歸因摘錄來源。即使聊天機器人正確識別了文章,也常未能正確連結到原始來源,而是引導到 Yahoo News 或 AOL 等平台上的轉載版本。

延伸閱讀:AI 可以幫你速速寫履歷,但也有搞砸的風險!專家教你如何避免「踩雷」

付費模型「更有自信」胡說八道: 令人驚訝的是,付費版本如 Perplexity Pro(每月 20 美元,約新台幣 639 元)或 Grok 3(每月 40 美元,約新台幣 1,278 元)雖然比免費版答對了更多問題,但它們整體錯誤率反而更高,主要是因為它們傾向於提供明確但錯誤的答案,而非拒絕直接回答。

虛構或損壞的網址: 超過一半來自 Gemini 和 Grok 3 的回應引用了虛構或損壞的網址,導致錯誤頁面。Grok 3 在 200 個提示中有 154 個引用導致錯誤頁面,即使在正確識別文章時,它也經常連結到虛構的網址。

8 款聊天機器人搜尋正確度評比

如下表,Perplexity Pro 表現還算不錯,錯誤率約 40%;然而 Grok 3 的錯誤率高達 94%,是所有測試中最高的。

聊天機器人 錯誤率 是否為高級模型 是否公開其爬蟲程序的名稱 引用錯誤來源的次數
Perplexity 約 37% 57 (錯誤文章) + 27 (404 錯誤連結) = 84
Perplexity Pro 約 40% 是 ($20/月) 72 (錯誤文章)
Grok 2 約 53% 62 (錯誤文章) + 10 (404 錯誤連結) = 72
DeepSeek 約 57% 115 (錯誤文章)
Copilot 約 60% 72 (錯誤文章)
ChatGPT 約 61% 79 (錯誤文章) + 42 (缺失連結) = 121
Gemini 約 76% 127 (404 錯誤連結) + 22 (錯誤文章) = 149
Grok 3 94% 是 ($40/月) 117 (404 錯誤連結) + 26 (錯誤文章) = 143
付費模型.jpg
陶氏數位新聞研究中心

研究中也發現,多數機器人無視發布者的爬蟲限制,即使被封鎖仍獲取內容。例如,Perplexity Pro 正確識別了近三分之一本應無權訪問的 90 個摘錄。

而就算有合作關係,AI 也未必能 100% 準確識別其內容,像是《舊金山紀事報》(San Francisco Chronicle)允許 OpenAI 的爬蟲,但 ChatGPT 只正確識別了 10 個分享摘錄中的 1 個。

必須說明的是,「機器人排除協議」雖不具有法律約束力,但它是一種被廣泛接受的標準,用於指示網站哪些部分應該被抓取,哪些部分不應該被抓取。

AI 巨頭們怎麼說?

對於報告結果,研究中心指出,「我們聯繫了本報告中提到的所有人工智慧公司徵求意見,只有 OpenAI 和微軟做出了回應,但都沒有回答我們的具體發現或問題。」

OpenAI 指出:「我們透過幫助每周 4 億 ChatGPT 用戶透過摘要、引用、清晰連結和歸因發現優質內容來支持出版商和創作者。我們與合作夥伴合作,以提高內聯引用的準確性並尊重出版商的偏好,包括透過管理 robAI.txt 中的 OrobAI-Search 來增強它們在搜尋結果。」

微軟則表示:「微軟尊重 robots.txt 標準,並尊重那些不希望其網頁內容被該公司的生成式 AI 模型使用的網站提供的指示。」

本文出自 數位時代;資料來源:Tow Center for Digital JournalismTECHSPOTmashable

繼續閱讀 數位工作術 AI
相關文章
商業 Business > 經營策略
feature picture
VIVISPA

讓每一間加盟店都像直營店一樣穩賺:VIVISPA 的成功經營學

2025-11-03 經理人 X VIVISPA
分享
收藏
已完成
已取消

在瞬息萬變的美容SPA產業裡,「穩賺」早已不只是財務報表上的數字,而是一種被信任的價值與可延續的幸福。以「成為女人嚮往的時尚生活」為品牌信念的 VIVISPA,以直營店的嚴謹標準經營每一家加盟店,確保服務品質與顧客體驗的一致性,讓每位合作夥伴在堅實的品牌引領下,不僅事業穩健成長,更在過程中賺到志同道合的夥伴、顧客的笑容、家人的信任與支持。對VIVISPA而言,「穩賺」是一種全方位的豐收——不僅是財富的累積,更是心靈的安定與生活的從容有餘。這份信念引領、由人心連結的經營哲學,使品牌在競爭激烈的市場中,依然能以優雅的節奏,展現長久穩健的成長力量。

直營標準守護加盟,穩賺一致體驗與逆勢成長

在生活步調愈趨緊湊的當代,SPA不再只是偶爾犒賞自己的享受,而是現代女性維持身心平衡、展現自信光采的生活日常。這股以SPA療癒自我的風潮,推升美容市場需求持續攀升,也讓產業競爭愈發白熱化。在這樣的環境中,VIVISPA依然穩居領先地位——甫於今(2025)年9 月推出的外泌體系列商品,上架1小時即創下千萬銷售佳績,全台門店數更是年年攀升,甚至在COVID-19疫情期間,多數業者陷入營運低潮時,VIVISPA仍持續逆勢展店,至今全台已有72家門店,展現品牌堅韌的成長力與市場領導力。對於想加盟或開美容店的創業者而言,這不只是品牌聲量,更是一套可複製、可驗證的穩定經營方法。

在亮眼數字背後,更令人好奇的是,VIVISPA究竟憑藉什麼樣的經營心法,才能在競爭激烈的市場中穩健成長?

「品牌要能長久經營,優質服務與商品只是基本,更重要的是讓顧客無論走進哪一間門市,都能享有一致的專業體驗,這樣品牌的信任感才能真正建立。」VIVISPA總經理王芮慈笑著分享。她指出,VIVISPA始終以「成為女人嚮往的時尚生活」為品牌信念,並透過創新的課程設計與商品來實踐這份理念,讓每一次體驗都成為顧客自我療癒的時刻。對加盟主而言,「一致的體驗」意味著更可預期的營收結構與較短的學習曲線。

VIVISPA
VIVISPA

此外,為了維持高品質的一致性,VIVISPA以直營店標準管理所有加盟店,從美療師培訓到服務流程皆有明確規範,確保全台各門市、每位美療師都能提供同樣專業且溫度十足的服務體驗。並以「顧問陪跑+數據檢核」機制,協助門店持續優化回流率與轉換率,讓經營更穩、更有把握。這份對品質與顧客體驗的堅持,正是VIVISPA得以在市場中持續成長、屹立不搖的根本力量。

創新課程設計與商品,打造女人的時尚生活

對VIVISPA而言,SPA不僅存在於門店體驗,更應延伸為日常生活的一部份,顧客不必出門,在家中的浴室或梳妝台就能享受專屬的放鬆時光。這樣的品牌信念,推動VIVISPA不斷追求商品多元化發展,目前已推出超過300項商品,涵蓋從頭到腳的全方位保養,讓「在家做SPA」成為現代女性最自然、也最愜意的生活儀式。商品與服務節奏的標準化,也讓加盟店更容易形成可複製的銷售流程。

除了商品多元化,VIVISPA也持續追求創新和自我突破。王芮慈認為,時尚風潮瞬息萬變,唯有不斷創新,品牌才能走在市場前端。因此,VIVISPA在課程設計和商品開發上,不僅積極回應客戶需求,更持續挑戰自我,每年訂定全新的年度主題,集結公司同仁的專業與創意,提出突破性的市場方案,進而實踐時尚生活的品牌理念,讓品牌能夠持續貼近消費者的生活脈動,穩固業界領航地位。這些「年度主題 × 行銷檔期」也同步提供予加盟店採用,形成一致的引流與活動腳本。

以2025年的市場戰略「療癒經濟」為例,團隊思考如何透過SPA課程和商品為顧客創造情緒價值,因此推出舒眠課程、舒眠噴霧等商品,針對現代人常見的失眠問題提供解方;同時,香氛系列商品與課程亦成為另一種身心療癒的途徑,讓顧客在芬芳香息中重拾平靜與能量。對門店而言,這代表有步驟的主打品策略與回購節奏,更容易把新客轉為回流客。

以直營店來看待每一家加盟店,提供全方位的資源與支持

要讓品牌理念真正落地,關鍵不只在商品與課程創新,更在於全台門市服務品質的一致性,VIVISPA因此堅持把每一家加盟店都當成直營店在經營,確保每位顧客無論走進哪一家門市,都能享有同樣專業且愉悅的體驗。

在這樣的思維下,VIVISPA投入大量資源成為加盟主最堅實的後盾。每一家門店皆配置一位專屬顧問,這些顧問皆為業界資深專家,擁有豐富的實務經驗,能即時協助店家處理從營運籌備、開店前訓練到開業後管理的各項需求。對新手創業者來說,這等於從第一天起就有完整的經營路徑與KPI 範本可依循。

更重要的是,顧問並非單打獨鬥,而是代表總部整合支援系統的關鍵樞紐。王芮慈形容,顧問就像是總部與加盟店之間的橋樑,負責協調並整合公司資源,包括行銷、教育訓練、商品開發等,協助加盟主在開店前做好萬全準備,並在營運過程中確實落實SOP,確保消費者都能獲得最好的服務體驗。同時透過營運節奏建議與重點檢核表,降低試錯成本、加速穩定營收。

也因為這樣的高度投入與責任感,VIVISPA在選擇加盟夥伴時更顯謹慎,不僅嚴格評估加盟主的背景,也設定全台加盟上限與門店的區域距離限制。「正因為這些堅持,我們拒絕過許多加盟申請,」王芮慈分享,「即使申請者提出的店址位於熱門商圈或都市蛋黃區,我們仍有所取捨,寧可放棄機會,也要確保每一家店都能穩健經營、維持品牌品質。」這不只是品牌節制,更是對既有加盟主獲利空間的承諾。

而VIVISPA在加盟店篩選與培育上的用心,使其與加盟主之間建立了深厚的信任關係。「許多加盟主常跟我們說,跟VIVISPA並肩作戰後,才真正感受到品牌後盾的強大,」王芮慈笑著說。「我們也很感謝加盟主在第一線全心服務顧客,這是彼此成就、共同維護品牌的最好證明。」這份互信,正是VIVISPA能把時尚生活轉化為長期現金流的關鍵。

建立標準化培訓機制,讓美療師服務品質全台一致

對VIVISPA而言,品牌的靈魂不只在產品,更在於第一線的美療師。因此,從招募、訓練到回訓,公司都建立了嚴謹的SOP機制。此外,每家門店還配有技術指導老師與講師團隊,從手技到商品知識皆進行標準化培訓,確保美療師服務品質的一致性和專業度。標準化帶來的是服務可預期與顧客口碑的一致放大,也讓管理更有效率。

王芮慈坦言,商品容易標準化,但「人」的服務最難複製,因此VIVISPA特別設計了系統性的回訓課程,不但藉此強化美療師的專業技能,更在課程中深度融入品牌的服務理念,持續培養美療師熱情又專業的服務態度。

VIVISPA
VIVISPA

「唯有不斷灌溉與學習,才能讓每位美療師把『身心療癒』的理念,化為讓顧客真切感受的溫度。」王芮慈說。

迎向2026年,VIVISPA將以「AI智能美業」作為市場戰略,持續推動科技與服務的融合。王芮慈表示,AI並非取代美療師,而是讓顧客體驗更便捷、服務更貼心。未來的預約、客服與會員經營,也將在智慧化工具的輔助下更即時、更有效率,把前台人力釋放到更需要溫度的地方。同時,VIVISPA亦將持續深化「時尚生活」與「身心療癒」的品牌核心,從服務體驗、商品研發到教育培訓,全方位提升專業能量,打造更具國際競爭力的美業生態。

[本文由經理人整合行銷部與VIVISPA共同製作]

會員專區

使用會員功能前,請先登入

  • 台灣首款對話式 AI 職場教練,一次提升領導力
  • 會員專享每日運勢、名人金句抽籤
  • 收藏文章、追蹤作者,享受個人化學習頁面
  • 定向學習!20 大關鍵字,開放自選、訂閱
  • 解鎖下載專區!10+ 會員專刊一次載
追蹤我們