成功 Success > 數位工具
feature picture
shutterstock

AI 助手也學會偷懶?表格和轉檔功能受限、要用戶自己找答案!OpenAI 官方回應

2023-12-13 數位時代 陳建鈞
分享
收藏
已完成
已取消

24 小時全年無休的 AI,會想要「偷懶」嗎?近期有大量用戶反應,GPT-4 正變得越來越懶散,不再盡心盡力回答問題,而 OpenAI 也出面表示,他們正在調查這個問題,並且研究如何修復 AI 模型。

Google 剛發布號稱在多個指標上比 GPT-4 更強悍的 AI 模型 Gemini,在這或許是 OpenAI 最需要嚴陣以待的時刻,GPT-4 近來就被發覺出現了「偷懶」問題,不再詳盡解答用戶的疑問,甚至是拒絕回應、要用戶自己找出答案。

延伸閱讀:GPT-4 登場!跟 ChatGPT 差在哪?歷代 GPT 一次比較

GPT-4 變懶了,怎麼回事?OpenAI 怎麼說?

11 月底時,AI 工程師克里希南(Rohit Krishnan)就在推特上抱怨,GPT-4 變得懶散又沒用,希望交給聊天機器人的各種任務都遭到回絕。「轉換這個檔案?太長了。編寫表格?只給前三行。讀取這個連結?抱歉不行。讀取這個 py 檔案(python 程式)?抱歉不允許。這實在太讓人洩氣了。」他在推文中表示。

AI工程師克里希南(Rohit Krishnan)GPT-4偷懶.jpeg
@krishnanrohit on X

提出類似抱怨的不只他一人,創業家麥特.溫辛(Matt Wensing)也指出,GPT 愈來愈抗拒做枯燥的工作,基本上它只會給出一部分答案,然後讓用戶自行解決剩下的部分。

抱怨 GPT-4 愈來愈懶的聲浪在網路上日漸攀升,終於 OpenAI 官方也出面表示,他們已經聽到用戶對於 GPT-4 愈來愈懶的回饋,正在研究怎麼解決這個問題,但強調他們自 11 月 11 日以來,就沒有動過 AI 模型。

OpenAI 解釋,這個說法並不代表 AI 自行改變了模型,只是模型的行為可能出現了微妙的差異,導致提示詞出現退化,這種情況通常要用戶及員工很長一段時間才會注意到,並且修復這樣的變化。

GPT-4偷懶官方回覆jpeg
@ChatGPTapp on X

GPT-4 變笨的事件,也恰好緊接在 OpenAI 爆出宮鬥大戲之後,至於這齣政變戲碼是否有影響內部的運轉或效率,則暫時未可知。

不過 OpenAI 強調,發布新模型時他們都會進行包含 AB 測試在內的各種試驗,依據所有試驗結果確保新模型比舊模型更能帶給用戶幫助,也歡迎用戶持續反應 GPT-4 可能出現的變化、是否變得懶散,幫助他們即時掌握問題狀況。

GPT-4 也曾變笨!實測 6 月份版本的 GPT-4,就比 3 月版本準確度高多了

事實上,這並非 GPT 技術首次「學壞」,早在今年 6、7 月時,就有大批開發者抱怨 GPT-4 「變笨」了,有時會犯下一些愚蠢的錯誤、沒注意到用戶施加的指令,甚至引發外界猜測 OpenAI 是否為省錢降低了運算能力、或者調整模型降低成本。

當時 OpenAI 產品副總裁韋林德(Peter Welinder)公開澄清,「不,我們沒有把 GPT-4 變笨!」聲稱他們每次更新都是讓 GPT-4 比以前更聰明,用戶覺得變笨的情況有可能是因為高度使用下,一些過去沒發現的問題暴露出來。

雖然 OpenAI 強調他們沒有更動模型,但有研究團隊發布報告,用對比今年 3 月跟 6 月的 GPT-4 模型,評估在數學、敏感問題、回應頻率、程式能力、推理能力等諸多面向的表現,其中在數學能力方面, 研究團隊用 500 道題目讓兩個模型判斷質數,結果 3 月份的版本以 97.6% 準確度壓倒性高於 6 月版本的 2.4%

gpt accuracy.jpg
先前GPT-4也傳出變笨消息,且經研究團隊測試在部份數學能力上出現顯著落差。
@svpino via X
延伸閱讀:GPT-4 登場,AI 供應鏈未來兩季將受惠!哪些廠商前景最被看好?

AI 模型會變笨,究竟是什麼原因?

來自史丹佛及柏克萊加大的研究團隊指出,「我們發現 GPT-4 和 GPT-3.5 的表現和行為,在兩個版本中存在顯著差異,並且在某些任務的表現隨著時間越來越差。」他們認為其中一種可能性是 GPT-4 已經從思路鏈偏移 ,這是一種將多步驟問題拆解成複數中間步驟,提升大型語言模型推理能力的技術。

對於 GPT 技術有時莫名出現改變的情況,他們坦承訓練 AI 模型並不像工業製造般明確,投入什麼原料就知道會製造出什麼產品, 即使是完全相同的訓練材料,在不同次訓練當中,也可能催生出性格、文字風格、評估標準,甚至政治偏袒傾向迥異的 AI 模型

一直以來,AI 究竟是如何運作的,常被稱為「黑盒子」,很難從外部去解釋、理解AI是如何做出決策,如此行動的原因等等。即使是引領著生成式 AI 發展的 OpenAI,目前也不明白在沒有更新模型的情況下,GPT-4 突然變得懶散的原因,不過再等待一些時間,開發團隊或許將能修復問題,告訴我們 GPT-4 究竟為何突然發懶。

資料來源:PCMagDigital TrendX
(本文出自數位時代

繼續閱讀 數位工作術 AI
相關文章
領導 Leadership > 領導力
feature picture
經理人

不必比快,但要比AI更懂「價值」:臺大 EiMBA 給管理者的三堂領導力修練

2025-12-09 台大EiMBA
分享
收藏
已完成
已取消

當生成式 AI 以驚人的速度席捲各行各業,管理者面臨的挑戰,不再只是技術導入,而是組織內部真實的人心震盪:員工擔心被取代、團隊在轉型中無所適從、流程因缺乏共識而屢屢卡關。臺大EiMBA執行長李家岩指出,這些問題的核心在於企業的跨域管理思維尚未跟上時代的技術變化。

「過去商管教育的任務,是培養能掌握資訊、做精準判斷的決策者;但在 AI 時代已經不夠了。」他提出一個破框的觀點,未來領導者必須轉型為智慧協奏(SymphonicIntelligence) 的設計者。這與EiMBA強調的 E(Entrepreneurship,創業精神)與 i(Innovation,創新)不謀而合,而在AI潮流下,「i」更進一步指向Intelligence(智慧)。在這裡學員不只是學管理,而是在實驗如何設計一個讓「人腦」與「電腦」互補共生的系統。EiMBA也從實戰課程與學員經驗中,提煉出 AI 時代管理者必備的三大核心能力:擴增智慧、系統設計力與科技人文反思。

臺大EiMBA執行長李家岩
臺大EiMBA執行長李家岩
經理人

能力一:擴增智慧讓 AI 成為決策的鏡子

許多管理者誤以為導入 AI 就是為了自動化、為了取代人力以節省成本。但在李家岩眼中,重點應該是「擴增」而非「取代」。他強調,AI 應該是延伸人類洞察力的一面鏡子,幫助管理者看見過去看不見的盲點,這就是「擴增智慧」。

這並非抽象的理論,而是許多創業者正在面臨的真實挑戰。EiMBA 一年級學員、赤赤子設計師林宏諭就是一個典型的例子。設計背景出身的他,過去經營品牌多仰賴美感與經驗,「以前做決策就是憑感覺,覺得這個會賣就做了,因為自己做比較快。」但在公司規模擴大後,這種依賴個人直覺的決策方式反而成為瓶頸。

但在臺大EiMBA的「雙軸轉型與人工智慧」課堂上,林宏諭被迫面對冰冷的數據與流程,這正是李家岩強調的「數位孿生(Digital Twin)」概念實戰。林宏諭回憶,為了將腦中模糊的「感覺」轉化為 AI讀得懂的SOP,他經歷了一段「像被架著刀子往前走」的陣痛期。「AI 就像一面鏡子,它毫不修飾地反映出流程中的邏輯漏洞。你無法含糊帶過,必須把每一個步驟定義清楚。」

然而,這些痛苦也正是轉型的起點。當感性的創意被裝進理性的數據框架後,林宏諭發現自己的決策不再是賭博,而是可被驗證的科學。AI協助他拆解了供應鏈的每一個環節,建立起可複製的制度。他深刻體悟到,真正的管理不是「自己做」,而是學會把事情交出去。對管理者而言,這就是擴增智慧的真諦,利用 AI 的理性補足人類的感性,建立更穩健的決策邏輯。

能力二:跨域系統設計定義AI的「自主邊界」

第二項關鍵能力,是「跨域系統設計」與「人機協作管理」。李家岩指出,未來的領導者不需要是最會寫程式的人,但必須是最懂得定義「自主邊界(Autonomous Boundary)」的人。這意味著管理者要能精準判斷:哪些流程該放手讓AI執行?哪些關鍵時刻必須保留人類的價值判斷?這項能力在導入AI的過程中特別重要,因為最大的阻力往往不是技術,而是人心。

寵物百分百用戶體驗暨品牌行銷中心負責人鐘紫瀕
寵物百分百用戶體驗暨品牌行銷中心負責人鐘紫瀕
經理人

臺大EiMBA二年級的寵物百分百用戶體驗暨品牌行銷中心負責人鐘紫瀕,分享了她推動 AI 的經驗。她所帶領的團隊橫跨企劃、行銷、數據等不同職能,在一個超過兩百人的組織中,很多一線員工對 AI 既陌生又害怕,甚至第一次使用工具時手足無措。她認為這時候不是要求大家「一定要用 AI」,而是必須重新設計工作流程,讓 AI 真正融入日常。

她把 AI 定位為替團隊處理繁瑣雜事的助理,同時推動內部資料的結構化與標準化,為未來的 AI 查詢介面打下基礎,讓員工能透過 AI 更快找到資訊或生成初步分析。

不再只是把數字貼進報告,而是要求同事利用 AI 找出趨勢、比較同期差異、提出洞察。當員工開始感受到 AI 能讓自己更準時下班,而不是更加焦慮時,協作才真正展開。她強調,即使 AI 能處理掉大部分繁瑣的工作,真正體現人類價值的,仍然是那些需要判斷、同理與溝通的關鍵時刻。領導者的職責,就是設計出一個讓人與 AI 各司其職、互不踩線的協作系統。

赤赤子設計師林宏諭
赤赤子設計師林宏諭
經理人

能力三:科技人文反思問出「為什麼」的能力

在AI能瞬間生成無限選項的世界裡,稀缺的不是答案,而是「問題」。李家岩強調第三項能力:價值遠見領導(Value-based Leadership)。「AI 可以告訴你如何(How)優化流程,但它無法告訴你為什麼(Why)這件事對人類社會有價值。」為培養這種能力,臺大EiMBA將課程進行大幅度革新。例如在「創業專題」課程中引入Vibe Coding技術,讓沒有程式背景的學生也能透過自然語言,快速生成商業模式的原型。但技術只是手段,重點是背後的思維。

李家岩舉例,由臺大EiMBA學生與GMBA學生組成的「RiiVERSE」團隊,成員涵蓋時尚、行銷與永續等不同領域。他們在創業專題中利用專利技術將回收舊衣製成塑膠粒子,再製成電腦鍵盤、家具等商品,成功打造出循環經濟生態圈。更重要的是,這項創新在製程中降低了平均 83%的碳足跡 。不僅是商業模式的勝利,更是對全球 ESG 議題的精準回應。他們之所以能從全球知名的霍特獎(Hult Prize,被譽為學生界的諾貝爾獎)脫穎而出,正因領導者在設計商業模式之初,就不只問「技術可不可行」,更堅持反思「這件事能為社會創造多少具體價值」。

台大EiMBA.jpg
寵物百分百用戶體驗暨品牌行銷中心負責人鐘紫瀕(左)/臺大EiMBA執行長李家岩(中)/赤赤子設計師林宏諭(右)
經理人

這種反思能力,正是臺大EiMBA強調「行動學習」的核心。在這裡,來自不同領域的同學形成了一個微型的「創業生態系」。過去,跨領域溝通往往成本高昂,猶如鴨子聽雷;但在這裏,AI素養成為了大家的「共創語言」。

從「做中學」到「人機共創」,打造未來的領導格局

「我們不提供標準答案,因為AI時代沒有標準答案。」李家岩總結道。臺大 EiMBA 就像一個容許試錯的「實驗沙盒」,讓學員在這裡用真實的數據、真實的專案,去碰撞AI的可能性。從 創立至今,臺大EiMBA始終堅持「創業創新」的初衷;而在 2025 年,這個初衷被賦予了更深刻的時代任務:培養出不只能駕馭 AI 工具,更能定義 AI 價值、設計人機協作體系的新一代領導者。對於正處於轉型焦慮中的經理人而言,這或許正是最需要的一場思維升級。

會員專區

使用會員功能前,請先登入

  • 台灣首款對話式 AI 職場教練,一次提升領導力
  • 會員專享每日運勢、名人金句抽籤
  • 收藏文章、追蹤作者,享受個人化學習頁面
  • 定向學習!20 大關鍵字,開放自選、訂閱
  • 解鎖下載專區!10+ 會員專刊一次載
追蹤我們