feature picture
Gemini

企業以為導入 AI 就像請了免費助理,結果 token 帳單比員工薪水還貴?

2026-06-17
分享
收藏
已完成
已取消

在過去 9 個月內,亞馬遜(Amazon)、Block、Meta、Atlassian 等科技巨頭大張旗鼓裁員,宣告 AI 是降本良策。然而,帳單來了。

Uber 在 4 月就燒光了 2026 年全年的 AI 開發工具預算;據傳有企業忘了替員工設定使用上限,收到一張 5 億美元的 Claude 費用通知單。主管們猛然發現,當初裁員省下的人力成本,恐怕還不夠付這張 AI 帳單。

延伸閱讀:「我們導入 AI 後更省人力,所以決定裁員」醒醒吧,投資人已經不信這套說詞了!

不到半年就燒光全年預算!企業從衝刺 AI 到緊急踩煞車

OpenAI 企業部門負責人亞歷山大.安比里科斯(Alexander Embiricos)說,6 個月前他與客戶的對話還圍繞著「這個 AI 能做什麼、夠不夠好?」現在所有對話都變成:「我們花了好多錢,你有辦法讓我們看清楚錢花到哪嗎?有沒有稽核機制?有沒有 token 管控工具?你們的模型的效率如何?」

FinOps Foundation 執行長史托曼(J.R. Storment)描述,今年 4 月和 5 月,他開始不斷接到企業反映:「2026 全年 token 預算才到 4 月就已經超支 3 倍了。」整個行業的對話風向,從「極大化 token 用量、往前衝刺」(tokenmaxxing),轉成「我們需要設置護欄,該怎麼控制這件事?」

造成 Token 用量大幅上升的原因是 AI 代理(AI Agent)的爆發式普及,Anthropic 的 Claude Opus 4.5、OpenAI 的 GPT-5.1、Google 的 Gemini 3 Pro 等新模型在 2025 年 11 月問世後,大幅強化 AI 代理工具的能力,也大幅拉高整體 token 消耗量。一名 Priceline 員工透露,例行的 Cursor 合約續約報價一口氣貴了 4~5 倍。

工程師管理平台 Faros AI 執行長維塔利.高登(Vitaly Gordon)表示,他最近跟一位技術長談話,對方坦言:「我有一個工程師上個月花了 4 萬美元的 token,我真不知道該阻止他,還是讓全公司都學他。」

錢燒慢了,但不是不燒了

根據 Silicon Data 的 LLM Token 消費指數(LLM Token Expenditure Index),企業花在 AI 語言模型上的錢,從 2025 年 12 月到現在已經翻倍——今年 5 月更出現一波明顯的支出高峰,之後才稍微降溫。

這個數字追蹤的是全市場平均每百萬個「token」的花費,而 OpenAI、Anthropic、Google 等主要供應商都是按 token 量收費,因此這個數字直接反映了市場對 GPU、記憶體與資料中心的需求。

至於近期支出趨緩,Silicon Data 認為,這不代表企業減少使用 AI,而是企業轉向更貴的頂級封閉模型的速度放慢了。

生產力漲 2 倍,token 卻燒掉 10 倍——企業無法衡量巨額花費是否值回票價

問題在於,花出去的錢究竟換回多少產值,至今仍說不清楚。Faros AI 針對 2 萬名開發者長達 2 年的研究發現,產出確實提升了,但 bug 和重寫的量也同步增加。工程管理平台 Jellyfish 的數據同樣指出,用 AI 最多的工程師生產力大約是低用量者的 2 倍,但消耗的 token 卻是 10 倍。

Jellyfish 研究主管尼古拉斯.阿科拉諾(Nicholas Arcolano)補充,受 AI 代理功能爆發帶動,每位開發者的 token 消費量在 9 個月內成長約 18.6 倍。阿科拉諾指出,極端的花費能否值回票價,取決於最終交付的商業價值,例如帶來多少營收,但大多數企業還沒有能力衡量這件事。

延伸閱讀:大家都在學 AI,為何成效差這麼多?微軟:真正拉開差距的是企業環境

需求是真實的,還是補貼撐起來的?

面對失控的花費,市場快速響應。Linux Foundation 本周宣布成立「AI 運算費用標準組織」(暫譯,原文為 Tokenomics Foundation),目標是為 AI token 的使用與計費建立共通標準。

Ramp、Datadog、New Relic 等既有平台陸續推出 AI 費用管理與 token 用量監控功能;Pay-i、Paid 等新創則專攻 AI 投資的成本追蹤與 ROI(投資報酬率)測量。Tokenomics Foundation 預計 7 月正式上線,但企業的帳單問題已經現在就爆了。

高盛預測,2030 年全球 token 用量將是目前的 24 倍。高盛全球股票研究主管詹姆斯.科維洛(James Covello)在 2024 年曾估計,需要 18 個月到 2 年才能判斷湧入 AI 基礎設施的資本能否產生相應回報。

軟體工程師班傑明.霍恩(Benjamin Horne)更進一步指出,AI 大廠的「破紀錄營收」,相當程度上是靠補貼用戶 token 費用撐住。一旦補貼退場,要求每個用戶和企業付出真實算力成本,「那一大塊『需求』瞬間就會蒸發。」

資料來源:Inc.Let's Data ScienceTechCrunchFortune;本文初稿由 AI 協助整理,編輯:支琬清

相關文章

解鎖更多提問機會!

請先登入會員

會員專區

使用會員功能前,請先登入

  • 台灣首款對話式 AI 職場教練,一次提升領導力
  • 會員專享每日運勢、名人金句抽籤
  • 收藏文章、追蹤作者,享受個人化學習頁面
  • 定向學習!20 大關鍵字,開放自選、訂閱
  • 解鎖下載專區!10+ 會員專刊一次載
訂閱方案