成功 Success > 數位工具
feature picture
OpenAI

ChatGPT 將支援圖像辨識及語音功能!一文解析 GPT 的演進

2023-09-27 整理 · 撰文 許永昕
分享
收藏
已完成
已取消

OpenAI 9 月 25 日宣布,ChatGPT 新功能上線,將支援圖像辨識及語音功能,也能把 podcast 轉成其他語言,未來兩周內會優先提供 ChatGPT Plus 用戶體驗。

2022 年尾 OpenAI 發表了 ChatGPT 這款聊天機器人後,它理解文字和產出內容的能力顛覆了人們的想像,發布後短短 5 天內就有超過 100 萬人註冊使用,在全球各家新聞以及社群媒體上引發軒然大波。ChatGPT 究竟是什麼?背後的技術「生成式 AI」又是什麼?一次帶你讀懂:

ChatGPT 顧名思義是指可以「對話」的 GPT 版本,GPT 的全名為「生成型預訓練變換模型(Generative Pre-trained Transformer)」,是由 OpenAI 所開發的一種語言模型,能使用深度學習技術讓它學習字詞之間的關聯,以此來生成類似人類產出的文本,ChatGPT 背後採用的的模型是 GPT-3.5。

ChatGPT 可以針對使用者問題給予相應的長篇回覆,寫電腦程式碼、翻譯文章,甚至是撰寫論文、劇本、小說等,在對談上也相當自然流暢,比起 Google 助理以及 Siri 基於預先設定的資料庫和演算法,執行預先設計好的固定功能,ChatGPT 可謂是更加強大的「超級智慧助理」。

延伸閱讀:ChatGPT 怎麼用?6 種 ChatGPT 應用方法,利用 AI 簡化工作

GPT如何運作?

《都問 AI 吧》一書提到,GPT 就像一個向量網路,在這裡每個詞或語言元素都被分配一個獨特的向量或數字,並使用「Self-Attention」(編註:電腦程式理解句子或文本的背景和意義的一種方式)的機制判斷不同詞語的相關性與重要性。也就是說,GPT 的運作原理如下:

使用者輸入句子 → 透過 Self-Attention 拆解轉換為向量 → GPT 利用這些向量找到內容 → 重新生成有意義的內容

我們可以這樣想: 訓練 GPT 如同我們在閱讀書籍,透過大腦拆解書以及其中的句子,分別劃上重點、做成筆記後收錄起來,當未來被問到相關的問題時,我們的腦子就會拆解這個問題,並從這些整理過的資料庫裡找到最相近的答案後,重新生成有意義的回答。

ChatGPT 的演進

第一代的 GPT 模型 GPT-1 在 2018 年 6 月問世,能做到語意判斷、文本分類、問答與常識推理等任務,而 2019 年所推出的 GPT-2 版本則能根據既有的文章接續生成新的且有意義的內容,並執行翻譯或是總結等語言任務。

在 2020 年,OpenAI 發表了 GPT-3,它相比上一代 GPT-2 具有更大的模型參數,包括 1750 億個參數,而 GPT-2 只有 15 億個參數。這使得 GPT-3 能夠處理更大、更複雜的資料,並生成更具多類型的文本。然而,由於全球當時正面臨新冠肺炎疫情問題,導致人們對於人工智慧領域的關注大幅降低,此外 GPT-3 無法進行智能對話也被視為一大缺陷,這代表它只能執行單向的任務,在實際應用上存在諸多不便。

這也是為什麼使用 GPT-3.5 模型的 ChatGPT 在推出後能受到大量關注與熱議,因為對許多人來說,評估一個人工智慧模型的好壞是在於「溝通能力」,模型能否在一次來回的對話中聽懂使用者的問題,並給予令人滿意的答案,這比模型背後的知識量更受到關注。ChatGPT 主打對話模式,甚至可以承認錯誤、且拒絕不恰當的請求,更接近人類對話與思考方式的特點也吸引了全球的目光。

而在 2023 年 3 月,OpenAI 發表了 GPT-4,根據官網介紹,新一代的 GPT-4 重點在於提升利用現有數據的能力,除了能夠處理多達 2.5 萬字的長篇內容,和 ChatGPT 相比提升 8 倍之多,還可以支援圖片輸入以及圖像辨識,懂得「看圖說故事」。

ChatGPT 的出現,也讓機器是否會取代人類的相關討論不斷湧現,畢竟過去是由人類創造機器,機器只會根據指令完成任務,不會自行「創造」。直到可以從現有數據中生成新內容的「生成式 AI」(Generative AI)此一研究領域獲得長足發展。

生成式 AI 產出的內容可以是圖像、文本甚至音樂,不過它生成的內容可能是錯誤的,卻因為設計使然,可能乍看很有說服力;生成式 AI 也可能會產出帶有偏見的內容,因為它被「餵食」的內容可能本身就包含性別、種族等普遍存在的偏見。

生成式 AI 技術對於各個產業的影響

《AI 生成時代》中提到,生成式 AI 可以自動化處理繁瑣且耗時的任務,快速並準確地分析大量資料、提升任務的效率和準確性,並提高組織的速度與敏捷性,改善組織內部的協作和溝通。可以想見未來 AI 工具將在各行各業更為普及。

例如對新聞媒體工作者而言,可透過 AI 語音轉文字工具即時取得訪談文本,也可透過生成式 AI 生成新聞稿或是自動撰寫摘要、協助整理二手資訊。《經理人》近期就透過 ChatGPT、Bing 等生成式 AI 工具,協助收集資料、外部情報,藉此縮短特定類型文章的寫作時間、電子報的製作時間,或協助優化文章的 SEO。

而對於影視產業而言,生成式 AI 可以提供劇本創作的靈感,在動畫或是特效片的製作上也能透過 AI 解決重複性較高的工作環節,提升生產流程,或是實現一些難以在現實中呈現,甚至是打破自然規律的場景。

電商產業則可以利用生成式 AI 結合 VR、AR 等技術建立虛擬賣場或虛擬主播,達成沉浸式購物體驗,PChome 執行長張瑜珊在《AI進行式:技術展望與產業論壇》便分享,電商產業能應用 AI 生成文案、圖片等行銷素材,幫助商家解決商品上架、管理與銷售的工作時間,或是導入配送、客服環節,讓貨物寄到消費者的手中更順利。

她舉例,銷售保養品的商家,或許能透過生成式 AI 讓商品自動生成在化妝台、梳妝台的情境圖片上,減少製作商品上架素材的時間,強化販售商品的服務,「有 AI 這樣新的工具,可能就多了很多新的途徑來解決(既有)問題。」

生成式 AI 在金融業的應用主要則聚焦在智慧客服與智慧顧問服務兩個方面,透過自然語言處理技術,讓機器人立即回應客人的需求,減少客人等待的時間,也減輕真人客服的壓力。

不過,考量到法規、企業機密與資安等問題,目前許多金融業對於生成式 AI 的導入格外小心,這也是許多產業導入新數位工具的擔憂。

延伸閱讀:讓 AI 幫你寫信!ChatGPT 下對關鍵字,再詞窮也能快速生成一封 email

AI 的未來發展

《AI生成時代》指出,人工智慧的發展在未來將趨於通用化與專業化,透過訓練與微調,模型將能在各類任務場景中都能通用,並且在接受海量的數據訓練後,能勝任更加複雜的專業任務。

此外「仿人」一直是AI相關研究的技術推動力,也是人類發展人工智慧最直接的想法,包含模仿人類的學習過程、認知方式,科學家不斷嘗試用各種維度仿造人腦,一旦人類更了解自身的智慧是如何產生,人工智慧的發展勢必將迎來新的突破。

但生成式 AI 是否會生成不符合人類社會的規範與倫理的內容,亦或是被有心人士拿去用於有害或是非法目的,甚至是在未來若人工智慧讓機器擁有獨立思考的能力,是否將完全脫離人類的控制,這些都是技術發展當中須要被解決的問題。

資料來源:《AI生成時代》《都問AI吧》McKinsey & Company

繼續閱讀 數位工作術 AI
相關文章
feature picture
photoAc

你以為自己做比較快,其實是大腦在「走捷徑」!3 個交辦習慣,幫主管跳出救火循環

2026-06-05
分享
收藏
已完成
已取消

身為剛帶團隊不久的主管,你在部門週會前,把下個月活動提案交給 Kevin。你告訴他:「先照過去的格式整理一版,週會前給我看。」

兩天後,Kevin 把提案傳回來。你當初交代的,他都做了:照舊格式整理活動流程、排出時程,也補上預算表。但你讀到一半才發現,這份提案還不能直接拿去週會討論,因為它只回答了「活動要怎麼辦」,沒有整理出「主管現在需要決定什麼」。

這時再請 Kevin 重做,時間已經不太夠。你只好自己把受眾選擇、預算取捨和宣傳排序補上。改到一半,那個熟悉的念頭又浮出來:這不是第一次了,明明交出去的工作,為什麼最後又回到自己手上?

延伸閱讀:聰明主管都知道的領導矩陣:這樣分配工作,部屬能做得快又好

救火的習慣,是一次一次練出來的

這和大腦的省力機制有關。神經科學裡有一個概念叫做組塊化(chunking),當某些行為反覆一起出現,大腦會把它們打包成一套自動流程,不需要每次重新思考。背後的原理是突觸可塑性(synaptic plasticity),一條路走得愈多,大腦就愈會把它當成預設選項。管理工作也會形成一樣的慣性。

如果你過去是靠專業能力升上主管,遇到問題時,最熟悉的處理方式通常是自己下場。部屬做得慢,你補上;成果不如預期,你修改;時間快來不及,你直接接手。每一次救火,都讓「我來處理」這條路徑更順。

要改掉這個習慣,不能只靠提醒自己下次要放手。主管需要把交辦拆成幾個動作,在真實工作裡反覆練習。

習慣 1:部屬沒做到位,先問自己說清楚了嗎?

交辦失敗,常從一句看似清楚的指令開始。

「幫我做一份提案」「整理一下資料」「把客戶名單更新好」,這些說法在主管腦中可能有很明確的畫面,但部屬聽到的只是任務名稱。他不知道這份提案要協助主管做什麼決策,資料要整理到什麼程度,客戶名單更新後要拿來判斷哪件事。

比較好的做法,是在交辦前先把成果講清楚。主管可以說:「這份提案明天會用在部門週會,我需要判斷活動主打對象、預算取捨,以及哪個宣傳管道要先投入。你整理時,請把這 3 件事放在前面。」

這樣一來,部屬不只知道要做一份提案,也知道主管真正要拿這份資料做什麼。

習慣 2:交出去之後,設好 3 個回報點

有些主管擔心自己管太多,交出去後就盡量不問;等到期限前才發現方向偏了,又只好自己收尾。也有些主管剛好相反,一天問好幾次進度,最後部屬覺得自己只是照主管指令做事。

設立檢查點可以避開這兩種極端。 第一次回報,可以確認部屬是否理解任務;中段回報,可以看方向有沒有偏;完成前回報,則用來確認品質是否接近期待。 這些檢查點不是為了盯人,而是讓主管在還來得及調整的時候看到問題,也讓部屬知道什麼時候該同步,不必等到最後才猜主管滿不滿意。

習慣 3:任務交出去,資源也要跟著給

部屬第一次做某項任務,通常不會和主管一樣快。如果任務牽涉跨部門協作,或對方手上同時有其他工作,所需時間還會再拉長。這時,主管如果只用自己過去的速度估期限,很容易把部屬推進不可能完成的節奏裡。

交辦時可以先問:「你完成這件事需要哪些資料?有沒有過去範本可以參考?需要我先幫你和哪個部門溝通?」 缺資料,就給範本;缺經驗,就安排資深同事協助;卡在跨部門,就由主管先把路打通。當資源條件被說清楚,部屬才比較有機會把責任接住。

延伸閱讀:主管愈遲鈍,部屬愈能成長!懂交辦的好主管都做這 2 件事

方法都懂,為何回到工作現場還是改不了?

經理人

知道要交辦,和真正能在工作現場做出來,中間常差了一段練習。特別是時間緊急、品質要求高的時候,主管很容易又回到「我自己改比較快」的舊習慣。《經理人》商管 LAB 推出《高績效主管的交辦學》線上課程搭配 4 週陪跑方案,陪你把交辦放回真實任務裡練習:

1. 改掉自己做比較快的舊反射: 很多主管知道要放手,卻會在時間壓力和成果落差出現時自動接手。陪跑設計透過每週任務與實戰作業,讓你在真實工作中練習重新定義成果、分配責任、留下檢查點。下次遇到類似狀況時,比較不會第一時間把工作接回自己手上。

2. 讓團隊真的接得住任務: 交辦失敗常來自目標、標準、權限與資源沒有說清楚。課程會帶你使用模板與情境練習,拆解交辦前、中、後該說什麼、問什麼、追蹤什麼,讓部屬更清楚自己要負責到哪裡,也知道遇到問題時該怎麼回報。

3. 有人陪你校準交辦盲點: 回到辦公室後,主管最容易卡在「我這樣算微管理嗎?」「現在該不該介入?」陪跑設計透過問題回覆與直播 QA,協助你把真實情境拿出來討論,慢慢抓到放手、支持與介入之間的分寸。

繼續閱讀 領導帶人

Manager AI 幫你提問:

從 25000+管理文章與 800+深度專題為你找答案

內容由AI根據經理人知識庫輔助生成,提問請勿輸入機密資料,請自行判斷準確性。

相關文章

解鎖更多提問機會!

請先登入會員

會員專區

使用會員功能前,請先登入

  • 台灣首款對話式 AI 職場教練,一次提升領導力
  • 會員專享每日運勢、名人金句抽籤
  • 收藏文章、追蹤作者,享受個人化學習頁面
  • 定向學習!20 大關鍵字,開放自選、訂閱
  • 解鎖下載專區!10+ 會員專刊一次載
訂閱方案