經理人用戶成長中心 支琬清
ChatGPT 又爆隱私漏洞:用戶的提問直接被拿去 Google 搜尋?官方稱已修復
分享
你是否也曾向 ChatGPT 詢問私密的感情建議,或用它來草擬敏感的商業計畫?多數使用者可能認為這些對話是私密的,但近期事件顯示,這些內容或許並不如大眾想像的那麼安全。
近日曝光一場被形容為「最詭異的」資料外洩事件,用戶與 ChatGPT 的私密、敏感對話,竟意外地出現在一個完全無關的地方:Google Search Console(GSC)。
GSC 是網站管理員用來監測 Google 搜尋流量的後台工具,本意絕非用來存放私人聊天紀錄。然而,分析顧問公司 Quantable 老闆傑森・帕克(Jason Packer)和他的朋友卻在 GSC 中找到數百筆詭異的「搜尋查詢」,內容包括用戶的感情困擾、企業的重返辦公室計畫等。
在他與網路優化顧問斯洛博丹・馬尼奇(Slobodan Manić)聯手調查後,他們認為這起事件提供一個證據,幾乎能證明「OpenAI 一直把用戶的原始問題原封不動地送到 Google 抓取搜尋結果」。
GSC 驚見私密查詢,感情煩惱、商業機密全曝光!
網站管理員在 GSC 中看到的查詢,通常是簡短的關鍵字或片語。但從今年 9 月開始,一些網站的 GSC 報告中開始出現極不尋常的長句查詢,有時甚至超過 300 個字元。這些查詢內容顯然不是傳統的 Google 搜尋,而是用戶輸入 ChatGPT 的完整提問。
帕克在部落格中分享幾個案例,他表示在單一網站上就發現 200 多筆這類外洩查詢。例如一則查詢是一位女性用戶詢問 ChatGPT 如何判斷某個愛捉弄她的男孩是否喜歡她;另一則則來自一位辦公室經理,內容涉及討論重返辦公室的公告計畫。帕克強調,這次外洩事件的性質,與先前 ChatGPT 對話被 Google「索引」(Index)的狀況完全不同。
在那次事件中,用戶至少還需要點擊「分享」按鈕;而這次,用戶完全是在不知情且未進行任何分享操作的情況下,私密對話就被外洩了。
專家翻出鐵證:OpenAI 繞過 API、直接爬取 Google
調查發現,許多外洩的查詢字串前方,都附加了一個特定的網址「https://openai.com/index/chatgpt/」。換句話說,這些網站之所以外洩,是因為 Google 收到這些查詢時,自動將網址拆解成「openai」、「index」、「chatgpt」等關鍵字。
而有些網站剛好在這些關鍵字的搜尋排名很高,所以 Google 就把這些搜尋流量導給這些網站。結果,這些網站的管理員就能在他們的 GSC 報告裡,看到 ChatGPT 用戶的私密問題。
進一步追查發現,OpenAI 網站上有個「有問題的提問框」。這個提問框不僅會將自己的網址附加到用戶的提問上,還包含一個查詢參數,強制 ChatGPT 執行網頁搜尋。
帕克指出,如果 OpenAI 是透過與微軟(Microsoft)的協議,使用 Bing 的 API 來獲取搜尋資料,這些查詢紀錄「絕對不會」出現在 GSC 中。這些 GSC 紀錄足以推論 OpenAI 在「爬取」Google 搜尋引擎結果頁面,而且是直接使用用戶的原始提問作為搜尋關鍵字。
他們推測這個行為是為了獲取 Google 擁有的即時性資料,如新聞、體育賽事等,而 Google 出於競爭考量,可能不願透過 API 分享這些資料,所以 OpenAI 只好自己去「爬」。
OpenAI 稱已修復!外界質疑是停止外洩,還是停止爬取?
科技媒體《Ars Technica》報導此事後,OpenAI 發言人回應稱,公司已意識到問題,並解決了一個「技術故障」,這個問題「暫時影響了少數搜尋的運作方式」。然而,OpenAI 拒絕證實或否認帕克團隊的爬取理論,也未提供受影響用戶的具體數量。
對於 OpenAI 的回應,帕克抱持懷疑態度。他認為,OpenAI 在打迷糊仗。他們只是補了「洩密」的洞,但還是繼續偷偷去 Google 爬資料。
馬尼奇則提出另一個擔憂,OpenAI 這種大規模的爬取行為,可能加劇 GSC 中出現的「鱷魚嘴」(Crocodile Mouth)趨勢,即網站的曝光量暴增,但實際點擊量卻下降,對內容創作者極為不利。
資料來源:Quantable、Ars Technica、BGR;本文初稿由 AI 協助整理,編輯:支琬清