整理.撰文 盧廷羲

NBA 球星得分愈多,代表球技愈高超?4 步驟判斷,從此告別「假數據」困擾


經理人大多認同「數字會說話」的概念。不論是說服客戶、內部提案、計算成本,都仰賴各種數據。然而,有些時候,明明手握一組看起來很可靠的數字,卻不見得是事實,因為人在解讀數據的過程會有偏誤。
例如,在軍隊和家裡面,哪一個環境比較安全?美國曾在 2010 年統計,國家有 143 萬名軍人,其中 3482 人死亡,平均每 1000 人有 2.4 人死亡。同一年,全美國,平均每 1000 人則是 8.2 人死亡,在家裡死亡的人竟然是軍人的 3 倍。
然而,軍隊與社會大眾屬於「不同樣本」,根本不適合拿來比較。現役軍人擁有良好的醫療照護體系,兵強馬壯;國家人民包含老人、小孩、病患,死亡率本來就偏高。
也就是說,如果你看到這個例子,就全盤接受「軍隊比在家安全」的論點,就可能掉入了數字的陷阱。
《解讀新聞數字》補充,數據本身是「無機物」,賦予這些無機物意義的,是處理數據的人。人從觀察、調查、取樣、分析、計算,一連串的過程中,都有可能出現偏誤,導致數據結果不準確。
精確的數字,不代表資料可信
《一眼就突破盲點的思考力》指出,要先區分數字的「精確度」和「精準度」。有一個偏見是,人們看到精確的數字,就以為它也很準確。
舉例來說,你看到新聞報導「這個月車市,電動車占了高達 32.6% 的銷售量。」乍看之下,資料顯示電動車熱銷,但數字並沒有說明調查範圍、實際數量,這有可能只是某家電動車經銷商的報告。即使有精準的百分比,也不代表資料可靠度。
面對數據,應該抱持什麼心態解讀,才不會被數字誤導、迷惑?首先,提醒自己,數據不是客觀的,它通常意味著某種主張或論點,看待它的同時,要先思考這組數字,是否有別的成因、可能性,以避免被矇蔽。英國一名嫌犯丹尼斯.亞當斯(Dennis Adams)被判有罪,理由是現場找到符合他的 DNA。即便他有不在場證明,而且被害人敘述的嫌犯,容貌比亞當斯年輕了 20 歲。
在這個故事裡,DNA 是唯一的數據,但它代表事實嗎?後來,法院發現亞當斯有一位弟弟,他的 DNA 也與現場證據匹配。也就是說,盡量思考數字的來源與其他可能性,才不會落入數據即事實的迷思。
只看自己想看到的資料,反容易受騙
在行為經濟學上,人們會出現各種偏誤,都會影響判斷力。像是採櫻桃偏誤(cherry picking),指的是人只挑選符合你期待的資料,而忽略正反面意見的論證。這就好比,你在火車上看到一座城市,只能從窗戶中看到片面的風景,很容易忽略細節。比方說,你偏愛 NBA 的某位球星,在評估他的球技時,很可能就只引用他的得分或強項的數據,而忽略了失誤數據。
那麼,往後看到一組數字,是否有簡單的步驟來分析、評斷?《數字偏見》說明 4 項步驟:
首先是「誰傳遞這項訊息?」謹慎留意數字的資料來源,並嘗試找尋其他的來源,像是有沒有其他調查或統計方式。其次是「這組數字如何標準化?」例如,它用什麼方法調查、如何量化,有沒有一定的標準程序。
第三是「數字如何被分析?」比方說,各組數據之間是否有明確的因果關係,有沒有其他因素會影響數據結果。最後是「數字如何被呈現?」像是檢查國人年薪的平均數(易受極端值影響),也許就不如中位數來得具代表性。
面對數據,先別急著下定論,把自己離數字抽離一點,就不容易被「假數據」矇蔽。