想做資料分析,不能只靠工程師!管其毅:建立數據團隊前,主管必懂的 2 個觀念

想做資料分析,不能只靠工程師!管其毅:建立數據團隊前,主管必懂的 2 個觀念

經理人 Managertoday
https://bnextmedia.s3.hicloud.net.tw/image/album/2021-09/img-1631529131-35914@900.jpg
建立以數據為核心的營運模式,對企業而言,已經不是該不該做的問題,而是該如何做?管其毅提出兩點經理人在建立數據團隊前該有的先備觀念。
今年 5 月中旬本土疫情爆發,輝瑞(Pfizer)和莫德納(Moderna)等國外疫苗備受討論。但以莫德納為例,你可能不知道的是,它從研發到正式上市,只用了 10 個月左右的時間,甚至去年 2 月初,美國才剛出現零星確診個案,第一批臨床試驗疫苗就已問世。 研究莫德納生技公司個案的哈佛商學院教授馬可.顏西提(Marco Iansiti)、卡林.拉哈尼(Karin R. Lakhani)在《領導者的數位轉型》一書中就指出,莫德納能有如此迅速的動作,歸功於其以數據為中心的營運模式。 mdi-chevron-right-circle 延伸閱讀 資料科學家、分析師、工程師差在哪?一文搞懂你的資料團隊需要哪些人 從研發到製造,財務到供應鏈管理,莫德納都是以一個整合性的資料平台為基礎,嵌入源自每個部門的專業數據,讓技術專家、經理人能運用平台之力,提高不論是預測供應鏈狀況、財務建模、疫苗設計與生產的執行、決策效率。 過去一年多來,全球企業正因 COVID-19 疫情加速轉型。台灣也在本土疫情升溫期間,感受到疫情推力。曾任 ebay、LinkedIn,擁有 20 多年數據科學經驗的矽谷知名資料科學家管其毅,在接受《經理人》專訪時指出,當遠距工作成為日常,人們接觸手機、網路時間愈長,數據累積的速度愈快。 此時,能善用數據分析過往經驗、做預測的企業,更有機會快速找到優化產品或用戶體驗的方法,拉開與競爭對手的距離。 因此建立以數據為核心的營運模式,對企業而言,已經不是該不該做的問題,而是該如何做?管其毅提出經理人在建立數據團隊前該有的兩個先備觀念。 觀念一:數據分析不只是提出預測,能幫助下對決策才有價值 「比起關注 data science(資料科學),經理人更該思考如何借助數據做好 decision science(決策科學)」管其毅解釋,資料科學主要能分成 3 個階段: 首先是描述型分析,也就是透過累積、蒐集來的數據,了解已經發生的事,像產品銷售狀況、現有顧客樣貌等。再來是診斷,釐清現狀有哪些問題、哪些地方應該做更好。最後則透過機器學習、演算法,針對問題,提出預測及未來應採取的行動。 資料科學的 3 階段 一、描述型分析 二、診斷 三、預測 透過數據了解已經發生的事。 釐清目前待解決、需要改善的問題。 提出預測以及未來應採取的行動。 但即便是預測階段,都還是只停在資訊洞察的階段,沒有對公司產生實質助益。管其毅指出,資料科學真正價值應在預測後的最後一哩路,下決策。 比方說,數據分析預測出某商品未來存貨會短缺,此時經理人要下的決策可能有兩種,一種是提前預訂更多該商品,另外是預先將該商品漲價。經理人應就最後決策結果,回頭審視前面的數據分析,是否有助於提升下正確決策的機率。 若該商品的總營業額最終反倒下降代表商業痛點沒有被解決,經理人就應思考、與團隊討論,以後還要多掌握哪些數據分析結果(可能是預測消費者對漲價的反應等)以便經理人下次決策能更有把握,不會選錯。 管其毅指出,雖然經理人早在資料科學當道前,就在學習決策科學,每天要為公司下好幾個決定。但過去經理人習慣聘請顧問,為公司問題提出不同行動方案。 由於行動方案是顧問用其專業設計出來的,最後經理人選擇的方案無論效果為何,都不見得能學到可複製到下次決策的經驗。 「資料科學無論成敗,都能持續優化未來做決策的準度。」管其毅解釋,資料科學所輔助的決策科學,不像顧問提供的一次性解決方案,而是創造一個不斷修正的循環,經理人可以定期定量檢測最近一次的決策結果與品質,回頭討論下次如何做得更好。 觀念二:數據團隊不是找工程師就好,資料科學家應具備 5 種能力 了解數據分析的價值後,經理人還要懂得如何找到對的人、建團隊。管其毅指出,一個完整的數據團隊,通常能分成三種角色:資料工程師(Data Engineer)、機器學習工程師(Machine Learning Engineer)、資料分析師(Data Analyst)。 王宥筑 製圖 資料工程師主要負責較基礎的資料整理工作。將蒐集來的大數據加以清理、篩選,設計一個好的資料存取架構,供人方便查詢、讀取。 而機器學習工程師、資料分析師則屬於資料科學家(Data Scientist)的範疇。管其毅指出,經理人在尋找這方面的人才時,應注意對方是否具備以下 5 種工作能力: 即便有資料工程師整理數據,也該懂得怎麼透過 Python 等軟體,處理、編成數據的能力,對數據有基本使用概念。 要有統計學知識,知道如何設計統計實驗好驗證假設、執行 A/B 測試。 會寫機器學習或人工智慧等演算法,好建出可模擬、預測的統計模型。 具備領域知識(Domain knowledge),像銀行業的資料科學家可能要有風控背景。懂得產業常識,才能根據分析結果提出洞見、思考解決之道。  能把複雜的分析結果,簡單說的能力。比方在調查門市客群樣貌時,不只會說拜訪時間、人數,而是將數據轉變成故事,指出對方可能是利用午休時間來店裡用餐的粉領上班族。如此一來,團隊更方便做後續討論。 mdi-chevron-right-circle 延伸閱讀 消費需求藏在數據裡!以人類學視角洞察數據的 3 種工具,幫你看穿消費者情感、思維 實務上,機器學習工程師負責優化原有用戶體驗,將現成的演算法雕磨更精準;資料分析師則負責就自身產業知識,提出預測及決策依據。 像以 Uber Eats 為例,機器學習工程師可能主要負責首頁的餐廳推薦,讓演算法能更貼近使用者喜好,資料分析師則會想著還能開發哪些新功能,提升使用者黏著度、客單價。 矽谷知名資料科學家管其毅指出,建立以數據為核心的營運模式,對企業而言,已經不是該不該做的問題,而是該如何做。 管其毅LinkedIn 管其毅提醒,初建數據團隊應從公司盈利最大或是成本最多的核心單位開始,將數據團隊的價值發揮在刀口,從小地方開始、不要一開始就想著要建立全部門都互通的數據平台。「像我過去在 LinkedIn 帶的數據團隊,就是從 40 人開始,一步步讓組織看到數據分析價值,最後拓展為 200 多人、各部門搶著合作的團隊。」