Managertoday 經理人

用搜尋引擎管理知識,留住企業競爭力

2019-11-13 09:50:11
Managertoday
http://3.bp.blogspot.com/-zJyHAL61-cI/VFGuUeGCw2I/AAAAAAAAR7Y/-IE1Id_A5DA/s720/shutterstock_154855358.jpg
<span style="color: #ff9900;">採訪‧撰文 / 文及元</span> 「精確地了解使用者搜尋詞條的字義,並且精準地提供使用者想得到的搜尋結果,」Google

採訪‧撰文 / 文及元

「精確地了解使用者搜尋詞條的字義,並且精準地提供使用者想得到的搜尋結果,」Google 創辦人佩吉(Larry Page)曾對「完美的搜尋引擎」如此定義。這是一個「掌握搜尋引擎就能掌握世界」的時代,因此搜尋產業的哲學,就是對現狀永不滿足,透過不斷地研發,才能達到佩吉口中的完美境界。

以企業內部知識管理為例,透過將內部及員工的內隱知識(tacit knowledge)留在e化知識管理平台,並且在平台上內建搜尋引擎功能,就能將之轉化為外顯知識(explicit knowledge)。

假設A員工被裁員,無法完整交接工作給B員工,或是A員工離職後遇缺不補,由於員工知識還留在e化知識管理平台,其他員工便可透過搜尋方式,獲得A員工的知識,以「轉移」方式獲得知識,無須仰賴傳統的「交接」方式,如此一來,企業仍可保有核心競爭力。

跨媒體整合搜尋,取代追求效能
意藍科技技術長楊立偉表示,過去搜尋產業重視效能,各企業紛紛投資硬體設備,積極縮短從鍵入關鍵字到得出搜尋結果的時間。而搜尋產業也以語意搜尋(semantic search自然語言處理(NLP)的研發技術,提升搜尋效能、速度與精準度,以滿足顧客。

不過,硬體再好、研發技術再先進,也有其發展限度。楊立偉提醒,當搜尋速度已經快到肉眼無法辨別的1秒與0.5秒之差,對於企業用戶並沒有意義。再加上經濟不景氣造成廠商開始縮減硬體投資,因此恐將減少對於搜尋效能的需求。

楊立偉認為,2009年搜尋產業的研發關鍵字為「無所不搜」,尤其是對美國出口的企業客戶,由於必須因應美國沙賓法案與e-discovery(electronic discovery的資訊保存與揭露,因而引發企業對於跨媒體搜尋的需求。

想達到「無所不搜」的目標,必須以跨媒體整合搜尋的研發技術為支援,例如企業用戶建立e化知識管理平台,進行企業內部的跨媒體整合搜尋時,無論是基本的電子檔文件、已掃描成圖檔的紙本文件,或是報價單、工程圖等靜態影像檔,甚至是動態影音檔,都可以輕鬆透過知識管理平台的搜尋引擎找到。

跨檔案搜尋,需求殷切
關於搜尋引擎,龍捲風科技產品經理錢偉最常被問到的問題是:「難道沒有『紙本搜尋』的搜尋方式嗎?」由於一般搜尋引擎通常針對電子檔案進行搜尋,但企業內部的文件還是以紙本居多,例如傳真機的往返的紙本訂單,或是用印過的公文等,找起來比電子文件更費事。

這個現況讓研發部門體會到:「只要有眾多資訊集中的地方,就有搜尋的需求」。換言之,搜尋範圍不應局限於一般的電子檔,因而發展出利用多功能事務機、掃描器,甚至是數位相機將把紙本擷取成影像的功能,無須浪費人力將資料重新定義、分類與整理,就能以搜尋引擎找到,如此不但能節省的人力成本,也能兼顧跨媒體搜尋的需求。

此外,「影音搜尋」也將是跨檔案整合搜尋的下一個研發重點,將動態影音檔案納入搜尋範圍,瞬間就能在龐大影片庫中,找到最切中使用者搜尋關鍵字的重要片段。

錢偉表示,「跨媒體整合搜尋」的定義,是將原本局限於電子文件的搜尋,擴大到「影像搜尋」與「影音搜尋」,而這也是各大搜尋引擎廠商最想發展的方向。

例如工程界,愈舊的手繪工程圖愈珍貴,掃描之後建立電子檔,便可搜尋過去的知識再加以活用。又如電視台,不必再耗費人工整理影像中的詞條,就能透過自動摘要與自動關鍵字建立,搜尋找到動影像中字幕、跑馬燈、標題。

不過,錢偉也指出,「使用者想要的其實是更細部的資訊,例如影像中原來僅能透過肉眼辨識的文字,或是影片中一閃而過的街景招牌、不斷變換的跑馬燈、描述影片內容的字幕等等。」這些資訊必須透過光學文字辨識(OCR,Optical Character Recognition)解析,再以「字形容錯」(有些文件因時隔久遠,字跡模糊,掃描判讀時會有混淆,例如「田」與「因」、「團」與「圓」,搜尋引擎必須能加以判讀)或「字詞容錯」(例如,即使打錯為「意大利」也能找到正確的「義大利」)的功能,以補足OCR 無法精確辨識的部分,如此才能將使用者想要的影像與影片搜尋出來,提供給使用者精確的搜尋結果。

搜尋產業讓身處於世界上任何一個角落的人,只要能上網搜尋,人與問題、答案之間,只有單擊滑鼠的距離。因此,跨媒體整合搜尋的研發技術,或許正是朝向佩吉口中完美搜尋引擎發展的解答之一。