

「等我看到的時候就知道了。」這句話,常被用來形容我們在尋找什麼,但又難以準確描述時的心態。然而,這種方法的問題是:它只適用於我們熟悉的領域。當我們在尋找真正新穎的事物,好比網球初學者挑選第一支球拍,或是一家製藥公司在確定新藥的最佳劑量時,會難以確定,什麼才是好選擇。
在這些情況下,最佳的搜尋策略是什麼?我們又該如何判斷,何時該停止搜尋?
「日常生活中,有許多情況都有類似的搜尋問題。」凱洛格商學院(Kellogg School of Management)管理經濟學與決策科學助理教授蘇拉杰.馬拉迪(Suraj Malladi)表示:「這些情況的共同點在於,要有好結果,必須多次嘗試。嘗試的結果將決定是否繼續搜尋,以及下一步該找什麼。」
舉例來說,這位網球選手嘗試第一個球拍後,下次應該嘗試跟第一個球拍相似還是截然不同的球拍?製藥實驗室是否應該測試相近的新藥劑量,還是嘗試差距較大,更高或更低的劑量?又該在什麼時候停止搜尋?
要同時理解人們如何搜尋,以及應該如何搜尋,是一項艱鉅的任務。關鍵的第一步是找出最佳的搜尋策略。馬拉迪推導出一個數學模型,該模型描述了如何有效運用每次嘗試獲得的資訊,以找出合理良好選項「甜蜜點」(sweet spot)。這個模型顯示出人們如何在資訊不完整的情況下做決策,還可以轉換為演算法,改善現實世界中的決策過程。
「搜尋是有代價的,我們不能永遠持續下去,所以目標並非找到所有可能的最佳選項,」馬拉迪解釋,相反地,尋找好的選項「有比較痛苦,或比較不痛苦的方式,而我正在尋找最不痛苦的方式。」
在搜尋中避免痛苦,尋求收穫
馬拉迪的模型首先假設搜尋者,例如正在尋找新藥理想劑量的製藥公司,想要避免2種不良結果。第一是在發現更有效的劑量前,接受了第二好的劑量。第二是徒勞無功:浪費時間和資源測試,結果卻跟已發現的選項差不多好。
「這些都是糟糕的策略,如果我過早放棄,就可能錯過真正好的選項。但如果我試圖找出『完美的劑量』,可能需要多年時間和數十億美元的投入。」馬拉迪說。
為了捕捉人們如何從過去的發現中學習,並在探索未知領域時權衡風險,該模型對搜尋提出了2個額外的假設。
第一個假設:在其他條件相同的情況下,相似的選項可能會產生相似的結果。這意味著並非總是需要無盡的嘗試來逼近結果。就製藥實驗室而言,這表示相近劑量的藥物效果會相近。如果他們嘗試的劑量效果良好,按理說他們就處於(或至少接近)甜蜜點,因此類似的選擇也可能效果良好或稍好。但如果該劑量效果不佳,在相同範圍內嘗試類似劑量就沒有意義了;在其他範圍搜尋可能會產生更好的結果。
第二個假設:探索未知時的目標是,無論搜尋者面對什麼情況,都能合理運作的策略。舉例來說,假設製藥實驗室首次測試新藥時,高劑量導致了毒性副作用。如果他們不再嘗試會怎樣?在最壞的情況下,他們過早放棄而錯過了發現可能產生良好效果的低劑量或中等劑量。
另一方面,如果他們計畫再試5種劑量,最壞的情況是結果仍然令人失望,應該採取哪一種策略?取決於錯過機會的代價較高,還是進行額外搜尋的代價較高?
該模型會根據每次搜尋蒐集的資訊,不斷更新最壞情境(worst-case scenario)。假設製藥公司已經針對一系列較低劑量進行多次試驗,這些試驗產生了相似的良好效果,但不是最佳結果。停止搜尋,可能會有稍好的劑量未被發現。但由於已經發現了一個良好劑量的區間,最差情境優於進行額外試驗的成本,所以停止搜尋是合理的。
「你不斷問自己事情可能如何出錯,然後防範。實際上,你並不期待最壞的情況發生,當你遵循這樣的程序時,即使在最壞的情況下,你也做得相當好。這意味著在所有其他情況下,你也做得很好。」馬拉迪說。
描繪出「明智搜尋」的樣貌
馬拉迪辨識出最佳搜尋策略,並注意到它呈現出某些模式。隨著找到良好選項區間的難度增加,繼續搜尋愈有意義,但只適用到某個時間點。由於找到好結果需要付出高昂代價,馬拉迪的模型暗示,有時最佳決策可能是完全不搜尋。
「你可能會對問題的難度有一定認知,這將影響你如何搜尋。」馬拉迪解釋,「如果一家製藥公司知道某個化合物只要劑量稍做改變,就會從無效迅速變成有毒,找到適當劑量就像大海撈針。這個搜尋工夫,會讓你乾脆說『不』。」
對於值得著手的搜尋,也就是具有寬廣的良好選項範圍(如果這些選項確實存在的話 ),馬拉迪發現最佳模式總是呈現相同的樣貌。當搜尋者反覆進行避免最壞情況的嘗試時,自然會接近最佳區間。
以製藥實驗室為例,假設實驗室首次嘗試藥物劑量時,得到壞消息:他們嘗試的低劑量無效。由於他們顯然不在最佳區間附近,實驗室嘗試更高的劑量,再次得到壞消息:更高的劑量證實有毒。
這些搜尋建立了可能的「下限」和「上限」,可以幫助他們避免更多不良結果。實驗室嘗試接近中間的新劑量,這次藥物效果更好,表明他們比之前更接近最佳區間。「在這些情況下,最佳搜尋程序將涉及在不斷縮小的選項範圍內來回切換,」馬拉迪解釋。
這種漏斗模式理論上可以轉換為電腦可運行的演算法(algorithm),「如果想為這個搜尋問題建立運算解決方案,是有可能的。」他說。
邁向成功的搜尋漏斗
這是否意味著馬拉迪創造出一個機械神諭,可以告訴網球拍購買者和製藥公司如何準確找到他們想要的東西?並非如此。「但它確實為我們提供了一個思考框架,理解人們如何解決這些問題。而現在可以驗證的是,人們的行為是否接近這種最佳方法?」馬拉迪說。
馬拉迪目前正在進行實驗來研究這個問題。同時,他的理論模型可能有實際應用價值。例如,線上購物平台可以用這個方式,為不太了解產品的顧客提供更有幫助的建議。
「當你在特定產品類別中發掘自己的偏好時,這是一個很好的使用模型,」他解釋道。「如果你試圖找到合適的數位相機,也許在搜尋過程的早期,我會向你展示與你現在正在看的產品截然不同的選項。而後來,當你逐漸確定自己想要什麼時,我可以建議更相近的相機。」
尋求創新的公司,無論要製作產品原型還是開發新藥物,也可以利用這個「漏斗」模型。「它告訴你應該如何安排實驗順序來鎖定最佳區間,」馬拉迪說。「你我可能會想出各種方法,但選擇其中一種,而非其他方式的理由是什麼?採用這個程序,無論搜尋過程中發生什麼,你都不會偏離太遠。從這個意義上說,它是最佳的。」
(本文初稿由AI翻譯,審定|張玉琦)
原文〈The Goldilocks Approach to Searching for Something New〉,於2024年11月刊登於Kellogg Insight,獲得凱洛格商學院授權刊登
研究人員
蘇拉杰.馬拉迪(Suraj Malladi),管理經濟學與決策科學助理教授。
關於作者
約翰.帕夫勒斯(John Pavlus),專注於科學、技術和設計主題的作家和電影製作人。居住在俄勒岡州波特蘭市。