Managertoday 經理人

賽局理論

2019-10-17 06:18:50
Managertoday
http://3.bp.blogspot.com/-20S2Q_bW0rk/VFGvJK43q2I/AAAAAAAASDw/RvBs98NFf1s/s720/shutterstock_149165951.jpg
OutLine課程題綱 我們從淺顯的故事開始引導讀者進入賽局理論這堂課,從靜態到動態賽局的分析方式,並佐以大量的實例來加以說明,面對激烈的產業競爭,你會有更深一層的體會。 **1何謂賽局

OutLine課程題綱 我們從淺顯的故事開始引導讀者進入賽局理論這堂課,從靜態到動態賽局的分析方式,並佐以大量的實例來加以說明,面對激烈的產業競爭,你會有更深一層的體會。

1何謂賽局理論

賽局理論就是一種策略性思考,在互相影響的環境中,設法找出自己的最適行為。在1950年,納許(John Nash)提出「納許均衡」(Nash Equilibrium)觀念,當每個參與者的策略都達到最適反應時,就是一個均衡,這個觀念成為賽局理論發展的基礎。
賽局依參賽者的互動關係可分為靜態與動態賽局,根據訊息的掌握又可分為完全訊息賽局與不完全訊息賽局,而形成下列4種不同的賽局(見表1):
若想要對這套理論有基本的認識,其實既不艱難也不陌生,它所運用的實例每天都發生在你我的身邊。例如:小時候就耳熟能詳的成語「黔驢技窮」,就是賽局理論的應用。
故事裡那隻第一次看見毛驢的老虎,經過幾次試探、交手,才弄清楚驢的本事不過是刺耳的叫聲與踹踹蹄子而已,也因此老虎才敢大膽吃掉牠,這就是一種不完全訊息下的賽局,設法摸清對手的底細就是常見的策略。
賽局有3項基本元素,即參賽者、策略和結果,為了清楚基本架構,通常都以兩位參賽者加以說明,我們以典型範例「囚犯困境」帶大家一窺堂奧。

2「囚犯困境」典型範例

為什麼警界、司法界會發展出「坦白從寬,抗拒從嚴」的做法,其實就是一種賽局理論的運用。
假設有甲、乙兩位嫌犯,被警察抓到了,在罪證不足的情況下,口供與自白成為重要證據。警察會告訴他們,必須承認做壞事,如果你不承認,另一人承認的話,得對你加重懲罰;如果你合作的話,就減輕罪狀,早早放你出去。
在下圖二人靜態賽局的表示方法中,我們可以把甲放在左邊,乙放在上面,第一位參賽者甲的策略(否認、承認)用來確定橫行(欄),第二位參賽者乙的策略用來確定縱列(列),而二人策略的組合就對應二人的報酬。
像甲否認、乙承認,就對應報酬(-9、0),其中第一個數字是第一位參賽者甲的報酬,第二個數字是第二位參賽者乙的報酬。以下圖矩陣表示出報酬型態,就成為標準的策略式賽局表示法(strategic form game)。
警察分離偵訊,以避免串供,如果兩人都否認(-1、-1),警察沒有確鑿的證據,偵訊不得要領,可能關1個星期只能全部放走;如果兩人都承認(-6、-6),那麼兩人就因其犯行得到懲罰,可能都得關上6個星期;第三種情況,甲否認、乙承認(-9、0),乙描述了犯罪事實,基於他有改過意願,坦白從寬,就把乙給放了,但是否認的甲,抗拒從嚴,得多關3個星期,總共要關9個星期;第四種是甲承認、乙否認(0、-9),甲放出去,乙卻得被關9個星期。 囚犯在做奸犯科前,都指天發誓,萬一出事絕對不能吐實,兩人約好被抓都得否認,頂多被關1個星期,這是相對好的報酬,總比承認被關6個星期好。
但在警方或法官分離偵查辦案時,經由上述「坦白從寬,抗拒從嚴」的報酬設計,(承認、承認)成為「納許均衡」策略,假設對方承認,自己的最適反應就是承認(在-9與-6中選擇-6),我們可以在 -6下畫一小橫槓。假設對方否認,自己的最適反應必然是承認,我們可以在0下畫一小橫槓。在圖2中畫了兩個橫槓的報酬(-6,-6),就是「納許均衡」。一旦到達(承認、承認),雙方均無單方面偏離的誘因。
因為警方製造了利益衝突,每個人在思考如何做對自己最有利後,因為彼此缺乏信任,明知都否認是最好的結果,但因為不相信對方,分離偵訊的開始,就造成一個不合作賽局。單方面維持協定是無用的,太容易被對方利用,自陷被關9個星期的危境,索性承認,雙方都做此想,結果落入都被關6個星期的相對不利處境:沒有任何機制可以讓兩人互信,這就是特定的報酬結構下,造成的「囚犯困境」。
實例與應用 「囚犯困境」也可以用來刻畫很多產業競爭的現象。譬如,航空公司可以把票價訂得很高,彼此都獲利,也可以把票價訂得很低,大家都虧損。對任一家航空公司而言,最好的情況是「我降價,對方不降價」,那麼我搶攻市場,對方失了顧客。可是,一旦雙方都降價,會造成兩敗俱傷,如下圖表示,就走入了「囚犯困境」。
價格戰的賽局,就像是一個「囚犯困境」。像美國航空業就經常打價格戰,最近前四大航空公司中的聯合(United Airlines)、達美(Delta)、西北(Northwest Airlines)都已申請破產保護,賽局理論可以用來分析航空業的訂價策略,而且具有相當的說服能力。

3靜態賽局的均衡與應用

很簡單的情況,在布滿泳客的沙灘上(以0到1表示),每點的冰客密度都相同。現有兩家冰店準備進駐,他們該怎麼選擇店址?就可以看到策略選擇與自利動機的影響下,呈現極特殊的型態。
從0到1之間,有許多分布點,要往中間開店呢?還是往四分之一或四分之三的地點開店?以泳客的角度,當然希望到最近的冰店買冰最方便。
如果一家店選擇在四分之一點開店,另一家則在四分之三的點開店,那麼,從二分之一到0點的泳客走到四分之一點買冰,從二分之一到1的泳客走到四分之三點買冰,對泳客都相當方便。
但兩家冰店都會追求最大利潤,於是經過賽局的實際摸索,他們不會停留在四分之一和四分之三點,他們都會向二分之一點靠攏。
四分之一點的店會想往右邊移10公尺,那麼從0到和二分之一點右邊五公尺的泳客會想到這兒買比較近一點,這就能擴充市場,增加利潤;同樣的,設在四分之三點的冰店也會想往左邊多移10公尺,那麼凡是在二分之一點右邊的泳客,都會想到到這兒買冰近一點,它又與另一家冰店平分市場了。
結果兩邊力量推使,兩家店都向中間靠攏,直到二分之一點才會停止。
這樣達到的狀態,雖未必對泳客最有利,但是相當穩定,任一家店都不想再移動,這就是冰店競爭的「納許均衡」。
納許均衡是納許在他博士論文中提出來的均衡觀念,到達均衡後「任一參賽者均無誘因單方面偏離此均衡」,以此做為檢驗納許均衡的標準。
賽局就是多想幾步,想到對手怎麼做,自己該怎麼做,第一家冰店想到對手可能往中間移動,當然要先發制人,第二家店看到第一家冰店移動,也會要移動。
結果因為經過理性的分析,兩家冰店可能一到沙灘,二話不說,都往二分之一開店,兩家背靠背,不必再經嘗試的過程,就達到納許均衡。
泳客就只好多走些路(尤其是在0到四分之一和四分之三到1的泳客),到二分之一點才買得到冰,兩家冰店的生意是平分天下,利潤與在四分之一與四分之三處相同,但全體泳客的福利則下降。
實例與應用 這個現象在商業競爭行為中,屢見不鮮。常常看到一條街,擠滿賣類似商品的商店,小吃街是如此、婚紗禮服店亦復如此。
大家都往中間靠,產生聚集效果,這就是賽局分析中一個有趣的現象:均衡策略,當兩家店都走到二分之一的時候,所有參賽者都沒有誘因單方面偏離,這樣的「納許均衡」架構,可以用來預測分析許多情況,開店區位選擇是最簡單的一個應用。

4產業競爭的納許均衡

在產業競爭中,有完全競爭,如農產品的競爭,沒有一家廠商對市場價格有絕對決定權;有完全獨占,如台電,可以對市場價格有最大的決定權;而寡占則介乎上述兩者的中間,如汽車市場或航空公司,都是幾家大廠決定價格,其價格會在完全競爭和完全獨占之間,產量也會比完全獨占多,比完全競爭少,其產量決定也是均衡的結果,也可以用納許均衡來分析。
多家廠商競爭時,如何決定其價格與產量,這是產業競爭中非常重要的問題,也可用納許均衡來分析。
納許均衡還有多重均衡存在的可能,比方說,港劇中的古惑仔飆車族,或「養子不教誰之過」老電影中的詹姆斯狄恩。
面對以下報酬(見表5): 甲與乙飆車對開,看誰有膽量直衝,誰會先偏離成為膽小鬼。甲乙都對開,都有膽、但會受傷,得分是(-1、-1),都偏離、是膽小鬼,但不會受傷,得分是(1、1),若有一方偏離,都不會受傷,但有一方是膽小鬼,則得分是(0、2)或(2、0)。
結果是納許均衡有兩個:(0、2)或(2、0),但不知何者會真正發生,不能預測先偏離的會是哪一方。這是納許均衡的限制:均衡未必唯一。
優勢策略均衡,雖然有唯一的均衡,但經常不存在,在這個例子中就沒有優勢策略均衡;使用納許均衡觀念就一定找得到均衡,但可能不只一個。
實例與應用 飆車族也可用來刻畫量販店的開店決策。例如,台北市內湖區的市場規模只能容許一家量販店入駐,若有兩家量販店入駐就可能產生虧損。
就如上圖所示,兩家入駐則報酬成為負值,在靜態賽局架構下我們預測這樣的賽局可能有兩個均衡:或者是大潤發入駐,或者是家樂福入駐。
但是,在真實世界中,常有出招先後之別,如果大潤發能夠搶先入駐,則家樂福的最適反應是退出內湖區,成為唯一的均衡。真實世界中的動態結構可能讓我們縮減納許均衡的數目,有時甚至可以產生唯一的均衡。

5動態賽局

靜態均衡中,參與者是同時出招;在動態競爭下,參與者出招則有先後之別,往往在觀察到對手的動作之後,才決定自己的動作,競爭者之間形成動態的互動現象,甲看到乙上一次出手的策略,乙同樣觀察甲上一次出手的策略,依此訂定下一回合的行動,策略交錯影響構成一個極為豐富的動態關聯。
如何尋找一個妥善的均衡觀念來分析參賽者的互動是一項新的挑戰。我們先看幾個先後出招的序列賽局(sequential games)範例。
第一個例子考慮新百貨公司準備進入某地區市場,新百貨公司與舊百貨公司間,有先行者與跟隨者的關係,舊公司會考量要不要率先採取什麼策略嚇阻新公司成立;或者,靜觀新公司出什麼招,再決定自己要採取什麼措施,新舊公司間的策略應該動態地相互調整。
先考慮兩者同時出招的靜態賽局:
新公司如果成立,舊公司以原價格因應,舊公司可以賺到50億,新公司只能賺到10億;舊公司若採取低價策略,則舊公司只能賺30億,但會造成新公司賠10億,所以舊公司可能藉此企圖造成新公司的損失以為嚇阻,讓新公司斷絕進入的念頭;另一方面,新公司若不成立,舊公司成為市場的獨占廠商,不論採取原價或低價策略,都會賺100億。
在這個靜態賽局中,延用在較佳報酬下畫橫槓的方法求解,可找到兩個納許均衡:其一是新公司成立,舊公司採取原價,各賺10億與50億;另一個則嚇阻成功,新公司決定不成立,舊公司採取低價策略,仍獨占市場,賺100百億。
但因為同時存在兩個納許均衡(進入、原價)的策略組合可能會成為真實發生的均衡,則嚇阻策略就未必有效。報酬結構造成兩個均衡同時存在,使賽局的預測能力大為減低。 下一步我們把以上策略賽局表示法轉換成為擴展式的賽局表示法(extensive form game),它可用來表示靜態與動態賽局。
新穎之處在使用賽局樹(game tree),包括3種要素:第一、誰是參賽者(以環節圓圈表示);第二、何時可以行動、行動時選擇的策略(以枝幹直線表示)、參賽者行動時的資訊集合(以環節圓圈的集合表示);第三、對應參賽者所有可能選取的策略,各參賽者所得到的報酬(放在賽局樹末端的括弧內)。上面這個靜態賽局也可用賽局樹表示出來
在這個樹枝狀的表示方法中,就像樹只有一個根,出發點都只有一個;再用環節圓圈表示參賽者可採行的時點,每個環節可伸出數個枝幹來表示該參賽者可採行的策略;而在最終枝幹末掛上與序列策略相應的報酬。
第一位參賽者(新公司)可以選擇進入市場或不進入市場;第二位參賽者(舊公司)可以決定維持原價或低價傾銷,跨越環節的橢圓圓圈則代表資訊集合。
在上圖中資訊集合包含兩個環節,因為新公司是否會進入或不進入市場都在同一個資訊集合中,表示第二個參賽者在他的資訊集合中不能分辨何者確切會發生。
因為第二個參賽者無法觀察到對手的決策,以上圖型與靜態賽局並無差異,均衡也一樣。但是如果把訊息集合做一調整,把原來畫在一起的橢圓圓圈,現在分為兩個小圈圈,即第二位參賽者(舊公司)在這個環節的時刻,可以觀察到新公司到底決定進入或不進入,就成了真正的動態賽局了。我們可用「子賽局」(subgame)的觀念來做一分辨:
子賽局是在擴展式賽局中分出來的一支小樹,起點也一定是只有一個要素的資訊集合,像是樹只有一個根一樣。同時出招就沒有真正的子賽局,第一個子賽局是第二位參賽者(舊公司)觀察到第一位參賽者進入之後的賽局,在上圖中起於以2包含在資訊集合的環節,因為是以一個單一元素的資訊集合做它的起點,算是一個向前衍伸出的小樹。第二個子賽局是第二位參賽者觀察到第一位參賽者不進入之後的賽局,是圖6下方的另一支小樹。
就新公司不進入的狀況,新舊公司的損益是相同的,都是舊公司獨占賺100億,但如果新公司進入,那麼舊公司採取原價與低價,就會有不同的結果。
第一位參賽者(新公司)要多一步思考,舊公司到底會採取原價還是低價?如果舊公司不在乎新公司的賺賠,只考量自己賺得利益的多寡,那麼舊公司很清楚在新公司進入後會採取賺得更多的策略:保持原價,可賺50億(報酬組合中的第二個數值)。
我們以箭頭表示所採子賽局最適策略。新公司判斷舊公司會在新公司進入後採取原價以維持最佳利益,那麼新公司在進入與不進入兩者間選擇,進入則賺10億,不進入則毫無利潤(報酬組合中的第一個數值);當然選擇進入市場,也以箭頭表示,依靠這些箭頭就可以找到一個「合理」的均衡,它不但是納許均衡,也是一個具「完美特性」的均衡。換言之,透過從最後的子賽局往前倒推的「逆向歸納法」(backward induction),得到唯一的均衡:新公司進入市場,舊公司維持原價。至於舊公司低價競銷的威脅,只是空洞的威脅。
這樣由各個子賽局逆推尋找最適反應,就得到了「子賽局完美均衡」(Subgame Perfect Nash Equilibrium,SPNE),子賽局完美均衡一般是動態賽局納許均衡的子集合,較納許均衡更精煉,特別是均衡太多的時候,子賽局完美均衡可以帶來更多的預測能力。只有放進動態賽局中才能檢驗威脅到底是不是可信的威脅。
納許均衡在到達均衡後,任一參賽者都沒有誘因偏離這個均衡策略,子賽局完美均衡是一組策略(新公司進入、舊公司原價),不但是整個賽局的納許均衡,而且也是各個子賽局的納許均衡。
同時,可以用逆向歸納法向前解出唯一均衡,箭頭的方向很清楚顯示策略選擇,當真正的子賽局出現的時候,可能會減少均衡數目。

6先行者的優勢

納許均衡的問題是均衡可能很多個,當年納許證明納許均衡存在,但未必唯一。在之前提及的嚇阻進入賽局中經過先後出招,就只有一個均衡。
這是新公司先出招的情況,相對的,舊公司先出招,也會有不同策略選擇。爭取制高點,先行發言的權利非常重要,這是「先行者的優勢」(first mover advantage)。
當舊公司先出招時,他有兩種策略選擇:原價或低價。舊公司若採取原價,新公司觀察之後便思考:若進入市場則賺10億,若不進入市場則是零,新公司會選擇進入。
但若舊公司採取低價競銷時,新公司知道後,採取進入則賠10億,不進入則不賺不賠,那麼會採取不進入。當舊公司先出招時,這個均衡結構就變了,舊公司若能搶先出招,就採取低價策略,讓新公司不敢背負虧損風險。
但若新公司先出招進入市場,舊公司就會採取原價,獲利減少。出招先後影響策略選擇與報酬,但都能以子賽局完美納許均衡來分析。

7如何脫離囚犯困境

艾克索若(Robert Axelord)曾經設計過一個囚犯困境的重複賽局,結果發現採用跟隨策略是利潤最高的,廠商的生存能力最強。像觸發性報復是對手出錯就永遠記仇,很快就會因為利潤太低而被市場淘汰出局;好好先生策略無條件的信任對手亦被利用,都很快出局;跟隨策略有賞有罰,記仇也是有程度的,結果最有利。
有關細節說明如下:
1.到期日完全確定時,勾結難以形成,比方說,確定互動10次,因而在第9次時,心想橫豎是最後一次機會,沒有未來再交手的可能性,就會陷入一次出招的囚犯困境。未來愈短,勾結愈困難。因此,只有在到期日不確定或賽局是無限重複時,未來有互動的可能性時,才會形成「隱性勾結」。
2.對手常常不理性受到情緒影響,當參賽者都有類似目標,都要求最大利潤。比方說,如果一家廠商要求的是賺取最大利潤,但另一家廠商的目標可能不是利潤,而是擴大市場,那麼低價少賺但銷量大,對他就未必是懲罰。
3.需求與成本較確定,參與廠商固定且數量少的時候,隱性勾結比較容易形成。在穩定產業中容易勾結,在不穩定產業不易勾結。廠商數不固定,經常互動的廠商,不了解新廠商的反應如何,也難達到勾結。
4.是否能有效排除其他進入者,容易進入的產業已不是寡占市場也難於勾結。達成勾結家數不能太多,因為難以執行協議,也難勾結。
實例與應用 這個架構應用到訂價策略常遇到的「囚犯困境」,或許能夠帶領這些公司走出囚犯困境,而不必淪入美國航空業相繼破產的窘境。像國內航空業雖然曾經大打價格戰,但近年已走入穩定價格,達到一定的利潤水準。