第三講: 以其人之道,還治其人之身

The Third Course.

賽局理論每位 Player 都是追求「自身報償極大」,因此會從報償數字中,挑最大値來作決策。

報償矩陣

matrix matrix matrix

從紅髮妹來看:

當戴帽弟選取A時,
因為第一列自己的報償 4<5,故選擇B。
當戴帽弟選取B時,
因為第二列自己的報償 1<3,故選擇B。
因此紅髮妹有絕對最佳策略B。

從戴帽弟來看:

當紅髮妹選取A時,
因為第一行自己的報償 2<4,故選擇B。
當紅髮妹選取B時,
因為第二行自己的報償 6<8,仍應選B。
所以戴帽弟也有絕對最佳策略B。

Nash 均衡

每位Player在對手特定行動下,做出自己最有力的行動,所共同達成之狀態。

同時賽局(Simultaneous)

Player同時作決策,實際上並沒有先後行動的差別。

Ex.1
Nash1

從紅髮妹角度
戴帽弟如果選A,其應選A,
戴帽弟若選B,其仍應選A,
表示有絕對最佳策略A。
同理戴帽弟也有絕對最佳策略B,
因此 DS 均衡是左下位置。

Ex.2
Nash1

從紅髮妹角度,
戴帽弟如選A,其應選A,戴帽弟若選B,其則應選B,
此時無絕對最佳策略!
同理戴帽弟角度:
紅髮妹如選A,其應選A,紅髮妹若選B,其則應選B,
此時亦無絕對最佳策略!

此時無DS均衡是肯定的,但Nash均衡呢?
此時若戴帽弟和紅髮妹皆選A,則就是一個Nash均衡。
同時若戴帽弟和紅髮妹均選B,也是另一個Nash均衡。

若我們直接看左上角 (2,1),
由於戴帽弟在紅髮妹選取A時,
選擇A確實是自己的最佳行動,故無動機改變。
同理紅髮妹在戴帽弟已選A時,
選擇了A也已是最佳,故兩人皆無動機改變。

先後行動(Sequential)

領導者(Leader)先行動,追隨者(Follower)後行動。

Ex.1
Nash3

如果戴帽弟先行動,紅髮妹後行動,均衡會在哪呢?

依照逆推擴展邏輯(Backpropagation),
可把狀況畫成賽局樹(Game Tree)來沙盤推演,
而兩人各自最後會得到的報償列在後端。

Game Tree

戴帽弟如果選了A,
後行動的紅髮妹也有兩種選擇,
此時紅髮妹一定會挑選B,因為 2<6;
而若戴帽弟選擇B,此時紅髮妹必選A。

對戴帽弟而言,
等於只要從4與5之中作選擇即可。
因此答案很明顯:
蜘蜘應該選B,而只要紅髮妹理性,她必選B。

特別注意:
上述邏輯背後有一強列的假設:
先行動者握有對方報償矩陣數字資訊!

因此先行動者是握有發牌權的,
而後行動者相對只能被動的看著辦。


⌘ 統計學中也有類似賽局樹的工具,稱為「決策樹」
生活中也有類似的東西,那就是「族譜(Family Tree)」

Back to top

囚犯困境Prisoner's Dilemma:賽局理論中的經典範例,特色是數字以負値居多。

在兩個合夥犯罪的人被隔離偵訊的狀態下,經由警察巧妙設局希望兩人招供以儘速破案。
嫌犯彼此只知道自己的報償,雖然皆以負值居多,表現出「懲罰」的味道,但每個人仍然是追求「自身報償極大」。

Prison

此時很容易發現兩人都有D.S,均衡即在「左上」,結案。

但是其數字背後實有更深的意涵:
如果一人招一人不招,不招的表示毫無悔意,需加重其刑罰至6單位,
而招的因為坦白從寬、或轉為污點證人而可以將功折罪,不必懲罰。
又若兩人串供都不招,則因罪證不足而只能懲罰1單位,結果卻比D.S.均衡要好。

亦可用在類似草原悲劇的局,見下。

草原悲劇

Tragedy of *Commons:共有物(如公海漁獲、野生草原等)可能因過度捕用而最終耗竭。

Fish

重點在於數字的意涵與解釋
雖然D.S.均衡可能是在左上,雙方(或者大家)都去捕魚,
卻殊不知這麼一來更加速造成漁獲的短缺,使得資源匱乏。
反而是右下角的都不捕、或者節制的捕,
發現其報償對大家而言才是最佳,進而達到一個永續的狀態。

Back to top

社會福利極大即經濟效率達成境界(Pareto Optimality):任何改變,若有人受益則必有人受害。

達「社會最適」

定義:無法在不損及他人狀況下而有利於某些人。

除了其本身之重要,還可了解到經濟學不是只強調自利。
Pareto Optimality 應用範圍非常廣泛,一般簡稱 Pareto。

若有一披薩要分給兩個人吃,(隱含全社會僅這兩人之意)
試問,左圖中的A、B、C三種情形何者達到 Pareto? Why?


    解析:依照 Pareto 特色來看
  1. 全部分完是關鍵:此時的任何改變若有人受益、則必有人受害。B因為還剩 1/3 沒分完,仍有效率增進(Pareto Improvement)的可能,即有人受益且無人受害,因此B並非Pareto,因為全社會還可更好。
  2. Pareto 可能不唯一,如此例之中A、C兩個都是可能解。
  3. A選項看似很公平,而C選項看似很不公平,但若這披薩是昨夜某人獨自熬夜完成的,全分給他有何不公?分給誰不是重點,不該圖利特定人、有天下為公的味道,因此 Pareto 不涉及公平性。

⌘ 若回到上方「囚犯困境」的賽局,Pareto在哪?應該在「右下」,可自行檢驗之。

零和賽局

某人之利得必來自他人之損失。

報償矩陣中只要任何位置兩人之報償加總之和等於零即是。
此時在其他條件不變下,其實也是Pareto達成的境界。
先不考慮最後的均衡在哪,可發現此時不管選哪個位置,
均回到 Pareto定義:若有人受益、則必有人受害。

Back to top