均一教育學苑
  • Home
    • 學苑簡介
    • 報名方式
    • 交通資訊
  • 進修資源
    • 線上學習平台
    • 2017暑假其他教師研習

【時事議題】『Nash猜數字與撿紅點匹配』 由納許均衡看待賽局理論

5/29/2015

 
文章轉載出處:親子天下 翻轉教育
響尾蛇的數學天地

最後通牒遊戲,你的選擇是?

假設有人出100塊錢,給你和另外一個不認識的人去分,只要你們兩人都同意怎麼分這筆錢,就可以把錢拿走。但是,你們必須遵守嚴格的規定。兩個人必須分別待在不同的房間,不能交談或溝通。一開始,先擲銅板決定誰有權提議如何分錢,假定你取得了建議權,你只會有一次提議的機會,而另外一個人也只有一次機會回答「同意」或「不同意」。對方和你一樣,很清楚遊戲規則和現金總額,如果他同意你的提議,你們就可以分掉這筆錢;如果他不同意,你們兩個人就一文錢都拿不到。無論結果如何,遊戲都到此結束,不會再重來一遍。在這種情況下,你會怎麼辦呢?
图片
「最後通牒」其實是心理學家設計 來質疑賽局專家的一種遊戲,這個實驗的結果超乎一 般賽局學者的預期,如果膽敢只十分之一給對手,幾 乎都會遭到兩敗俱傷的拒絕,不會有什麼十元總比零 元好的「納許均衡」,自以為聰明的算計,常因氣氛 不好味道不對而破局,所以是負面的「心理報償」。
 
「博奕理論」(game theory)是種形式方法,用來分析決策人員之間的競爭或合作互動,對棋局或整體社會都適用。先從簡單的開始,我們可以從普通遊戲(如井字遊戲或西洋棋),得到一些賽局的通則,這類賽局擁有完全資訊,因為所有參賽者都知道規則、可能選擇和遊戲歷史。這表示參賽者可以對賽局有全盤計畫,能掌握特定的應對方式來應付賽局中任何可能事件,以純策略贏得賽局。但是,像剪刀石頭布或撲克牌這類非完全資訊的賽局,就沒有保證獲勝的純策略。如果玩家太常運用某種策略,就會被其對手識破利用。這類賽局就是現代數學博奕理論派上用場的地方,能針對最佳混合策略與勝局期望頻率,提出洞見。
图片
Nash均衡(Nash equilibrium)是賽局理論中一個很重要的概念。如果某一組策略是Nash均衡,任何一個參賽者單獨改變自己的策略並不會使自己的報酬提高。也就是說,如果別人都玩Nash均衡策略時,我會發現這個均衡策略會是我的最佳的選擇(也就是最適回應,best response)。當所有人都玩這一個Nash均衡策略時,沒有人會想要悖離(deviate)。
 
Nash均衡是基於某些對人的行為的假設。例如,所有參賽人皆清楚的了解對手有哪些行動,並且就所有可能的行動中選出一個最適的反應。而這些都是所有人的共同知識(common knowledge), 我們可以用以下的「囚犯困境」賽局來說明如何找出Nash均衡。

【賽局理論小遊戲 囚犯困境】

    甲,乙兩人因案被捕,警方分開偵訊。因為證據不夠充分,須要嫌犯的自白。因此,警方告訴兩人,「如果你認罪,但你的同夥不認罪,你只要被關一年,但你的同夥要被關五年。可是如果你不認罪,而你的同夥認罪了,你要被關五年,但你的同夥只要被關一年。如果你們倆都認罪了,你們都要被關三年。」但如果兩人都不認罪,由於證據薄弱,兩人只要被關兩年。
图片
如果囚犯是自私的,他應該會選擇自己認罪,並希望對方不認罪;不過對方很可能也是自私的,所以容易導致兩人都認罪而形成(-3,-3)。兩人都依照檢察官的條件而認罪,並且都減刑至3年,似乎很合理。但仔細想想,這件事其實有蹊蹺。如果兩人都不認罪,形成的是(-2,-2),這絕對比(-3,-3)來得好!
 
問題就出在於,兩個囚犯都無法控制對方的意志,因此很容易陷在(-3,-3)當中。這個(-3,-3)就是所謂的納許均衡:「雙方已選定策略,在另一方不動的情形下,任一方改變策略並無法得到好處。此時的策略搭配後續結果,就構成納許均衡。」這裡雙方選定的策略就是「認罪」,而在另一方不動的情形下,任一方改為「不認罪」,只會讓自己的刑期變為五年,無法獲得好處;只有兩人都改為「不認罪」,才能讓兩人的刑期同時減至兩年。難以逃脫納許均衡的原因,就是雙方都無法確保對方將策略改為「不認罪」。


Nash均衡 (Nash equilibrium)

【賽局理論小遊戲 決定一到一百的數字】
參加的同學只能決定一到一百的數字, 把數字的總和作一個平均,而數字最接近平均的一半的人為贏家.
 
遊戲流程
教師統一說明題目
『同學決定一到一百的數字, 把數字的總合作一個平均,而數字最接近平均的一半的人為贏家.』

以排為單位,排頭去計算排的平均

教師黑板寫 
排號碼/
排平均/
排平均之半/
最接近排平均之半同學名字/
最接近排平均之半之數據/
勝利同學上台分享為何選這數字/
分發勝利獎品/

遊戲執行第二輪
教師黑板寫下 
排號碼/
排平均/
排平均之半/
最接近排平均之半同學名字/
最接近排平均之半之數據/
分析數字收斂情形
....

图片
【分析】
所以假設平均為五十,一半就是二十五,數字最接近二十五的同學為贏家! 第一次玩的結果,平均是25.16,一半則是15.58....第二次玩的時候平均是19.8,一半則是9.9. 第三次玩的時候平均是9.107,一半則是4.5535.
有趣的是....這次的平均值是七點五,一半是三點七五....這個遊戲的最終答案是零....

【賽局理論小遊戲 撿紅點匹配】
讓全班的同學在紙上寫下一到十之中的任何一個數字,然後跟另外一位同學配對,如果數字和剛好等於十的倍數,兩個人就可以得到獎品。
图片
國三會考後深化問題:請問配成對的機率為多少?

活動花絮
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片


Comments are closed.

    Categories

    全部
    國際趨勢
    教育現場
    時事議題

    Archives

    十二月 2015
    七月 2015
    六月 2015
    五月 2015
    四月 2015
    三月 2015

    RSS 訂閱

財團法人公益平台文化基金會 Copyright © 2015 The Alliance Cultural Foundation. All Rights Reserved.
台北辦公室 Taipei Office | T | +886-2-2321-3313 | F | +886-2-2321-5552 ‧ 台東辦公室 Taitung Office | T | +886-89-221-991 | F | +886-89-222-586