很久以前寫過一篇文章:小賭怡情,十八啦怎麼賺?

  連結:http://ddxu2.pixnet.net/blog/post/205883771

 

  裡面提到的加倍下注法,是國高中時讀的一本數學科普書中寫的。

  簡單地說,假設下注的價碼可以自己決定,輸了就輸掉下注的錢,贏了除了拿回下注的錢以外,還會多得到相當於下注金額的錢。

  所以加倍下注法的策略就是,一但輸了,下次下注就加倍,如果又輸了,就繼續加倍,直到贏一次為止。

  舉實例來說,如果我設想想賺10元。

  第一次我下注10元,贏了,我就賺到10元,結束。

  如果輸了,現在我的收益是-10元,我接著下注20元,如果贏了,我的收益會變成-10+20=10元,結束。

  如果又輸了,現在收益是-30元,接著我下注40元,贏了的話,我的收益就變成-30+40=10元,結束。

  一直輸的話就一直持續下去。

 

  直到贏一次,這整段過程的收益就是賺到10元。

 

  假如這個賭局是公平的,每個人的勝率相等(例如:擲一枚公正硬幣猜正反面),那理論上來說:

  你參與賭局,最後收益的期望值是0元。

  也就是說你參與賭局直到退出賭局,理論上預期的結果會是不賺不賠。

 

  有趣的地方就在於,上面提出的加倍下注法好像無懈可擊,只要贏一次我就是賺10元啊,為什麼收益的期望值是0元呢?

 

  我們可以從有限制次數的賭局的角度來看這件事,例如你最多只能下注4次,並且你只要贏一次就會收手。

  所有的情況寫出來如下:

  第一次贏-賺10元

  第一次輸-第二次贏-賺10元

       第二次輸-第三次贏-賺10元

            第三次輸-第四次贏-賺10元

                 第四次輸-由於不能下注第5次,所以四次下注的錢都賠掉了,賠150元

  如果第四次輸了,收益就是-10-20-40-80=-150元,就輸掉150元。

  實際計算機率的話,如下(括號內為事情發生的機率):

  第一次贏-(1/2)收益+10元

  第一次輸-第二次贏-(1/4)收益+10元

       第二次輸-第三次贏-(1/8)收益+10元

            第三次輸-第四次贏(1/16)收益+10元

                 第四次輸(1/16)收益-150元

  期望值為對應事件的收益乘上該事件發生的機率,並將各事件所得結果加總:

  期望值=10×1/2 + 10×1/4 + 10×1/8 + 10×1/16 + (-150)×1/16

  =(1/16)×(80+40+20+10-150)=(1/16)×0=0元。

 

  白話一點地說,用加倍下注的方式玩4次,你有15/16的機率賺10元,但有1/16的機率會賠150元。

  隨著你可以下注的次數越多,你「贏」的機率越高,但是你「輸」的時候會賠得越多。

 

  假如有1024個人用加倍下注法,並限制次數最多下注10次,那麼預期的結果會是有1023個人賺到了10元,而有一個人賠了10230元。

  所以維基百科裡用「這個系統或類似的系統冒很大的風險來爭取小額的回報。除非有無限的資本,這類策略才可成功。」來描述這樣的策略。(搜尋「賭徒謬誤」,雖然我個人並不認為加倍下注法必然跟賭徒謬誤有關)

 

  那麼現在,加倍下注法做為一個期望收益是0元的賭博策略,這還有什麼應用可言呢?

  答案是有的,只要「錢」對你的「效用」並非等價時,就有可能可以用這樣的策略了。

  大致上可以把「效用」說成是你的「爽度」、「滿足你需求的程度」,正的效用能讓你的爽度增加,滿足你的需求,而負的效用當然就相對是降低你的爽度或是剝奪你所需的。

  說明一下何謂錢對你的效用非等價。其實這是很顯然的事情,錢對我們的效用並不是「持有錢」本身,而是「把錢花掉」才能獲得效用,舉例來說,考慮你有50元可以吃晚餐,你買了一個50元的便當,吃了不錯的食物、填飽了肚子,這是這50元帶給你的「效用」,假設這樣的效用是+10。

  假如你多了2元,52元可能還是買不到其他東西,一樣只能買50元的便當,所以當下多那2元對你的效用的增加是0,52元對你而言的效用仍是+10;

  而如果當下少了2元,48元可能讓你買不起一個便當,你只好改成去買你沒那麼喜歡、也覺得吃不太飽的滷肉飯,缺少這2元對你的效用可能是-2,所以48元對你當下的效用就變成了+8(而非原本的+10)。

 

  這也就是說,在那個當下,多2元對你沒什麼用,但少2元卻會讓你有所損失,同樣都是2元,但得到跟失去的效用並非等價增減。

 

  再舉個例子,你餓了10天,今天晚上再不吃東西就會死了,而且你只能接受用錢買東西,要你去乞討你寧願去死。

  這時候你有0元,買不了東西,你餓死了,0元對你的效用是「死掉」(有些人認為死掉的效用可以說是負無限大)

  但這時候你有20元,夠你買一塊麵包,你活了下來,這20元對你的效用是「活下來」

  而如果你其實處於負債狀態,你欠一個人20元,我們說你現在的資產是-20元,你一樣買不了東西,結果還是餓死,-20元對你的效用仍是「死掉」。

  這也就是說,在這樣的情況下,多20元對你的效用很大,而少20元對你的效用幾乎沒有影響。

 

  所以如果你在0元,即將餓死之際和人賭博,假如你最後輸了,不管輸多少,結果都是死,效用沒有減少;

  而如果你贏了,就算只贏了10元,也可以幫你多活一天,效用還是正的。

 

  在這種情況下,你可以選擇這種策略,將所有輸的風險聚集在一起,你有很高的機率會「小贏」,而小贏對你的效用很夠;

  你有很低的機率「大輸」,但是大輸對你的效用沒有影響,因為只要你沒贏,就算收益是0元,今晚還是會餓死。

 

 

  上面講起來很脫離現實,不過這種「聚集風險」的策略,其實在生活中很常出現。

  例如「車」跟「飛機」,雖然實際上搭飛機的死傷率應該遠低於車禍的死傷率,不過這不妨礙。

  搭飛機相對於開車,就是一種「聚集風險」的策略,絕大多數的情況下,搭飛機對你的效用是正的;

  而在極少數的情況下,空難發生,你能夠死裡逃生的機會也非常非常低。

  相對來說,開車出車禍的機率高很多,但當車禍發生時,你活下來的機率也比搭飛機失事時高很多。

 

  就像前面提的賭博,如果你採取的是每次都只下注10元(開車),那麼你輸錢的機率高出很多(發生車禍),但相對的輸錢的情況下輸很多的機率比較低(傷不至死);比起加倍下注法(搭飛機),輸錢的機率非常低(空難),但相對的輸錢時就必然會輸很多。

 

  這裡做一個但書,我只有稍微查過統計資料,但沒有找到很確切的數據,所以搭飛機跟開車事故的例子可能不吻合現實(但吻合我的想像),有錯歡迎指正。

  

  或者是益智問題,如閱微堂的猜帽問題1:http://zhiqiang.org/blog/science/game-one-hat.html

  題目是說,一群玩家參加益智遊戲,每個人頭上都有一頂白帽或黑帽,一個人頭上的帽子是白帽或黑帽是隨機決定的,每個人都能看到所有其他人頭上帽子的顏色,但看不到自己頭上帽子的顏色。

  知道所有其他人的帽子顏色後,玩家們獨立做出決定,每個人有三個選擇:

  一、猜自己頭上帽子是黑色的

  二、猜自己頭上帽子是白色的

  三、放棄猜測

  玩家們勝利的條件是,在所有人做完選擇後(要注意,沒有玩家知道其他玩家做的選擇是什麼),依以下判斷:

  若所有玩家都放棄猜測,則玩家們一同失敗;或是有玩家進行猜測,但猜錯他自己頭上帽子的顏色,玩家們一同失敗。

  若有玩家有進行猜測(也就是選一或二),並且所有有猜測的玩家,全部都猜對他們自己頭上帽子的顏色,那麼玩家們一同獲勝。

 

  在遊戲開始前(把帽子戴上去以前),玩家們有時間可以討論待會答題的策略(但遊戲中不能有任何形式的溝通),請問:

  「怎麼樣的策略,可以使玩家們的勝率最高?」

 

  我可以很快地說明一種勝率50%的策略,玩家們推舉出一個人A,說好待會只有A會進行猜測,其他玩家皆會選擇三、放棄猜測,而我們知道A猜對的機率是50%,所以玩家們有50%的機率贏得這場遊戲。

  很有趣的,這道益智問題有很巧妙的解法,有興趣跟能力的人可以自行去讀連結裡的證明。

  這邊只能大概地講那樣的策略的「概念」是什麼。

  我們知道,基本上每個人猜對的機率都是50%,但在這個遊戲中,我們只要「有一個人猜對」就好,很多人猜對也不會效用更大。

  而相對的,如果有一個人猜錯了,這時就已經輸了,就算所有其他人也都猜錯,輸了就是輸了,效用也不會更低。

 

  如果每個人都進行猜測,期望值告訴我們,大約有一半的人會猜對自己頭上帽子的顏色。

  但這不是我們要的,我們可以設想一種策略,把「風險聚集」,就像加倍下注法那樣,我們有很高的機率「小贏」(恰好一個人進行猜測,並且猜對),而我們有很小的機率「大輸」(所有人都進行猜測,並且所有人都猜錯)。

  所有可能性中,有猜測的人仍然是其中一半猜對,一半猜錯,但這個策略把「那一半猜錯」的情況全部聚集到了「幾種可能性」之中,而把那「一半猜對」的情況,一個一個分給了「剩餘的所有可能性」,剩餘的每個可能性裡都恰好有一個人會猜對,並且其他人皆放棄猜測。

  這種策略的勝率有多少呢?以玩家人數是15個人的情況來說,這樣的策略勝率有15/16≒93%

  很難想像吧!(我沒看解答以前也很難想像XD)

 

  或者今天你玩桌上遊戲,遊戲要結束了,你有最後一次行動的機會。

  經過精密的計算,你這個行動只要能得到5分,你就會贏,要是得不到5分,你總歸是輸。(假設你只關注輸贏,分數的數字本身對你沒有效用)

  而現在你這個行動有兩種選擇:

  第一種,你有50%的機率得到6分,和50%的機率得到2分;

  第二種,你有80%的機率得到5分,和20%的機率分數不增不減。

  兩種選擇在分數上的期望值是相等的(我刻意湊的):6×50%+2×50%=4=5×80%

  但第二種選擇,將分數的分配聚集了,雖然10%的情況中你「分數上輸得更多」,但你不在乎分數,只在乎輸贏。

  選擇第一種,你贏的機率是50%;但選擇第二種,你贏的機率是80%。

  所以選擇第二種對你的「效用」期望值更大。

  這樣的例子也可以看成「聚集風險」的應用。  

arrow
arrow

    東東 發表在 痞客邦 留言(0) 人氣()