一、博弈論建立后在生物、社會學(xué)上發(fā)展很快,數(shù)學(xué)上反而沒有更多應(yīng)用
1、全世界8600種鳥類,有320種鳥類會幫助其他種類動物,喂食、筑巢、清掃身體等。
2、幫助其他種類動物時無疑增加了自身風(fēng)險,這樣的生存策略為什么會存在呢?
3、進(jìn)化論對此無力解釋,《自私的基因》里用基因最大化來解釋利他行為。
二、用“存在的穩(wěn)定性”解釋生存策略
1、星星的存在、山河湖泊的存在,海浪的形成都是因為他們從長期看,處于動態(tài)平衡中,即便有擾動,地球上也存在某個機制讓他們重新出現(xiàn)。
2、鷹派與鴿派理論可以通過得分的方式計算這類生物共生情況下的數(shù)字比例;或者可以解釋為每個個體都采取混合策略,具體采用什么策略的比例也可以計算出來。這個比例是動態(tài)平衡的,任何一方數(shù)量的改變都會有自然形成的壓力讓他們重新回到平衡。
3、也許現(xiàn)實中的生存策略混合狀態(tài)也有部分原因是由于這個原因。
三、囚徒困境實驗的3種進(jìn)階分析
1、阿克塞爾·羅德進(jìn)行了第一階段“重復(fù)囚徒困境”實驗,設(shè)計出14種策略,讓每種與每種都進(jìn)行200局對戰(zhàn),之后計算每200局的平均成績,和總的平均成績。找出了最優(yōu)者:第一局和對方合作,此后每局的策略是對手上一局所采用的策略。我們稱之為“一報還一報”策略,他的平均分是504.5分,最低225最高600分。完全隨機選擇合作/背叛的平均分最低只有276.3分。
2、阿克塞爾·羅德希望找到更好的策略,勝過一報還一報,征集了學(xué)生和學(xué)者一共62種策略后,進(jìn)行了第二階段“重復(fù)囚徒困境”實驗,目的是為了找到比一報還一報更加優(yōu)秀的策略。但結(jié)果沒有人可以超越一報還一報。不過第二階段測試中也發(fā)現(xiàn)一報還一報在應(yīng)對“完全不管對手如何出牌,自顧自出招”時效果不好。在面對“90%一報還一報”策略時容易出血回聲效應(yīng)(雙方不斷背叛對方),兩報還一報原本被看好,實際效果不好。一報還兩報的策略過于嚴(yán)苛,頻繁出現(xiàn)循環(huán)報復(fù)。從感情上講,既寬容又嚴(yán)厲,并且可以及時給對方反饋,不計前嫌。
3、阿克塞爾·羅德進(jìn)行了第三階段“重復(fù)囚徒困境”實驗,這次讓62個程序以相同比例進(jìn)行混戰(zhàn),200局一輪戰(zhàn)斗。每輪戰(zhàn)斗后清點每種策略的得分。下一輪戰(zhàn)斗中按上一輪的得分配個體數(shù)量。這樣設(shè)計就增加了自然選擇的壓力。最開始消失掉的是總和對手合作的類型,總是背叛對手的個體數(shù)量增加,一報還一報個體數(shù)量也增加。中間階段,總是背叛對手的類型開始消失。最終留下的是一報還一報和其小改款。在有自然選擇壓力的情況下一報還一報是一種穩(wěn)定策略。總是背后捅人一刀的看似兇悍,終將被淘汰。
4、博班鳥之所以飛進(jìn)鱷魚嘴里幫它清除口腔碎屑寄生蟲,雙方看似在合作,鱷魚不背叛博班鳥。原因可能有多種多樣,但在博弈論中這種一報還一報策略是進(jìn)化中最穩(wěn)定的,所以會長久存在下去被我們看到。
5、以交通為例,壓實線變道如果算人們交通關(guān)系中的一種背叛,按車道線行駛算是一種合作,那么北京現(xiàn)在亂開車的比較多,就是因為背叛后失分太少,總體來說背叛行為得分高讓他成為了一種穩(wěn)定策略。如果交管局可以嚴(yán)格執(zhí)法,或者只是簡單提高處罰分?jǐn)?shù),而執(zhí)法嚴(yán)格程度不變,也將起到很好的效果,這樣做可以把合作這種行為篩選成穩(wěn)定策略。而這,正是交通規(guī)則制定者的職責(zé)。
聯(lián)系客服