囚徒困境纳什均衡(囚徒困境纳什均衡怎么计算)

1、若囚徒们不互相合作，则无法脱离困境。囚徒困境，英語：’，囚犯兩難是博弈论的非零和博弈中具代表性的例子，反映個人最佳選擇並非群體的最佳選擇，且在一个群体中，个人做出理性选择却往往导致集体的非理性。雖然這是一個理論上的情境，但現實中的價格競爭等也會出現類似情況。單次發生的囚徒困境，和多次重複的囚徒困境結果不會一樣。

2、在重复的囚徒困境中，博弈被反复地进行。因而参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗行为被受到惩罚的威胁所制止，从而导向一个较好的的结果。

3、当次数接近无限，纳什均衡趋向于。當囚徒們可以互相溝通時，彼此合作可為全體帶來最佳利益，縮短刑期，但在無法溝通時，出賣同伙可為自己帶來更多的利益，無罪開釋，同時同伙把自己招出來可為他帶來利益。所以，互相出賣，反而能獲得最大利益。實際上，執法機構不可能設立如此情境來誘使囚徒招供，因為囚徒必須考慮刑期以外的因素，出賣同伙會受到報復等，則不能只以刑期作考量，所以是一個理論上的情境。

4、1950年，由就職於兰德公司的和擬定出相關困境的理論，後來由顧問以囚徒方式阐述，並命名为「囚徒困境」。经典的囚徒困境如下：。

5、警方逮捕甲、乙两名嫌疑犯，但沒有足够证据指控二人有罪。於是警方分开囚禁嫌疑犯，分别和二人见面，并向雙方提供以下相同的选择：。若一人認罪並作证對方，相關術語稱「背叛」對方，而對方保持沉默，此人将即時獲释，沉默者将判監10年。若二人都保持沉默，相關術語稱互相「合作」，则二人同樣判监半年。

囚徒困境纳什均衡(囚徒困境纳什均衡怎么计算)

1、若二人都互相检举，互相「背叛」，則二人同樣判監5年。如同博弈论的其他例證，囚徒困境假定每個參與者，即「囚徒」，都是利己的，即都尋求最大自身利益，而不關心另一參與者的利益。參與者某一策略所得利益，如果在任何情況下都比其他策略要低的話，此策略稱為「嚴格劣勢」，理性的參與者絕不會選擇。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

2、囚徒到底應該選擇哪一項策略，才能將自己個人的刑期縮至最短。兩名囚徒由於隔絕監禁，並不知道對方选择；而即使他们能交谈，還是未必能夠盡信對方不會反口。就個人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。

3、試設想困境中兩名理性囚徒會如何作出選擇：。若對方沉默、我背叛會讓我獲釋，所以會選擇背叛。若對方背叛指控我，我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。二人面對的情況一樣，所以二人的理性思考都会得出相同的结论——选择背叛。

4、背叛是兩種策略之中的支配性策略。因此，这場博弈中唯一可能達到的纳什均衡，就是雙方参与者都背叛對方，結果二人同樣服刑5年。

5、这場博弈的纳什均衡，顯然不是顧及團體利益的解决方案。以全体利益而言，如果两个参与者都合作保持沉默，兩人都只會被判刑半年，总体利益更高，結果也比兩人背叛對方、判刑5年的情況較佳。但根據以上假設，二人均為理性的個人，且只追求自己個人利益。