囚徒困境(Prisoner's Dilemma)是博弈论的非零和博弈中具代表性的例子,反映個人最佳選擇並非团体最佳選擇。或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。
單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。
在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
囚徒困境的主旨為,囚徒們彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在無法溝通的情況下,因為出賣同伙可為自己帶來利益(縮短刑期),也因為同伙把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同伙會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。