Napisali: CB Garcia i WI Zangwill

Profesori nauka iz menadžmenta u poslovnoj školi za štandove (obojica u penziji)

Revidirani kolovoz 18, 2018 iz (Garcia i Zangwill [8, 9]).

Ključne riječi: Teorija igara, dilema zatvorenika, bajezijska, subjektivna verovatnoća

sažetak: Von Neumann i Morgenstern (VNM), koristeći očekivanu hipotezu korisnosti, pružili su temeljnu formulaciju problema teorije igara. Do ovog trenutka, međutim, ovu je formulaciju bilo teško riješiti bez nametanja dodatnih pretpostavki. Nash je morao pretpostaviti da su igrači razdvojeni tako da je vjerovatnost da igrač A preduzme akciju bila neovisna od vjerojatnosti igrača B koji će nešto poduzeti. U ovom radu eliminiramo Nash-ove pretpostavke, uključujući pretpostavku da su strategije igrača općepoznata i postavljamo model koji je u potpunosti ekvivalentan općem VNM problemu. Naša lako rešiva ​​formulacija eliminira neke inherentne poteškoće s Nash pristupom, koji su često urodili kontradiktornim i kontratuktivnim rezultatima, npr., Na dilemu zatvorenika, pileću igru, Newcombovu paradoksu, lovu na staje i mnoge druge igre. Na primjer, odbacivanjem Naševe pretpostavke uzajamne neovisnosti u dilemi zatvorenika, naš model pokazuje da su igrači sposobni postići višu isplatu, i da bi to postigli, ne moraju igrati kooperativno ili komunicirati, već samo primjenjuju Bayesov teorem, u stilu (Harsanyi [10]; Kadane i Larkey [11]). Naš pristup dijeli prostor vjerojatnosti na dva polu-prostora ili regije, čija relativna veličina ovisi o isplati. Sada ne treba precizno procjenjivati ​​vjerojatnost, već samo odrediti u kojoj se regiji nalazi. To daje značajne prednosti, jer ako je jedna regija znatno veća od druge, to odmah daje bitan uvid u to kako igrati igru. Naše opće rješenje, koje nije povezano, recimo u smislu Aumanna [1], sadrži Nash-ove ravnoteže kao posebna rješenja. Nasuprot opisnim Nash rješenjima, naše rješenje je propisivački par racionalnih očekivanja, čistih strategija, pružajući novi temelj za teoriju igara. Mi proširujemo svoj pristup na opće M-Person igre, kao što ilustriramo u igri rock-papir-makaze i problemom prepunih šankova.

Rezime rezultata.

Sada sumiramo neke rezultate, zasnovane na detaljima i eksplicitnim isplatama navedenim u nastavku. Vjerujemo da ovi rezultati pokazuju vrijednost našeg pristupa u nastavi i istraživanju jer rezultati često predstavljaju nova rješenja.

Koordinacijska igra: Naševa pretpostavka o neovisnosti nedostaje superiorni Bayesov pristup koji smo zauzeli. Za doznake navedene u nastavku, igrajte prvu strategiju ako vjerujete da je protivnikova vjerojatnost da će igrati prvu strategiju barem 1 / 3, a druga igrajte drugu strategiju. Nash ne daje uvid o tome kada treba primijeniti koju strategiju. Također, ako se isplate promijene, naš pristup pruža revidirane vjerovatnoće. Bitka spolova: Dvije strane se razlikuju po tome gdje trebaju ići, ali im nije dozvoljeno komunicirati. Obje strane dobijaju dobru isplatu ako oboje idu na isti izbor, jer su barem obje zajedno. Davana stranka dobit će bonus ako obojica odu na izbor te stranke. Ni jedno ni drugo ne mogu se isplatiti ako odu na različita mjesta. S obzirom na isplate prikazane u nastavku, igrač A trebao bi igrati svoju željenu strategiju ako vjeruje da će drugi igrač također odabrati A željeni izbor s vjerojatnošću od najmanje 33%. Nasuprot tome, Nash pruža tri ravnoteže bez ikakvog uvida u to kada će se igrati kada i bez analize vjerojatnosti. Odgovarajuće sitnice: Dva igrača, pa i parni, istovremeno otkrivaju denar. Ako se peni podudaraju, čak ih zadržava i jedno i drugo; inače Odd zadržava oba penija. Jedinstvena Nash-ova ravnoteža za ovu igru ​​sa nula-sumom je da oba igrača igraju nasumično. S obzirom na isplatu ispod, Čak bi trebao igrati glave ako vjeruje da će Odd igrati glave s vjerojatnošću od najmanje 50%. S druge strane, Odd bi trebao igrati glave ako vjeruje da će Even igrati glave s vjerovatnoćom od najviše 50%. Igra s piletinom: Dva automobila se kreću jedni prema drugima i uskoro će se dogoditi pretres. Nash predlaže da se jedan automobil treba skrenuti, a drugi da ide ravno, ali nudi mali uvid u koji bi se trebao skrenuti. S obzirom na isplate ispod, naš pristup vam sugerira odustajanje ako vjerujete da će protivnik skretati s vjerovatnoćom od najviše 90%, u suprotnom idite ravno. Ovdje imajte na umu da oba skretanja igrača (ili obojica idu ravno) nije Nash-ova ravnoteža, nego da oba igrača skreću (ili obojica idu ravno) u očekivanju da će protivnik krenuti ravno (ili skretati) scenarij ravnoteže. Također, ako se isplati promijene, naš pristup pruža ažurirane vjerovatnosti. Trka u naoružanju: svaka zemlja prvotno skladišti oružje da se ne napadne. Ali kao što je pokazano u nastavku, smanjivanje prinosa na skladištu oružja ostvaruje se, otvarajući priliku za mirovni ugovor. Nash ne identificira priliku za mirovni ugovor. Lov na stagove: lovite jelena ako verujete da će protivnik loviti ježa s verovatnoćom najmanje 50%, u suprotnom loviti zeca. (Čiste Nash-ove ravnoteže su i za lov na divljači, ili za oboje u lovu na zeca). Newcombov problem: ako se Newcombov problem postavlja kao dilema zatvorenika, do rješenja Newcombovog problema može se doći na dva načina: kao nesoperativni Nash-ov ekvilibrijum korištenjem principa dominacije ili kao kooperativno rješenje koristeći hipotezu očekivane korisnosti. Igra kamen-makaze-makaze: Nash-ova ravnoteža služi za slučajno igranje 3-ove matrice. Ono što se čini novom strategijom za ovu drevnu igru ​​je da igrate rock ako vjerujete da će vaš protivnik igrati papir s vjerovatnoćom od najviše 33%, a škare s vjerojatnošću od najmanje 33%; igrati papir ako vjerujete da će vaš protivnik igrati škare s vjerovatnoćom od najviše 33% i ljuljati se s vjerojatnošću od najmanje 33%; drugo da se igraju makaze. (Naš pristup vam može pomoći ako kažete, imate podatke o prethodnim igračima vašeg protivnika.) Igra prepunih barova ima 3 prijatelje A, B i C: Onaj ko ode sam u bar nema ništa - ostanak doma je bolji izbor. Ako dva prijatelja odu u bar, to je najbolja opcija. Ako sva trojica odu, traka izbaci sva trojica. Nash ravnoteže su za sve da ostanu kod kuće, ili da svi odigraju svoju prvu strategiju s vjerovatnoćom jednakom 33%. Ali ako imate bilo kakav uvid u svoje prijatelje i možete procijeniti Bayesovu vjerojatnost njihovog ponašanja, naša strategija može pomoći.

Mi takođe proširujemo svoj pristup igri M-osoba i stječemo slične uvide. Na primjer, prikazujemo cjelovito rješenje za opće igre 2 osobe i opće 3 osobe x 2 strategije igre.

Hipoteza očekivane korisnosti.

U igri 2-Person neka igrači A i B imaju 2 strategije: A1 ili A2 za igrača A, a B1 ili B2 za igrača B.

Osnova za očekivanu teoriju korisnosti je von Neumann - Morgenstern teorema korisnosti (von Neumann i Morgenstern [20]): neka Aij i Bij budu isplati igračima A i B, ako igrač A igra Ai, a igrač B igra Bj, , j = 1 ili 2. Očekivana korisna hipoteza kaže da igrači A i B moraju maksimizirati očekivane otplate1:

gdje je pA (Ai i Bj) vjerovatnoća igrača A da Ai A igra Bj, igra Bj, a slično je i za igrača B.

Uslovne verovatnoće[1].

Za naš pristup mi ispustiti Nešova pretpostavka da su vjerojatnosti igrača međusobno neovisne. To omogućava da naš problem (1) bude općenitiji i dobije više rješenja koja zadovoljavaju očekivanu hipotezu o korisnosti.

Neka EP (A | Ai) i EP (B | Bj) budu očekivane isplate[2],[3] od A i B, s obzirom da A igra Ai, a B igra Bj, za i, j = 1, 2:

Započnimo dokazivanjem an osnovna „Bayesova“ teorema o igrama što pokazuje ekvivalentnost našeg pristupa formulaciji VNM:

Teorem 1[5]. Problemi (3) u nastavku su ekvivalentni problemima (1)[6]:

Dokaz. Po Bayesovoj teoremi,

Zatim,

Maksimum[7] gornje jednadžbe je pA (A1) = 1 (tj. igrati strategiju A1) ako je EP (A | A1) ≥ EP (A | A2), ili pA (A1) = 0 (tj. igrati strategiju A2) ako EP ( A | A1) EP (A | A2). Dakle, (3) vrijedi za igrača A. Sličan argument vrijedi i za igrača BQED

VNM Regioni.

Definirajte VNM regije A1 i A2 da budu konveksni politop:

Kao što je prikazano u nastavku, A treba igrati strategiju A1 ako očekuje da će B biti u regiji A1. U suprotnom, A bi trebao igrati A2. Ravnotežna linija

razdvaja prostor vjerojatnosti na dva područja i pruža vizualno korisno sredstvo za analizu situacije[8].

Važnost regija: Dvije regije su praktično važne, jer sada ne treba precizno procjenjivati ​​vjerovatnoću, već samo odrediti u kojoj se od dvije regije nalazi. Često će se vidjeti da će prethodna vjerojatnost vjerojatno biti u jednoj regiji , i identifikacija tog područja dovoljna je informacija koja sugerira odgovarajuću igru. Na primjer, pretpostavimo da je regija A1 znatno veća od druge, tako da je vjerovatno da je u toj regiji A1. To pruža uvjerljive informacije da će igrač A vjerovatno igrati A1.

Analogno za B:

VNM regije ovise o ranijim raspodjelama vjerojatnosti igrača, koje se često nazivaju priorima (Jaynes [13]; Harsanyi [10]; Kadane i Larkey [11]), što su igračevi uvjerenja o distribuciji vjerojatnosti njihov protivnik. [9]

Dopunski 2. S obzirom (3), A igra strategiju A1 ako i samo ako očekuje da igrač B bude u VNM regiji A1. Inače, A igra strategiju A2. Slično tome, B igra strategiju B1 ako i samo ako očekuje da igrač A bude u VNM regiji B1. Inače, B igra strategiju B2.

Dokaz. EP (A | A1) ≥ EP (A | A2) ako i samo ako A11 pA (B1 | A1) + A12 pA (B2 | A1) ≥ A21 pA (B1 | A2) + A22 pA (B2 | A2) ako i samo ako (A11 - A12) pA (B1 | A1) + (A21 - A22) pA (B2 | A2) + A12 - A21 ≥ 0.

Slično tome, EP (B | B1) ≥ EP (B | B2) ako i samo ako B11 pB (A1 | B1) + B21 pB (A2 | B1) ≥ B12 pB (A1 | B2)

+ B22 pB (A2 | B2) ako i samo ako (B11 - B21) pB (A1 | B1) + (B12 - B22) pB (A2 | B2) + B21 - B12 ≥ 0. QED

Iz teorema 1 i posljedice 2, za točke u regijama (5) i (7), vrijedi očekivana hipoteza korisnosti, tj. VNM regije definiraju opće rješenje za 2-Person igru[10].

Nash Equilibrium.

Ako su vjerojatnosti igrača međusobno neovisne, VNM regije pojednostavljuju:

Prijedlog 3. Pretpostavimo da je Nash-ova ravnoteža (p (A1), p (B1)) u VNM regiji Ai, a VNM regija Bj, za neke i, j = 1, 2. Tada će igrač A igrati strategiju Ai, a igrač B igrati strategiju

Bj.

Dokaz. Nash-ov problem ravnoteže je problem (1), gdje je pA (Ai i Bj) = pB (Ai i Bj) = p (Ai) p (Bj), ili problem (3), gdje je pA (Bj | Ai) = p (Bj ) i pB (Ai | Bj) = p (Ai), za i, j = 1, 2. Dakle, pretpostavka 2 drži, gdje su VNM regije definirane s (8), za pA (B1) = p (B1) i pB (A1) = p (A1). QED

Podsjetimo da su jednadžbe ravnoteže

razdvojite VNM regije, čime ćete dobiti opće rješenje za svaku igru. Te iste jednadžbe ravnoteže, gdje pB (A1) = p (A1) i pA (B1) = p (B1), daju mješovitu Nash-ovu ravnotežu11, kao što to pokazuje u donjoj tablici.

Prijedlog 4. S obzirom na bilo koju igru ​​A = [[A11, A12], [A21, A22]] i B = [[B11, B12], [B21, B22]], Nash ravnoteže za igru ​​izračunavaju se iz odgovarajućeg retka Tablice 112.

Dokaz. Primjetite da je (i, j) čista Nash-ova ravnoteža ako i samo ako sgn (2i - 1) * (A11 - A21)> 0 i sgn (2j - 1) * (B11 - B12)> 0, za i, j = 0, 1. Koristeći tu činjenicu, za svaki red u tablici 1 nabrajamo sve parove (i, j) koji su čista Nash-ova ravnoteža.

Konačno, da bi par (a, b) definiran s (9) bio mješovita Nash-ova ravnoteža, moramo samo pokazati da je 0 <a <1 i 0 <b <1. Ali imajte na umu da su za redove 6, 7, 10 i 11 tablice 1, brojač i nazivnik a, 1 - a, b ili 1 - b pozitivni ili oba negativni; stoga su a 1 - a, b, 1 - b svi veći od 0. QED

Primjer ponovljenog dominiranja[13].

Neka su A = [[2, 2], [3, 1]] i B = [[0, 1], [0, 2]]. „Reproduciraj A1 & B2“ je Nash-ova ravnoteža.

Prijedlog 5. S obzirom na A = [[2, 2], [3, 1]] i B = [[0, 1], [0, 2]], tada će igrač A igrati A1, a igrač B igrati B2.

Dokaz. VNM regija A1 je: pA (B2 | A2) ≥ 1 / 2, a VNM regija B2 je: pB (A2 | B2) ≥ -1. Dakle, igrač B će igrati B2. Igrač A takođe zna da je to slučaj, stoga pA (B2 | A2) = 1. Pošto je pA (B2 | A2) = 1 točka u VNM regionu A1, igrač A igra A1. QED

Primjer koordinacije.

Neka je A = B = [[2, 0], [0, 1]]. Postoje 3 Nash-ove ravnotežne tačke: „igraj A1 & B1“, „igraj A2 & B2“ i „igraj A1 (ili B1) sa verovatnoćom 1 / 3“. VNM regija A1 je: 2pA (B1 | A1) ≥ pA (B2 | A2), a VNM regija B1 je: 2pB (A1 | B1) ≥ pB (A2 | B2). Analizirajući ove VNM regije vizualno, A i B će vjerojatno odabrati strategije A1 i B1.

Prijedlog 6. S obzirom na A = B = [[2, 0], [0, 1]], ako su vjerojatnosti igrača međusobno neovisne, tada odigrajte prvu strategiju ako vjerujete da je protivnikova vjerojatnost da će igrati prvu strategiju barem 1 / 3, ostali igraju drugu strategiju.

Dokaz. VNM regija A1 je: pA (B1) ≥ 1 / 3, a VNM regija B1 je: pB (A1) ≥ 1 / 3. QED

Primjer bitke spolova.

Neka su A = [[3, 1], [1, 2]] i B = [[2, 1], [1, 3]]. Postoje 3 Nash ravnotežne tačke: „igraj A1 & B1“, „igraj A2 & B2“ i „igraj A1 sa verovatnoćom 2 / 3, igraj B1 sa verovatnoćom 1 / 3“. VNM regija A1 je: 2pA (B1 | A1) ≥ pA (B2 | A2) i VNM regija B1 je: pB (A1 | B1) ≥ 2pB (A2 | B2). A radije biraju A1, a B radije biraju B2.

Prijedlog 7. Dane su A = [[3, 1], [1, 2]] i B = [[2, 1], [1, 3]], ako su vjerojatnosti igrača međusobno neovisne, tada: igrajte A1 ako je pA (B1 ) ≥ 1 / 3, a opet igrati A2; reprodukujte B1 ako je pB (A1) ≥ 2 / 3, inače reprodukuje B2.

Dokaz. VNM regija A1 je: pA (B1) ≥ 1 / 3, a VNM regija B1 je: pB (A1) ≥ 2 / 3. QED

Primer podudaranja penija.

Neka su A = [[1, -1], [-1, 1]] i B = [[-1, 1], [1, -1]]. Ova igra sa nultom sumom ima mješovitu Nash-ovu ravnotežu: „igrajte A1 s vjerojatnošću 1 / 2, igrajte B1 s vjerojatnošću 1 / 2“.

Prijedlog 8. S obzirom na A = [[1, -1], [-1, 1]] i B = [[-1, 1], [1, -1]], ako su vjerojatnosti igrača međusobno neovisne, tada: igrajte A1 ako je pA (B1) ≥ 1 / 2, igrajte A2; reproduciraj B1 ako pB (A1) 1 / 2, inače igra B2[14].

Dokaz. VNM regija A1 je: pA (B1) ≥ 1 / 2 i VNM regija B1 je: pB (A1) 1 / 2. QED

Primjer pileće igre (Sugden [19]).

Neka su A = [[0, -1], [1, -10]] i B = [[0, 1], [-1, -10]]. Nash-ove ravnoteže su „igranje A1 (skretanje) i B2 (idite ravno)“, „igranje A2 (idite ravno) & B1 (skretanje)“ i „igranje A1 (B1) sa vjerojatnošću 0.9“.

Prijedlog 9. U igri s piletinom, ako su vjerojatnosti igrača međusobno neovisne, tada: skrenite ako vjerujete da će protivnik odstupiti s vjerojatnošću od najviše 90%, idite ravno.

Dokaz. VNM regija A1 je: pA (B1) + 11pA (B2) ≥ 2, ili pA (B1) ≤ 9 / 10. Slično tome, VNM regija B1 je: pB (A1) ≤ 9 / 10. QED

Primjetite da ako vaš protivnik pokaže previše entuzijazma (najmanje 90%) da biste skrenuli, onda biste trebali krenuti ravno.

Preferirani scenarij: Igrači imaju veću vjerojatnost da će skrenuti nego ići ravno.

Scenarij piletine: Pretpostavimo da je pA (B1) = pB (A1) = 0. Oba igrača očekuju da će drugi igrač otići pravo. Oboje će skretati.

Scenarij katastrofe: Pretpostavimo da je pA (B1) = pB (A1) = 1. Obojica igrača očekuju da će i drugi igrač promašiti. Oboje će ići ravno[15].

Nash ravnotežni scenarij: Pretpostavimo da je pA (B1) = 1 - pB (A1), i pB (A1) = 0 ili 1. Igrač koji očekuje da će drugi igrač otići ravno će se povući, a igrač koji očekuje da će drugi igrač skrenuti, ići će ravno.

Primjer utrke oružja.

U prijedlogu 9, pustimo A = [[0, -x], [1, -10x]], B = [[0, 1], [-y, -10y]], za x, y ≥ 0. Neka A1 ili B1 budu „traže mir“, a A2 ili B2 „nuklearni napad“. Vrijednosti x i y označavaju zalihe oružja od B i A.

Zemlja A traži mir ako je vjerojatnost da će država B napasti veća od 1 / (9x + 1); inače A napadi. Krivulja vjerojatnosti pA (B1) = 1 / (9x + 1) brzo pada, npr., PA (B1) = 1 / 2 na x = 1 / 9, ali ubrzo se drastično spljoštava: B se mora brzo skladištiti u početku, ali kao krivulja spljoštava, B će imati malo koristi od skladištenja oružja.

I slično za zemlju B.

Ukratko, svaka zemlja prvotno skladišti oružje da ne bi bila napadnuta. Ali brzo se smanjuju prinosi na zalihama oružja, što se otvara prilika za traženje mirovnog ugovora.

Kao ilustraciju, uzmite u obzir procjenu 2018 globalne nuklearne zalihe[16] Tabele 2.

Na osnovu isplata iznad i tablice 2, racionalna Sjeverna Koreja trebala bi tražiti mirovni ugovor sa Sjedinjenim Državama i Rusijom.

Skyrms [16]).

Neka su A = [[4, 1], [3, 2]] i B = [[4, 3], [1, 2]]. Neševe ravnoteže su „igranje A1 (stag) i B1 (stag)“, „igranje A2 (zec) i B2 (zec)“ i „igranje A1 (B1) sa verovatnoćom 0.5“.

Prijedlog 10. U lovu na stage, ako su vjerojatnosti igrača međusobno neovisne, tada: lovite stagu ako vjerujete da će protivnik loviti stado s vjerojatnošću od najmanje 50%, u protivnom loviti zeca.

Dokaz. VNM regija A1 je: 3pA (B1) + pA (B2) ≥ 2, ili pA (B1) ≥ 1 / 2. Slično tome, VNM regija B1 je: pB (A1) ≥ 1 / 2. QED

Dilema zatvorenika[17].

Neka je A12 <A22 <A11 <A21, i neka B jednak transponira A. Budući da je A11 <A21 i A12 <A22, upotreba principa dominacije dovodi do Nash-ove ravnoteže, naime nekooperativno rješenje „igra A2 (defekt) i B2 (defekt) ”. Ali budući da su A22 <A11, A i B su bolji ako oboje igraju rešenje za kooperaciju "igraju A1 (tišina) i B1 (tišina)".

Prijedlog 11. U dilemi zatvorenika, ako su verovatnoće igrača međusobno neovisne, tada igrači igraju nekooperativno[18].

Dokaz. Razmotrite lijevu stranu VNM regije A1:

(A11 - A12 - A21 + A22) strA(B1) + A12 - A22.

Ako je A11 - A12 - A21 + A22 ≤ 0, tada (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ A12 - A22 <0. S druge strane, ako je A11 - A12 - A21 + A22> 0, onda (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ (A11 - A12 - A21 + A22) + A12 - A22 = A11 - A21 <0. Dakle, za svaki prethodni igrač A, VNM regija A1 je nulta postavka, stoga mora igrati strategiju 2.

Slično tome, igrač B mora igrati strategiju 2. QED

Prijedlog 11 jasno pokazuje da nas pretpostavka neovisnosti ograničava na nekooperativno rješenje.

Primjer klasične zatvoreničke dileme.

U klasičnoj dilemi zatvorenika A = [[-1, -3], [0, -2]] i B = [[-1, 0], [-3, -2]].

Prijedlog 12. U klasičnoj dilemi zatvorenika, ako su priori igrača: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, pB (A1 | B1) + pB (A2 | B2), tada ≥ X igrači će igrati kooperativno rješenje3.

Dokaz. VNM regija A1 je: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, a VNM regija B1 je: pB (A1 | B1) + pB (A2 | X2 | X3 | Dakle, za date prioritete, igrači A i B moraju igrati kooperativno rješenje. QED

U Proposition 12 obratite pažnju na visoku traku potrebnu za igranje rješenja o suradnji. Igrači bi radije izabrali da igraju nekooperativno rješenje.

Instanca u kojoj Nashov pristup ne razmišlja o igranju strategije suradnje.

Razmotrite dilemu zatvorenika gdje je A11 - A12 = A21 - A22, A21 = A11 + m i A22 = A11 - M, gdje je m> 0 mali, a M> 0 je vrlo velik. Na primjer, A = [[100, -3], [101, -2]]. Podsjetimo iz Propozicije 11 da ako su vjerojatnosti igrača međusobno neovisne, igrači će igrati nesuradnički.

Očito bi bilo glupo za igrače da čak i ne razmatraju igračku strategiju 1 jer ako igrač igra 2, vjerovatnoća da će i drugi igrač igrati 2 stvoriti bi značajan gubitak, pa zašto riskirati. Jasno je da Nash pristup ne razmatra mogućnost kooperativnog rješenja čak i kada je očigledno rješenje igrati - vrlo važna stvar, recimo, rasprave o tržišnim kvarovima u modelima opće ekonomske ravnoteže.

S druge strane, kao što slijedeći prijedlog pokazuje, odbacivanjem pretpostavke neovisnosti, naš će pristup igrati rješenje kooperativnosti, a ne nekooperativno rješenje.

Crna linija je linija ravnodušnosti za dilemu klasičnog zatvorenika. Igrač ima veću vjerojatnost da će igrati strategiju 2 zbog malo vjerovatne vjerojatnosti da će biti u regiji za igranje strategije

1.

Zelena linija je linija ravnodušnosti za ovaj slučaj dileme zatvorenika: pA (B1 | A1) + pA (B2 | A2) = 1 + m / (M + m). Ovdje je veličina područja vjerojatnosti za strategiju 1 gotovo jednaka strategiji 2. Naš pristup savjetuje igračima da razmotre igračku strategiju 1.

Prijedlog 13. S obzirom na dilemu zatvorenika gdje A11 - A12 = A21 - A22, A21 = A11 + m i A22 = A11 - M, gde je m> 0 mali, a M> 0 je vrlo velik, igrači A i B će igrati kooperativno rešenje20.

  • Dakle, igrači neće igrati rješenje nekooperacije.
  • Trenutno, za postizanje rješenja o suradnji dodaju se pretpostavke, npr., Ograničena racionalnost, nepotpune informacije (Aumann i Maschler [2]; Acevedo i Krueger [4]; Daley S obzirom na očekivane zajedničke vjerovatnoće AA pA (Ai i Bj), A zaključuje da pA (A1 i B1) moraju biti u blizini 1-a. To je zato što A i B vjerojatno igraju strategiju 1, gdje su njihove isplati prilično velike i samo m jedinice manje od maksimalnih.

Stoga, pA (B1 | A1) = pA (A1 i B1) / pA (A1) također mora biti blizu 1.

A također zaključuje da je pA (A2 i B2) pA (A2 i B1) jer je B vjerovatnije igrati strategiju 2 ako A igra strategiju 2. Dakle, pA (B2 | A2) = pA (A2 i B2) / (pA (A2 i B1) + pA (A2 i B2)) 1 / 2. A zaključuje, koristeći Sl. 1, da je B dovoljno unutar VNM regije A1. Slično tome, B će igrati strategiju 1. QED

Newcombov paradoks kao verzija dileme zatvorenika.

U čuvenom Newcombovom paradoksu (Wolpert i Benford [21]) postoje prediktor B, igrač A i kutija X. Igraču A je dat izbor uzimanja kutije X ili kutije X plus $ 1,000. Prije nego što A izvrši izbor, B predviđa šta će A raditi, a B predviđanja gotovo sigurna. Ako B predviđa da će A uzeti samo okvir X, tada B stavlja u polje X X $ 1,000,000. U tom slučaju, jer kutija u sebi sadrži $ 1,000,000, A će dobiti $ 1,000,000 ili $ 1,001,000, ovisno o tome da li A odabire polje X ili X plus $ 1,000. S druge strane, ako B predviđa da će A uzeti polje X plus $ 1,000, tada B ne stavlja ništa u polje X. U tom slučaju, A, ili prima $ 1,000 ili ništa.

Newcombov paradoks je da dvije savršeno racionalne analize daju konfliktne odgovore na problem optimizacije igrača A: pod očekivanom hipotezom o korisnosti, igrač A trebao bi uzeti samo okvir X, jer je očekivano plaćanje preuzimanja X mnogo veće. S druge strane, prema principu dominacije, igrač A trebao bi uzeti okvir X plus $ 1,000.

Paradoks je najbolje razumljiv ulomkom u (Wolpert i Benford [21]): „... Newcomb je rekao da će on samo uzeti X; zašto se boriti sa božjim bićem? Međutim, Nozick je rekao: 'Skoro svima je savršeno jasno i očigledno što treba učiniti. Poteškoća je u tome što se čini da se ovi ljudi gotovo ravnomerno dijele na problem, s velikim brojem misleći da je suprotna polovina samo blesava. "..."

Wolpert i Benford rješavaju paradoks pokazujući da Newcombov problem zapravo predstavljaju dvije različite igre s različitim vjerojatnim ishodima.

U ovom ćemo dijelu riješiti paradoks tako što će Newcombov problem postaviti kao dilemu zatvorenika. Na taj način, rješenje Newcombovog problema može se pronaći na dva načina: kao nekooperativno rješenje (uzmite okvir X plus $ 1,000) koristeći princip dominacije ili kao kooperativno rješenje (uzmite samo okvir X) koristeći očekivano hipoteza o korisnosti.

Pretpostavimo da postoji bogati dobrotvor koji obećava da će finansirati matricu isplate predviđača B, dajući sledeću igru: A = [[$ 1,000,000, 0], [$ 1,001,000, $ 1,000]] i B = [[$ 1,000,000, $ 1,001,000 ], [0, $ 1,000]].

Ako B pravilno predvidi, B dobija ono što igrač A dobije. Ali ako B pogrešno predvidi, B dobija $ 1,001,000 minus ono što A dobija21.

Iz Propozicije 13, igrači A i B igrat će kooperativno u ovoj igri.

Ako poput Nash-a, igrač rješava problem koristeći princip dominacije, tako to čini i prediktor. I prediktor i igrač bit će kod rješenja za nesuradnju: uzmite X plus $ 1,000. Ako igrač riješi problem pomoću pretpostavljene korisne hipoteze, isto misli i prediktor, i predviđač i igrač bit će zajedničko rješenje: uzmite samo X. U oba slučaja, predviđanje predviđanja je

i Sadowski [6]) ili su opisane nove metode, npr., tit-for-tat, korelirane ravnoteže (Axelrod [3]; Aumann [1]).

21 Imajte na umu da postavljanjem Newcombovog problema kao PD-a, prediktoru se daje osobni poticaj koji u Newcombovom problemu nije prisutan.

izvjesni. Budući da iz Proposition 13-a, igrači neće igrati nekooperativno rješenje, slažemo se s Newcombom da je suradnja očigledna strategija.

Napomena na slici 1, međutim, regija za suradnju je zanemarivo manja od one za nesuradnju. Tada nas ne čudi ako ljudi ravnomerno podele na koju strategiju.

Generalizacija dileme zatvorenika prema M-osobama.

Kako bismo bolje razumjeli kako bi Nash rješenje moglo razbiti modele opće ekonomske ravnoteže, neka generalizira dilemu zatvorenika prema M-Personsima, pri čemu svaki igrač ima 2 strategije, za M 2.

Opišite nam igru ​​M-Person preko binarnih stabala.

Sl. 2 je isplata dileme zatvorenika za igrača A. Drvo (2, 1) je binarno stablo s igračem B (igrač 2) kao roditeljem, a igračem A (igračem 1) kao djetetom. Da biste postigli isplatu za igrača B, jednostavno prebacite uloge roditelja i djeteta na Drvo (1, 2). Podsjetite da je za dilemu zatvorenika A12 <A22 <A11 <A21.

Zatim, pretpostavimo da drvo (M - 1, M - 2,…, 2, 1) označava isplatu igrača A za (M - 1) -osebnu igru, za M 3. Konstruišite stablo otplate igrača A (M, M - 1,…, 2, 1) za igru ​​M-Person tako što ćete pustiti stablo igrača A (M - 1, M - 2,…, 2, 1) kao potkrovlje na oba grane roditelja igrača M.

Pretpostavlja se da se numeričke vrijednosti isplate desnog potreda razlikuju od onih na lijevom potkrovlju sve dok se odnos A12 <A22 <A11 <A21 održava svuda u stablu.

Konačno, s obzirom na Tree (M, M - 1,…, 2, 1) za igrača A, stvorite Drvo (1, M, M - 1,…, 3, 2) za igrača B (igrač 2) tako što će 1 postati najviši roditelj; Drvo (1, 2, M, M - 1,…, 4, 3) za igrača 3 tako što je 2 postao drugi najviši roditelj,…, Drvo (1, 2, 3,…, M - 2, M, M - 1 ) za igrača M - 1 čineći M - 2 trećim najnižim djetetom, stablo (1, 2, 3,…, M - 1, M) za igrača M tako što je M - 1 postao drugo najniže dijete.

Ovim se upotpunjuje opis isplata igrača za igru ​​dileme za M-Person, s tim da svaki igrač ima 2 strategije.

Teorem 14. Za dilemu zatvorenika M-osobu, M 2, koristeći princip dominacije, rješenje Nash je za igrače da igraju strategiju 2.

Dokaz. Već znamo da teorema vrijedi za M = 2. Pretpostavimo po indukciji da teorem vrijedi za M - 1, za M 3. Pokažimo da teorema vrijedi za M.

S obzirom na drvo (M, M - 1,…, 2, 1) za igrača A, sjetite se da su građevne grane na lijevoj i desnoj grani u obliku drveta (M - 1, M - 2,…, 2) , 1) za igrača 1, stablo (M, M - 1,…, 2) za igrača 2, drvo (2, M, M - 1,…, 4, 3) za igrača 3,…, drvo (2,… , M - 2, M, M - 1) za igrača M - 1. Ova pod-stabla su identična za igrače 1, 2,…, M - 1, osim za označavanje na roditeljskim čvorovima. Imajte na umu da strategija svakog igrača 2 dominira nad njegovom strategijom 1 pod bilo kojim uvjetima. Indukcijom, koristeći princip dominacije, igrači 1 do M - 1 će igrati strategiju 2.

Stoga, s obzirom na Tree (1, 2,…, M - 1, M) za igrača M, ako M igra 1, isplata za igrača M je b (drugi desni desni čvor stabla), dok ako M igra 2, isplata za igrača M je A22 (desni desni čvor stabla). Po principu dominacije, budući da je A12 <A22, igrač M će takođe igrati strategiju 2. QED

Pretpostavimo sada da je svaka isplata tipa A11 mnogo veća od bilo koje isplate tipa A22; i da je A21 = A11 + m, gdje su otplate A11 i A21 u susjednim čvorovima.

Jasno je da Nash pristup ne razmatra igranje kooperativnog rešenja „igraju strategiju 1“ čak i kada je očigledno rešenje za igru.

Slijedom induktivne argumentacije Teorema 14, možemo također zaključiti da, budući da su pod-stabla na lijevoj i desnoj grani oblika Tree (M - 1, M - 2,…, 2, 1) za igrača 1, Tree ( M - 1, M - 2,…, 2) za igrača 2, Drvo (2, M, M - 1,…, 4, 3) za igrača 3,…, Drvo (2,…, M - 2, M, M - 1) za igrača M - 1, indukcijom, koristeći očekivanu hipotezu o uslužnom programu, igrači 1 do M - 1 će igrati strategiju 1 u kojoj je isplata tipa A11.

Stoga, s obzirom na Tree (1, 2,…, M - 1, M) za igrača M, ako M igra 1, isplata za igrača M je (krajnji lijevi čvor stabla), dok ako M igra 2, isplata za igrač M je A21 = A11 + m (drugi lijevi čvor stabla). Pošto je A11 <A21, igrač M može doći u iskušenje da igra strategiju 2. Ali zašto riskirati strategiju igranja 2 za m jedinice veće od A11, kad bi to moglo dovesti do isplate tipa A22, isplata znatno manja od A11?

Prema očekivanoj korisnoj hipotezi, igrač M također mora igrati strategiju 1.

Opće Igre za M osobe.

Na kraju, generaliziramo Theorem 1 za opće igre M-osobe.

Neka postoje M igrači, gdje svaki igrač i nema mogućih strategija za svakog i = 1, 2,…, M. S obzirom na vektor strategije (j1, j2,…, jM), neka isplati igraču i ja sam Aij1j2… jM. Neka je xi mješovita strategija za igrača i, tj. Strategija xi gdje Σj xij = 1, xij 0, sve j, i x = (xi, xi) označava strategije svih igrača. Nešov problem je:

gdje je EP (i | xi) očekivani isplati igraču koji sam dao xi i gdje je zbroj veći od svih jk i svih k.

Strategija x * je Nash-ova ravnoteža ako je xi * rješenje za problem igrača i iznad, s obzirom na xi *.

Za naš pristup, pustimo pij1, j2,…, jM biti očekivana vjerojatnost igrača da igrač k igra jk, za sve jk i sve k. Teorija očekivane korisnosti Von Neumann-Morgenstern kaže da je cilj igrača da maksimizira očekivanu isplatu:

gdje je zbir nad svim jk i svim k.

Definiši

gdje -i igra j-i znači da igrač k igra jk i gdje je zbroj veći od svih jk, za sve k i.

Teorem 15. Problemi (13) u nastavku su ekvivalentni problemima (11):

Dokaz.. Po definiciji,

gdje je zbroj nad svim rk, za bilo koji k i.

Naziv (14) je vjerovatnoća pi (i igra ji). Dakle,

S obzirom na to da je Σ pi (igram ji) = 1 i pi (igram ji) 0 za sve ji, slijedi da igrač i igra strategiju [arg maxji EP (i | i igra ji)]. QED

Metoda pronalaženja najbolje strategije za igrača i je sljedeća: Za bilo koji par strategija za igrača i, recimo strategiju r i strategiju s, izračunajte lokus bodova u kojima su očekivani isplate uvjetovani igračem koji igra ili je r ili s jednak . Ovo definira površinu ravnodušnosti koja dijeli uvjetni prostor vjerojatnosti u 2 VNM regije. Jedna VNM regija označena je s r jer je strategija izbora r, a druga VNM regija s, jer je strategija izbora s.

Nakon gornjih izračuna, svaka VNM regija bit će označena onoliko puta koliko postoje različiti parovi strategija. Za bilo koju regiju VNM uzmite bilo koju od više oznaka i uklonite jednu od njih na osnovu površine ravnodušnosti koju stvara ovaj par naljepnica. Proces se završava kada svaka VNM regija ima samo jednu oznaku.

Opće Igre za osobe 2.

Neka igrač A ima strategije Ai, i = 1, 2,… n1, a igrač B ima strategije Bj, j = 1, 2,… n2. Pretpostavimo da su verovatnoće igrača međusobno neovisne. Problem (13) je:

Stoga su VNM regije definirane konveksnim politopima:

Kao što se može primijetiti u (16), pronalaženje rješenja postavljenog za opću igru ​​2 osobe je jednostavno. Na primjer, razmislite o preko dvije tisuće godina staroj igri Rock-Paper-Scissors, gdje je Nash-ova ravnoteža: igrajte bilo koju strategiju s 33% vjerovatnoćom:

Strategija A1 ili B1 (rock) gubi na strategiji A2 ili B2 (papir) gubi na strategiji A3 ili B3 (makaze) gubi da se stegne.

Za igrača A, općenito imamo gdje 0 pA (Bj) 1,

koja se svodi na

I slično za igrača B.

Ono što se čini novom strategijom za ovu drevnu igru ​​jest: igrajte rock ako vjerujete da će vaš protivnik igrati papir s vjerovatnoćom od najviše 33% i škare s vjerojatnošću od najmanje 33%; igrajte papir ako verujete da će vaš protivnik igrati škare s verovatnoćom od najviše 33% i ljuljati se sa verovatnoćom najmanje 33%; ostalo igrati škare22.

Igre za 3 osobe u kojima svaka osoba ima 2 strategije.

Primijenimo Teorem 15 za pronalaženje rješenja postavljenog u igri za osobe 3, gdje svaki igrač A, B i C ima 2 strategije Ai, Bi, Ci, za i = 1, 2.

Pretpostavimo da su verovatnoće igrača međusobno neovisne. Za igrača A jednačina (13) je

i slično za igrače B i C. Koristeći Theorem 15, rješenje je definirano sa:

Iskoristimo gore navedeno za igru ​​Bar-gužve[21]:

Ako je igrač kod kuće, isplata mu je 1; ako je igrač sam na šanku, njegova isplata je 0; ako je igrač na šanku s drugom osobom, njegova isplata je 2; drugo, isplata mu je -1.

Imamo: A111 - A211 = -2, A112 - A212 = A121 - A221 = 1, A122 - A222 = -1, dakle VNM regija A1 je regija -3pA (BXXUMUMN) X (PXXUMUMN) (C1) - 1 ≥ 2, ili ekvivalentno regija[22] pA (B1) ≥ (1 - 2pA (C1)) / (2 - 3pA (C1)). Slično tome, VNM regija B1 je regija pB (A1) ≥ (1 - 2pB (C1)) / (2 - 3pB (C1)) i VNM regija C1 je regija pC (B1) ≥ (1X) - X (2X) / (1 - 2pC (A3)). Neševe ravnoteže su p (A) = p (B) = p (C) = 1 i p (A) = p (B) = p (C) = 1 / 1.

Priznanje.

Željeli bismo se zahvaliti Al Rothu i Toddu Daviesu na njihovim neprocjenjivim savjetima i smjernicama u pripremi ovog rada.

Fusnote

[1] Radi jednostavnosti, dajemo uobičajenu pretpostavku da je uslužni program linearna funkcija isplate (Starmer [18]). Dakle, maksimiziranje očekivane korisnosti isto je kao i maksimiziranje očekivane isplativosti.

[2] Naš Bayesov pristup igrama razlikuje se od prethodnog Bayesova djela (na primjer, Acevedo i Krueger [4]; Aumann [1]; Daley i Sadowski [6]; McKelvey i Palfrey [12]; Quattrone i Tversky [15]) u tome, za razliku od ostalih pristupa, uslovne vjerojatnosti našeg pristupa nedvosmisleno odgovaraju pretpostavljenoj korisnoj hipotezi, što naše rješenje uvijek zadovoljava.

[3] Kritičar kaže da "racionalni igrači ne moraju i ne bi trebali uzeti u obzir vjerojatne vjerojatnosti ... Zamislite agenta koji zna da je vjerovatnost kiše p. Čini se da je vaše 'rješenje' da agent treba uzeti kišobran sa sobom ako pada kiša i ostaviti kišobran ako ne pada kiša «.
Teorem 1 pokazuje da su bivše kritike neopravdane. S obzirom na potonju kritiku, neka EP (agent | donese kišobran) = p, a EP (agent | ne donese kišobran) = 1 - p. Naše rješenje bi tada bilo: donijeti kišobran ako je p ≥ 1 / 2; ne donosite kišobran ako je p ≤ 1 / 2.

[4] Uslovne verovatnoće (2) ne krše princip u Spohnu [17]: "Svaki adekvatan kvantitativni model odluke ne sme izričito ili implicitno sadržavati bilo kakve subjektivne verovatnoće za dela ..." Uslovne verovatnoće igrača su subjektivne verovatnoće za protivnika strategije, a ne za svoje strategije.

[5] Ova teorema će se generalizirati na jednu za igre s M osobama.

[6] Ne postoji signalizacija između igrača.

[7] Nezavisne varijable pA (B1 | A1) i pA (B2 | A2) pretpostavljaju se dane u problemu maksimizacije, pojednostavljenje kojim se izbjegava problem beskonačne regresije (slično kao Neševa pretpostavka da je p (B1) dat za igrača A u formulaciji njegovog problema maksimizacije).

[8] Nejednakost (5) je (otkriveno) rješenje problema (1) na isti način kao što je kvadratna formula rješenje generalne kvadratne jednadžbe.

[9] Prioritet igrača može ovisiti o djelomično uočljivim slučajnim događajima, poput vremenskih prilika. Za upotrebu prioriteta u igrama s nepotpunim podacima koje igraju Bayesovi igrači, molimo pogledajte (Harsanyi [10]).

[10] Ovo opšte rješenje sadrži Nash-ove ravnoteže kao posebna rješenja. Za razliku od opisnih Nash rješenja, naše rješenje je par propisanih racionalnih očekivanja, čiste strategije. Štoviše, ako je greškom, igrač A je u regiji VNM A1 i igra A2, Corollary 2 navodi da će igrač A dobiti manju očekivanu isplatu.

[11] Zanimljivo je napomenuti da u Nash mješovitoj ravnoteži igračeva strategija ovisi o poznavanju funkcije isplate drugog igrača.

[12] Nula znakovi se u tablici zanemaruju, jer su ovi slučajevi degenerirani: igrač ne može birati između svoje dvije strategije. Također je zanimljivo primijetiti da se svaka Nash-ova ravnoteža pojavljuje u točno četiri reda.

[13] Sljedeći primjeri 3-a prilagođeni su iz (Davies [7]) na način koji bi mogao poslužiti kao pedagoška tehnika za studente u teoriji igara. Tablica 1 može se koristiti za brzo pronalaženje Nash-ove ravnoteže za sve ovdje opisane primjere igara za 2.

[14] A akcije ne utječu na izbor B akcija. To je zato što su A-ova uvjerenja neusklađena s B-ovim vjerovanjima. S druge strane, ako su vjerovanja povezana, vjerojatnost oba igrača mora biti jednaka 50%, u suprotnom, ako recimo da su vjerojatnosti igrača obje> 50%, A zna da će B igrati strategiju 2 (repovi), dakle igra strategiju 1 (glave) ne mogu biti ispravan recept za A. Ako recimo, A vjerovatnost je> 50%, a B vjerovatnost <50%, B zna da će A igrati glave, dakle igranje glava ne može biti ispravan recept za A. Itd. jedinstveno rješenje je, dakle, Nash-ova ravnoteža: igrajte nasumično za oboje.

[15] Imajte na umu da je pA (B1) = pB (A1) = 0 ili 1 scenarij ravnoteže: oba igrača skreću (ili oba idu ravno), ako oba igrača očekuju da će drugi igrač ići ravno (ili skretati). Suprotno tome, p (A1) = p (B1) = 0 ili 1 ne može biti Nash-ova ravnoteža: ako B ide ravno (ili skretanje), A će skrenuti (ili ići ravno).

[16] Izvori: Udruženje za kontrolu oružja, Federacija američkih naučnika, Međunarodni panel o fisijalnim materijalima, Ministarstvo odbrane SAD, Ministarstvo vanjskih poslova SAD-a i Međunarodni institut za istraživanje mira u Stockholmu.

[17] Od originalnog rada Flood i Dresher, objavljeno je na hiljade članaka u vezi s tim. Pretraživanje Google znalca za "dilemu zatvorenika" donosi rezultate 104,000 od ovog pisanja. Molimo vas da se obratite (Kuhn [14]).

[18] Stoga, igrači neće igrati kooperativno rješenje.

[19] Ako vaš protivnik igra nasumično, na vašu prethodnu igru ​​može utjecati prethodna igra ove igre.

[20] Formula se može proširiti na M-osobe, za M> 3.

[21] Ova igra temelji se na problemima El Farol bar (Arthur [5]).

[22] Lokus ravnodušnosti je kvadratna krivulja koja prolazi kroz točke (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

reference

[1] Aumann RJ (1974) Subjektivnost i korelacija u nasumičnim strategijama. Časopis za matematičku ekonomiju 1: 67-96

[2] Aumann RJ, Maschler M (1995) Ponavljane igre s nepotpunim informacijama. MIT Press, Cambridge London

[3] Axelrod R (1984) Evolucija saradnje. Osnovne knjige

[4] Acevedo M, Krueger JI (2005) Dokazno obrazloženje u dilemi zatvorenika. Američki časopis za psihologiju 118: 431-457

[5] Arthur WB (1994) induktivno obrazloženje i ograničena racionalnost. Američki ekonomski pregled 84: 406-411

[6] Daley B, Sadowski P (2017) Magično razmišljanje: Rezultat reprezentacije. Teorijska ekonomija 12: 909-956 24 Ova igra temelji se na problemima El Farol bar (Arthur [5]). 25 Lokus ravnodušnosti je kvadratna krivulja koja prolazi kroz točke (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

[7] Davies T (2004) Teorija korisnosti i teorija igara. Bilješke predavanja

[8] Garcia CB, Zangwill WI (2017) Novi pristup ratu ili miru. Radni papir

[9] Garcia CB, Zangwill WI (2018) dominacija, očekivana korisnost i zatvorenička dilema. Radni papir

[10] Harsanyi J (1967) Igre sa nepotpunim podacima koje igraju „Bayesian“ igrači I - III. J. Science Science 14 (3): 159-182

[11] Kadane JB, Larkey PD (1982) Subjektivna vjerojatnost i teorija igara. Nauka upravljanja 28 (2): 113-120

[12] McKelvey RD, Palfrey TR (1995) Quantal Response Equilibria za igre u normalnim formama. Igre i ekonomsko ponašanje 10: 6-38

[13] Jaynes ET (1968) Prethodne verovatnoće. IEEE transakcije na području sistemske znanosti i kibernetike 4 (3): 227-241

[14] Kuhn S (2017) Dilema zatvorenika. Stanfordska enciklopedija filozofije

[15] Quattrone GA, Tversky A (1984) Uzročno dijagnostički nepredviđeni slučajevi: o samoobmani i o iluziji glasača. Časopis za ličnost i socijalnu psihologiju 46: 237-248

[16] Skyrms B (2004) Lov na stagove i evolucija društvene strukture. Cambridge University Press, Cambridge

[17] Spohn W (1977) Gde Luce i Krantz zaista generaliziraju Savageov model odlučivanja. Erkenntnis 11: 113-134

[18] Starmer C (2000) Razvoj teorije neočekivanih korisnosti: potraga za opisnom teorijom izbora u riziku. Časopis za ekonomsku literaturu 38: 332-382

[19] Sugden R (2005) Ekonomija prava, saradnje i dobrobiti. Palgrave MacMillan, izdanje 2: 132

[20] Von Neumann J, Morgenstern O (1953) Teorija igara i ekonomsko ponašanje. Princeton University Press, New Jersey

[21] Wolpert DH, Benford G (2011) Lekcija Newcombovog paradoksa. Sinteza 190: 1637-164