Ordning och anarki: Workshop om superrationalitet med Ung filosof

Säg att du sitter i ett rum och får ett erbjudande om att vara med i en variant av ett luringlotteri. Så här ser reglerna ut:

Summan som lottas ut är i utgångsläget $100, men det kan förändras senare.
För att vara med i lotteriet måste du skriva ned ett heltal på en bit papper. Det måste minst vara en etta, men kan vara så högt som möjligt så länge det är ett förståeligt, naturligt tal. (Man får inte fuska och skriva oändlighet.)
Det går bra att neka att vara med i lotteriet, eller skriva 0 på lappen. Även om man inte är med i lotteriet, kan det vara en del av ens strategi att skriva en nolla på lappen.
Lotteriet tar alla tal som deltagarna skrivit ned och plussar samman dem. En deltagares chans att vinna är lika stor som [siffran denne skrev] / [den totala summan av alla siffror]. Så om det var fyra deltagare och deltagarna skrev följande tal:
A: 50
B: 10
C: 0
D: 10
Då finns det 70 lotter i lotteriet. Deltagarnas chans att vinna i lotteriet är (ungefär):
A: 71,4%
B: 14,3%
C: 0%
D: 14,3%
Vinstsumman kommer att delas med den totala summan av de siffror som folk skrev in. I fallet ovan kommer vinstsumman att vara $100 / 70 = $1,43.
Deltagarna får inte kommunicera med varandra på något sätt för att koordinera vad de skriver ned eller skapa några uttalade allianser för att dela på pengarna.

Du vet en bit information innan du skall spela: alla andra deltagare är väldigt rationella individer och är ute efter att tjäna så mycket pengar som möjligt. Givet att du själv också vill tjäna så mycket pengar som möjligt, vad är det mest rationella du kan göra?

Igår så hade Ung filosof en workshop där vi spelade det här spelet: jag stod för lotteriet och fyra var med och spelade. Temat för kvällen var superrationalitet och vad som är det rationella att göra i situationer som fångarnas dilemma, återkommande fångarnas dilemma, Newcombs problem och lotteriet ovan. (Jag kommer att diskutera fångarnas dilemma nedan så kolla in länken eller den här videon för att se hur folk resonerar om det här fallet.)

Problemet med alla dessa spel är att om man följer vad spelteoretikernas idé av vad rationalitet innebär så kommer man att förlora. I alla varianter av fångarnas dilemma där man vet om när sista spelet skall spelas kommer man att försöka lura den andra, i Newcombs problem kommer man att ta två lådor och i ett platonia-dilemma kommer man att skicka iväg ett telegram utan att ha gjort någon kalkylering innan dess.

Platonia-dilemmat fungerar såhär: en rik triljardär bjuder in tjugo personer till ett lotteri. För att vara med och tävla skickar man in ett telegram (som han betalar) med ens namn på till honom. Men triljardären betalar endast ut summan ifall bara en person har skickat in ett telegram till honom; om två eller fler skickar in ett telegram ger han inte ut några pengar alls.

Det här dilemmat illustrerar väl vad som är fel med spelteoretikernas logik. Enligt den spelteoretiska bilden av rationalitet så undersöker man vad man skulle gjort beroende på vad andra gör. Om man tror att alla andra låter bli att skicka ett telegram skall man skicka ett själv för då lär man vinna pengarna. Och om man tror att de andra skickar ett telegram kan man lika gärna göra det själv, det kostar inget och man kan ju ha fel. Oavsett vad de andra gör, skicka telegrammet. Den här modellen av rationalitet kallas för den dominanta strategin.

Om man resonerar likadant i de andra problemen kommer man alltså att förlora. Och hur är det rationellt för fem öre? Det verkar det inte vara, och Douglas Hofstadter kom på begreppet superrationalitet för att beskriva vad som är det verkligt rationella att göra i situationen. Vad innebär då superrationalitet? Det går att sammanfatta i tre tankesteg:

1. Först måste man se att i alla spel där man har samma intresse, man får samma belöningar och alla deltagare gör ett rationellt val, så kommer alla att göra samma val, även om de inte kommunicerar med varandra om detta. En person kan inte resonera sig fram till att göra något annorlunda än alla andra, för vad som är rationellt är något som är givet av logikens regler.

Detta innebär att i varianten av luring-lotteriet ovan, i fångarnas dilemma och i platonia-dilemmat kommer alla rationella individer att göra samma sak. Om det är fångarnas dilemma (där man kan tjalla eller vara tyst) så kommer alla rationella individer antingen att tjalla eller så kommer de att vara tysta.

2. Eftersom alla kommer att göra samma val borde varje deltagare göra det val som, när alla andra också gör det valet, leder till att denne får det bättre. I fångarnas dilemma innebär det att en värld där båda samarbetar är bättre än en värld där båda tjallar på varandra, så är det mest rationella att samarbeta.

Steg två kan se lite konstigt ut, för det verkar bygga på att ens eget val kommer att direkt påverka vad de(n) andra i spelet gör. Men så är inte fallet, utan det säger istället att alla andra kommer att komma fram till samma slutsats som du gör, för att de följer samma logik. Som Hofstadter uttryckte det:

[T]he argument Whatever I do, so will everyone else do is simply a statement of faith that reasoning is universal, at least among rational thinkers, not an endorsement of any mystical kind of causality.

Ungefär det här gick vi alltså igenom igår, fast det var större fokus på att kolla på varför den spelteoretiska strategin suger. Hur gick det då med lotteriet?

Jo! Deltagarna - Arngrim, Carl-Johan, Christoffer och Fredrik - skrev dessa siffror:

Arngrim: 0
Carl-Johan: 11
Christoffer: 1
Fredrik: 1

Vilket alltså gav en vinst på $8. Carl-Johan, Christoffer och Fredrik drog sedan lott om vem som vann pengarna, och Carl-Johan vann pengarna genom lottning.

Men, vad är då den superrationella lösningen på det här problemet? Det går ju inte att bara antingen samarbeta eller inte, som i fångarnas dilemma. Och det går inte att bara antingen skriva "1" eller inte. Det gäller att följa en viss strategi. Vilken är den?

Börja med att identifiera det allra bästa målet för dig i lotteriet. Det är att vinna $100. Hur skall du gå tillväga för att vinna de pengarna? Skriv 1.

Men, om du skriver 1 då kommer ju alla andra också ha gjort detta och det är ju inget bra, för då kan du maximalt vinna $25. Ta det här som en grund, dock, att alla lägger in varsin etta. Ens förväntade belöning ser då ut såhär: 25% * $25.

Vad finns det för alternativ som är bättre? Jo, det är att alla på förhand kastar en fyrsidig tärning där det bara på en sida står att man skall skriva in en siffra. Detta ger en förväntad belöning på ungefär [10,5% * $100 + 7,25% * $50]*** vilket är helt klart bättre än strategin ovan.

I valet mellan dessa två strategier är det ju helt klart bättre för en själv om alla väljer det senare. Eftersom alla kommer att välja samma sak väljer du då att göra det senare. Du kastar en tärning och kommer då antingen att skriva in en siffra eller inte.

Det finns också en möjlighet att ingå en superrationell allians, vilket är otroligt häftigt och coolt, för det är en allians man kan ingå med andra utan att ingå någon kommunikation. Alliansen är att man gör strategin ovan med baktanke om att dela på bytet i efterhand. (Det finns dock problem med att veta om någon gillar att ta risker och därmed vill ingå i en sådan förening eller inte, men det går nog att lösa.)

Så, vad kan man säga i slutändan om det här med superrationalitet? Det ser ut att vara en otroligt elegant lösning på dessa dilemman som även fungerar när man inte vet något om de andra personerna, annat än att de är rationella och ställs inför liknande förutsättningar som en själv. Detta gäller inte bara i hypotetiska exempel som filosofer skapat, utan det gäller även för verkligheten. Vi är alla rationella varelser som har ungefär likadana mål och behöver varandras hjälp för att nå de allra högsta målen möjliga. Det borde då finnas en superrationell strategi, som man i stora drag kan arbeta fram på egen hand, för att både minska sannolikheten att man hamnar i konflikt med andra samt maximera möjligheterna till gynnsamt utbyte med andra.

Slutligen får jag säga att det känns något besviket att den här otroligt vackra teoretiska förklaringen av varför det är bra med samarbete redan är välkänd och praktiserad av väldigt många i samhället i de flesta fall (förutom när det gäller politik). De allra flesta säger nämligen något i stil med "Tänk om alla tänkte så!" när de får höra argumentet för att inte samarbeta i FD och liknande. Som i många andra fall visar det sig att kulturen även här har en hel del vishet i sig som inte nödvändigtvis går att artikulera.

*** Den här siffran är inte helt rätt, men den är rätt nära. Jag hade tidigare skrivit att man hade 25% sannolikhet att vinna $100 men det stämmer inte, då jag bara antog att ingen annan skulle slå en etta. Men om man antar att fyra personer kastar en fyrasidig tärning (som är pyramidformad) så är det ca 58% sannolikhet att minst en till får en etta och 42% sannolikhet att ingen annan får det. Det innebär att:

* i 75% av fallen får man ingenting.
* i 25% av fallen kan man vara med och tävla.
* i 42% av de senare så får man hela vinsten. (Samma som sannolikheten att de tre andra inte får något när de kastar tärningen, d.v.s. 75%^3.)
* i 58% av de senare så lottas vinsten ut mellan en själv och minst en person till. (1 - 75*^3.)

I det sista fallet skulle det kunna vara så att fler än en får en etta och kan vara med och tävla. Så egentligen är vinsten något mindre. Det spelar nog ingen större roll för vadet som sådant, då det förväntade värdet är störst med den superrationella lösningen.

Ordning och anarki

torsdag 28 mars 2013

Workshop om superrationalitet med Ung filosof

Inga kommentarer:

Skicka en kommentar