Komunity a vězení

Jedna prostá hra na víkend. Vypovídá o chování lidí, a přitom je to jen obyčejné sčítání a odčítání. Myslíte si, že je lepší podrazit nebo spolupracovat?

Jedny z nejlepších blogpostů, které jsem kdy napsal, byly ty o psychologii. Dnes jsem oprášil první dva – Trocha matematiky v mezilidských vztazích, díl první a díl druhý.

Ve výše zmíněných článcích naleznete populární formou podané "pozadí" dnešní hry. Hra se jmenuje "Iterované dilema vězně". Ve stručnosti popíšu o co jde.

Představte si, že jste uvězněn spolu s vaším komplicem, jste držen každý zvlášť a jste zvlášť vyslýcháni. Máte možnost vypovídat proti tomu druhému nebo mlčet. Policie na vás skoro nic nemá a pokud se oba svorně rozhodnete mlčet, dostanete oba tak akorát podmínku. Pokud však pomůžete vašeho kolegu usvědčit, půjde on sedět na deset let a vy vyváznete bez trestu. Totéž platí i v opačném případě. A pokud se rozhodnete oba vypovídat proti tomu druhému, půjdete sedět na pět let oba. Jak se rozhodnete?

Teď si tu hru zjednodušíme. Hrají dva lidi proti sobě a ve stejný okamžik volí "podrazit" nebo "spolupracovat". Pokud oba spolupracují, mají jistý malý zisk. Pokud jeden podrazí, hodně získá, ale ten druhý hodně tratí. Pokud podrazí oba, je jejich zisk mizivý. Cílem je hrát tak, abyste získali co nejvíc – tedy cíl čistě egoistický.

Pokud dopředu víte, že se hraje jen jedno kolo, je vždy lepší podrazit. Jenže co když se hra opakuje podruhé, potřetí, počtvrté...? Musíte trošku přemýšlet – víte jak se váš protihráč dosud choval. Budete spolupracovat, když vás už několikrát podrazil? Budete-li se oba navzájem jen podrážet, je váš zisk menší než když budete oba spolupracovat. Váš egoistický cíl zde není v rozporu s cílem "altruistickým".

Jedná se o tzv. hru s nenulovým součtem. V takových hrách není zisk jednoho hráče roven ztrátě druhého, ale za jistých okolností mohou oba získat. Takové hry odpovídají realitě mezilidských (mezistátních, mezispolečenských...) vztahů víc než hry s nulovým součtem, v nichž zisk jednoho je podmíněn ztrátou druhého.

V mé simulaci spolu hraje osm hráčů, metodou "každý s každým". Během jedné hry spolu hrají předem neznámý počet kol. V každém kole se hráč rozhodne, s kým z ostatních hráčů bude spolupracovat a koho podrazí. Může spolupracovat se všemi, může všechny podrazit, o tom, jak se zachová ke konkrétnímu hráči rozhoduje jeho algoritmus. Po sehrání předem neznámého počtu kol je vyhodnocen zisk jednotlivých hráčů a hra končí. O konečném výsledku simulace rozhoduje součet zisků z deseti her.

Simulace používá 20 až 30 kol v každé hře, to kvůli srovnání výkonnosti jednotlivých sestav hráčů. Mnohem reálnější by byly hry, které by mohly mít počet kol mezi 1 a 100.

Vy si můžete vybrat jak se bude který hráč chovat. Na výběr máte následující algoritmy:

1. Kavka. To je hipísácký algoritmus, který vždy spolupracuje.
2. Podrazák je algoritmus, který vždy podrazí
3. TFT je algoritmus TIT-FOR-TAT, neboli "Podraz za podraz". Začne každou hru spoluprací. V každém dalším kole oplatí soupeři to co udělal soupeř, tedy na podraz soupeře odpoví podrazem, na spolupráci odpoví spoluprací.
4. TF2T je upravený předchozí algoritmus, který odpovídá podrazem až na dva po sobě jdoucí podrazy protihráče.
5. Rozmar je algoritmus, který se mezi spoluprací a podrazem rozhoduje zcela náhodně.

Aby to neměli hráči tak jednoduché, je do celé simulace vnesen rušivý prvek "náhody" – s určitou pravděpodobností je vstřícný krok vnímán a vyhodnocen jako podraz...

Nastavte si tedy "povahy" v této malé "komunitě" a nechte je hrát. Dvakrát, třikrát, desetkrát... Co uvidíte?

Společnost samých kavek je společnost, kde všichni hráči získávají a jediné rozdíly mezi nimi jsou dány prvkem náhody, viz výše. Když se vliv náhody sníží (=lidé si víc věří), poklesnou i rozdíly mezi zisky: viz Průměrný zisk člena takovéto společnosti kavek je okolo 8500.

Ve společnosti samých podrazáků neexistují rozdíly mezi zisky. Všichni mají stejně, náhoda zde nepůsobí. Průměrné zisky však jsou podstatně nižší, okolo 1700.

Když se do společnosti samých dobromyslných kavek dostane jeden podrazák, nemilosrdně je oškube: viz Zisky kavek jsou okolo 5000, podrazák však získává zhruba 17000. Průměrný zisk klesne na 6300.

Když do společnosti přijde druhý podrazák, tak průměrný zisk společenství klesne na 4700, zisky kavek poklesnou na hodnoty okolo 1200 a zisky obou podrazáků klesnou na 15000 – což je ale desetkrát víc než jsou zisky nešťastných kavek.

Třetí podrazák sníží opět výkon společenství na průměrnou hodnotu okolo 3100, zisky podrazáků klesnou na 12500, ale kavky jsou zde již ve ztrátě – průměrně -2500 každá.

S rostoucím počtem podrazáků v komunitě klesá pomalu i výkon společenství, klesají i zisky podrazáků a rapidně rostou ztráty "kavek".

Ve společnosti samých podrazáků získává každý, jak jsme si už řekli, okolo 1700. Stačí však přidat jednu kavku a vše je rázem jiné. Výkon společenství paradoxně poklesne (ze 1700 na 1200), kavka ztrácí okolo 17000, ale příjmy všech sedmi podrazáků vzrostou na více než dvojnásobek – na hodnoty okolo 3900.

Pro podrazáka je tedy nejlepší situace taková, když se ocitne sám samojediný ve společnosti nic netušících kavek. Jeho zisky jsou pak obrovské. Pokud ovšem společnost místo kavek tvoří TFT (hrající nemilosrdně podle principu oko za oko), rázem se stane podrazák nejméně výkonným a jeho zisky jsou minimální – TFT dokáží vliv podrazáka eliminovat a udržet si své zisky (cca 7000); navíc výkon TFT podrazákovi zdvojnásobí zisky proti stavu, kdy byl ve společnosti sobě rovných... TFT algoritmy dokáží zůstat "výdělečné" i pokud jich je stejně jako podrazáků, dokonce i při poměru 5:3 jsou na tom TFT stále lépe než podrazáci.

Zjišťování toho, co se stane, když TFT nahradíme TF2T algoritmem (to je ten "poprvé odpustím") ve společnosti podrazáků, ve společnosti kavek, jestli je výhodnější být TFT nebo TF2T, jaký vliv má míra náhody na výhodnosti TF2T nebo co udělá s jakým společenstvím člověk, co se prostě přišel jen pobavit ("rozmar") nechám na vás. A vyvození případných závěrů taky.

Já použiju jen to výše popsané, abych odvodil některé závěry, použitelné pro socioware a komunitní projekty:

 – Největší zisk přináší Společenství Krásných A Hodných Lidí, co spolu vždy spolupracují – bohužel je samo nestabilní, navíc nereálné.

 – Takové společenství je zlatým dolem pro podrazáky, kteří se na podobných komunitách mohou neskutečně napakovat.

 – V malém počtu mohou podrazáci na kavkách úspěšně parazitovat – všem ostatním sice zisky klesají a výkon celého společenství se rovněž snižuje, oni však mají zisky vysoce převažující průměr.

 – TFT a TF2T postupy se sice neslučují s učením Pravdylásky, ale jsou nejefektivnější – minimalizují riziko rozkladu společenství. Pokud je společenství tvořeno pouze těmito algoritmy a hrozí vysoká míra "rušení", je na tom lépe TF2T, tedy ten "více altruistický" algoritmus.

 – Dva TFT algoritmy se vlivem rušení mohou dostat do série vzájemných podrazů, ze které už nevybřednou, TF2T je zase citlivý na přítomnost čistého podrazáka.

Aplikaci výše popsaných závěrů pro komunity a socioware ponechám na vás.

Pokračování: Útěk z vězení

PS: Aplikace vznikla během půl hodiny jako čistě matematická simulace. Kdo má potřebu mekotat něco o jejím vzhledu, je idiot!

Dne 30.09.2006

Twittni

Přidej do: asdf.sk StumbleUpon Toolbar Stumble It!

Komentáře

[1] (vojta - WWW) 11.09.2007, 22:12:25 [X] [D]
Velmi zajímavé, asi si něco podobného zkusím naprogramovat. Díky.

[2] (Pik - Mail ) 22.10.2007, 13:33:49 [X] [D]
Spíš než komentář, žádost. Šlo by prosím doplnit jaká je matice zisků? Dle výsledků se zdá, že Kavka/kavka = zisk 35, Podraz/Podraz = zisk 7, ale na první pohled nevykoukám jaký je zisk/ztráta v případě Kavka:Podraz a Podraz:Kavka. Dík Pík.

[3] (Pik - Mail ) 22.10.2007, 16:28:19 [X] [D]
A ještě jedna otázka do foroty. Jakou strategii má účetní?