Útěk z vězení

Další praktické poznámky k aplikaci vězeňského dilematu na chování různých společenství se zvláštním zřetelem na webové komunitní aplikace.

Rozvíjím včerejší článek a zároveň odpovídám na dotaz "Jak by se mělo společenství chovat, aby bylo odolné proti podrazákům?" Jako model bude opět použita moje simulace iterovaného dilematu vězně , který je sice jen prostým modelem, ale možné stavy společenství demonstruje velmi přesně.

Stručně zopakuji (ze včerejšího článku) základní modely chování:

Kavka vždy spolupracuje s ostatními, podrazák je vždy podrazí. TFT začne spoluprací a na podraz odpovídá v dalším kroku podrazem, na spolupráci spoluprací. TF2T je totéž co TFT, ale podrazem odpovídá až na dva po sobě jdoucí podrazy. Rozmar, tedy náhodně se rozhodující, v tomto článku nebude použit.

Pro komunitu je nejvýhodnější, začnou-li její členové vzájemnou spoluprací. Společenství vždy spolupracujících je nejvýkonnější z hlediska celkového zisku a je odolné proti rušení – krok omylem vnímaný jako podraz nevede k rozpadu spolupráce v dalších krocích. Jejich spolupráce je založena na čistě egoistickém principu ("maximalizovat zisk"), ale vede k altruistickému chování ("já vydělám když ty vyděláš"). Zde by bylo vhodné podotknout, že minimálně v Česku je taková úvaha naprosto utopická, tady totiž stále platí "Když já ne, tak ani ty ne!"

Lidé ovšem nejsou mírní beránci a ačkoli je k modelu "vždy spolupráce" nabádá křesťanství už téměř dvě tisícovky let, tak to pořád nějak ne a nechce fungovat. Stačí, že je člověk párkrát podražen, zjistí že tratí a že ten, kdo jej podrazil, vydělal. Komunita může snad jen silou své víry dosáhnout toho, že její členové budou stále jen spolupracovat – ale pak se jedná už o sektu. Reálná společenství nemívají tak silnou víru. Pokud společenství roste, bývá motivace nových členů nižší. (Webové komunitní projekty jsou až na výjimky otevřené, platí to tedy pro ně bezezbytku.)

V reálném světě se i silné přesvědčení o vhodnosti spolupráce snadno rozdrolí pod tíhou zjištění, že spolupráce může vést i k velkému prodělku. Na druhé straně člověk, který "omylem" podrazil zjistí, že tak vydělal víc. Zde je přesvědčení v přímém rozporu s logikou věci, tedy maximalizovat svůj zisk.

Vsuvka: I když je to pro levicové blouznivce a pro sedmnáctileté studenty jistě hrozná představa, je lidské chování dáno především přírodou, která velí: Zachovat druh! Tento imperativ znamená "minimalizovat ztráty" a "maximalizovat zisk" (což není totéž jinými slovy). Zároveň má svou roli i Kantův kategorický imperativ, který dokáže sladit egoistické cíle s altruistickým přístupem. V ideálním případě je člověku jasné, že budou-li všichni kavky, tak se jemu vyplatí být podrazák. Jenže taky ví, že stejnou úvahou si projdou všichni, takže budou všichni podrazáci, a jejich zisk bude menší. Pokud tedy stejnou úvahou projdou všichni, tak jim musí být tohle jasné. A protože jsou všichni řízeni egoistickým příkazem "maximalizovat zisk", tak – logicky – musí zvolit spolupráci. Jenže chování lidí není čistě logické.

Opustili jsme hippie komunitu ve chvíli, kdy někteří začali zjišťovat, že byli podraženi a jiní zjistili, že podrazit se vyplatilo. Ti podražení přemýšlí, zda to mají zapotřebí, a postupem času dochází k algoritmům z rodiny TFT (to ti "lepší"), popřípadě k modelu "podrazák" (ti horší). V případě otevřené komunity není potřeba ani ničeho takového, tam přijde podrazák zvenčí, protože si spočítá, že takový zisk mu jinde nekápne.

Komunita se tedy dostane do stavu, kdy je buď paralyzována podrazákem zvenčí, nebo z vlastních řad, což je z jejího hlediska prašť jako uhoď. Pokud bude dále lpět na svém původním přesvědčení, stane se zlatým dolem pro podrazáka a nakonec nejspíš – vyčerpána – zahyne. Chce-li přežít, musí se bránit. Musí porušit své vstřícné a milé přesvědčení a musí oplatit stejným. (V otevřených internetových komunitách není možno se podrazáka zbavit, vyhodit jej, "přestat s ním interagovat". Je nutno s ním hrát tak, aby se mu jeho podrazácké chování přestalo vyplácet.) Komunita se tedy v rámci zachování začne měnit z komunity kavek na komunitu TFT (stále sleduje, jak si jistě všímáte, egoistický cíl "maximalizovat vlastní zisk", a přitom se chová altruisticky).

V mé simulaci je takovým přechodovým stavem např. stav 1 podrazák, 3 TFT, 4 kavky. Podrazákovy zisky jsou nejvyšší (přes 10000), naopak kavky tratí (okolo 4800), TFT si udržují stále vysoké zisky (7000). Logický je tedy tlak na kavky, aby se začaly chovat také jako TFT, protože vysoké zisky podrazáka jsou umožněny především přítomností kavek. Přeměna jen dvou kavek na TFT sníží zisk podrazáka pod úroveň zisků TFT, přeměna další kavky na TFT srazí zisky podrazáka na nejnižší úroveň ze všech zúčastněných, jeho chování se mu přestane vyplácet a (opět egoistický cíl, tentokrát podrazákův) společnost opustí nebo své chování změní, což je žádoucí. Zde je zajímavý okamžik – pokud se změní na TFT, tak poslední a jediná kavka má rázem nejvyšší zisky (protože nemůže padnout do pasti vzájemných podrazů jako TFT).

Pokud se ve fázi "vyhánění podrazáka" mění kavky na "měkčí" TF2T, jsou jejich zisky nižší než kdyby se měnily na "tvrdé" TFT a nepodaří se jim snížit podrazákovy zisky na minimum, pokud bude mezi nimi zůstávat alespoň jedna kavka – podrazák získá "o kousek víc" než kavka, právě kvůli úvodnímu "kroku spolupráce navíc", který má TF2T na rozdíl od TFT. To, že TF2T váhá s odvetou, způsobí, že se podrazákovi jeho strategie vyplatí. Pokud se však naprosto všichni důsledně drží TF2T strategie, dokáží podrazáka vyhnat (=snížit mu zisky, čímž jej donutí, aby své chování změnil).

Společenství TF2T algoritmů je stejně výkonné jako společenství čistých kavek, odolává podrazákům stejně jako TFT algoritmy a není náchylné k řetězu vzájemných podrazů. Je to snad cesta, jak uchránit komunity před napadením podrazáky?

Ano, byla by, kdyby... :)

TF2T společenství potřebuje, aby naprostá většina jeho členů dodržovala tento model. Bez výhrad. Aby všichni věděli, že na druhý podraz se musí (MUSÍ!) odpovědět stejně. A v tom je právě problém společenství pravdy a lásky, intelektuálního relativismu a dnešní doby vůbec.

Stačí pár lidí (v mé simulaci jeden jediný), kteří na tento model vnitřně nepřistoupí, kteří budou tvrdit, že třeba ostatní jen špatně chápou podrazákovy kroky (vliv rušení), že je potřeba odpouštět, že je potřeba o věci diskutovat, že ostatní nemají právo na podraz odpovídat podrazem, protože tak sami klesají na úroveň podrazáků...

Jejich váhání s odplatou tak paradoxně pomáhá podrazákovi udržovat jeho model chování – stále ještě má dost vysoké zisky, takže se svého modelu chování nemusí vzdát. Nejnižší zisky totiž mají veškrnící kavky, ty jsou těmi, kdo umožňují podrazákům chovat se dál podrazácky. Společenství se tedy musí, zdánlivě paradoxně, nejprve zbavit "humanistických" (spíš pseudohumanistických) kavek, aby donutila podrazáka změnit jeho chování.

Z modelu tedy vyplývá, že nejstabilnější společenství je společenství TF2T algoritmů, které je spolupracující, odolné proti rušení a málo lákavé pro podrazáky. Pokud je takové společenství podrazákem napadeno, odolává a podrazákovi se jeho chování nevyplácí. Což ovšem neplatí v případě, že jsou ve společenství nějaké čisté kavky, protože podrazák na nich může celkem úspěšně parazitovat.

Což podezřele přesně koresponduje s realitou vztahů mezilidských, vztahů mezi státy, vztahů na pracovištích... Já vím, je to jen matematický model. :)

 

Na závěr zkusím navrhnout některé další algoritmy chování.

Nejprve dva algoritmy, které doplňují škálu mezi Kavkou, Rozmarem a Podrazákem. Tyto algoritmy se při svém rozhodování neřídí podle předchozích kroků.

Špatný je algoritmus, který se rozhoduje náhodně a ve třech případech ze čtyř podrazí. Jeho protipólem je Dobrý.
Dobrý je algoritmus, který se stejně jako Špatný rozhoduje náhodně, ovšem podrazí jen v jednom případě ze čtyř.

Další algoritmy jsou dvě modifikace algoritmu Pavlov. Pavlov se rozhoduje podle předchozí hry. Pokud soupeř spolupracoval, zopakuje svůj postup z předchozího kroku (znovu spolupracuje/podrazí). Pokud soupeř podrazil, Pavlov změní svůj postup (pokud spolupracoval, teď podrazí, pokud podrazil, teď spolupracuje). Pavlova jsem rozdělil na dva modely:

Velký pes si je sebejistý, proto začíná spoluprací
Malý pes nejprve zaštěká, protože je nejistý. Malý pes tak začíná podrazem.

Následuje algoritmus modifikující původní TFT algoritmus:

TFTp (TFT with pardon) je algoritmus, který umí odpustit, tedy místo podrazu někdy zvolí spolupráci. Tím se snaží vybřednout z pasti vzájemných podrazů, do kterých padají čisté TFT. Otázka je KDY zvolí spolupráci. Ideální mi připadá, když zvolí spolupráci místo podrazu tehdy, udělal-li dva podrazy za sebou a soupeř přitom v prvním kroku začal spoluprací.

Napadají vás další možné algoritmy? Popište je v komentářích, doplním je do simulace a můžeme je nechat proti sobě soutěžit. :)

Dne 1.10.2006

Twittni

Přidej do: asdf.sk StumbleUpon Toolbar Stumble It!

Komentáře