Vězení se mění...

Jak se vyvíjí chování společenství, pokud všichni sledují egoistické cíle? Jak se jaké společenství brání zlu? Funguje samočištění? A konečně odpověď na hlavní otázku: Jak se tedy chovat, pokud chceme být slušní, ale nechceme být za voly?

Článek navazuje na články Komunity a vězení a Útěk z vězení .

Především děkuji člověku, co se podepsal "johno" za inspiraci k nové simulaci a tím i k tomuto článku.

Minule jsme si představili další algoritmy, simulovat si je můžete v "Simulátoru 2 ". Tyto algoritmy tvoří naše startovní pole, tak si je ještě jednou představíme, seřazené podle "míry podrazovosti":

1. Kavka. Algoritmus, který nikdy nepodrazí, jedině když dojde k nějakému šumu, tak je jeho krok vnímán jako podraz. (Beránčí algoritmus)
2. TF2T. Algoritmus který začíná spoluprací a podrazí jen tehdy, když byl dvakrát za sebou podražen.
3. Velký pes. Algoritmus který začne spoluprací. Pokud v minulé hře oba spolupracovali, spolupracuje dál, pokud byl podražen, podrazí. Pokud v minulé hře podrazil a podraz se mu vyplatil (=soupeř spolupracoval), bude dál podrážet. Pokud podráží oba, nabídne spolupráci. (Pragmatický algoritmus)
4. TFT. Algoritmus začne spoluprací a pak opakuje poslední krok soupeře – podrazí za podraz, spolupracuje při spolupráci. (Čistící algoritmus)
5. Dobrý. Algoritmus se rozhoduje náhodně. Spolupracuje, ale v jednom případu ze čtyř podrazí.
6. Malý pes. Chová se stejně jako velký pes, ale začíná podrazem.
7. Špatný. Rozhoduje se náhodně, většinou podrazí, v jednom ze čtyř případů spolupracuje.
8. Podrazák. Vždy podrazí.

Tyto algoritmy tedy spolu zápasí podle principů, které jsem popsal v minulých článcích. Sehrají spolu deset her, prvních devět má 20-30 kol, poslední dorovnává počet kol na 280 (z hlediska pravidel je to jedno, algoritmy nevědí kolik kol která hra má; dorovnání je jen kvůli snazšímu porovnávání her). Po deseti hrách je vyhodnocen zisk jednotlivých hráčů a ten, jehož zisk byl nejnižší, mutuje.

Mutace probíhá dle jednoduchých pravidel: V polovině případů se algoritmus změní tak, že převezme algoritmus nejúspěšnějšího hráče.
V druhé polovině případů se změní o jeden či dva kroky v "posloupnosti algoritmů" směrem k algoritmu výherce, tedy "horším" či "lepším" směrem. Pokud výherce i poražený používají stejný algoritmus, změní se poražený o jeden či dva kroky náhodným směrem. Posun je většinou o jeden krok, v jednom případě ze čtyř o dva.

Mutační algoritmus sleduje tím nejprostším způsobem egoistický cíl, tedy maximalizaci vlastního zisku, a zároveň simuluje jednak naprosté "bezzásadové" změny ("Kašlu na to, budu to dělat jako ten co vyhrál"), ale i povlovné posuny "o kousek", kdy se hráč snaží své chování změnit co nejmíň, aby "neslevil ze zásad", aby "se nezpronevěřil" či aby si "moc nezadal".


Aplikací této jednoduché logiky vznikl dynamický simulátor. Můžete určit složení skupiny a klikáním na tlačítko Hra spouštět další a další generace. Můžete sledovat, jak algoritmy mutují a pomocí listboxů můžete simulovat např. napadení Podrazáky či velké mutace několika jedinců. Můžete také sledovat, jaké jsou zisky jednotlivých algoritmů, kdo kolikrát podrazil, jaké jsou průměrné zisky na 1000 kol, kolikrát jaký algoritmus během 1000 kol podrazí či jaký má který algoritmus z podrazu zisk.

Hrál jsem si s ním několik večerů a dospěl jsem k několika zajímavým zjištěním.

Nejprve jsem zkoušel, nakolik je stabilní homogenní prostředí, tedy takové, kdy všichni hráči používají stejný vzorec chování. Nepřekvapilo, že společenství samých podrazáků je velmi stabilní. Jakoukoli mutaci směrem k "dobru" okamžitě využije a donutí jejího nositele, aby se stal taky podrazákem. Takové společenství dokáže narušit jen několik "čistících algoritmů"

Nepřekvapuje ani to, že společenství čistých kavek není nikterak stabilní. Za čas se v takovém společenství vlivem mutace objeví TF2T či Velcí psi, získají převahu a donutí kavky zmutovat.

TF2T je poměrně stabilní společenství, ale za čas přemutuje do společenství Velkých psů.

Skupina Velkých psů je evolučně úspěšná a tvoří druhou velmi stabilní skupinu. Menší či větší mutace jednoho či dvou členů celkem bez potíží zvládne. Zároveň má mezi všemi algoritmy nejvyšší zisk na krok hry.

TFT je algoritmus velmi zvláštní tím, že má tendenci mutovat "k lepšímu". Společenství není v čase stabilní a mutacemi se dopracuje nakonec na společenství Velkých psů. Spolu s TFT mohou dobře koexistovat TF2T. Ale tato koexistence netrvá dlouho a nakonec se drobnými mutacemi rozšíří Velký pes.

Samí Dobří mohou zmutovat přes TFT na Velké psy. Pokud ovšem některý zmutuje na Špatného, společenství se po několik generací propadá hlouběji a hlouběji a končí jako samí podrazáci.

Malí psi jsou rovněž relativně stabilní a odolní, pokud ovšem mutací nevznikne jeden podrazák. Ten se téměř okamžitě rozšíří a zaplní celé společenství.

Špatní během několika málo generací přejdou v samé Podrazáky.


Z hlediska stability jsou tedy dvě stabilní populace – samí Podrazáci nebo samí Velcí psi. Společenství podrazáků je dostatečně známé i z reality, společenství Velkých psů se vyznačuje tím, že jsou "v jádru dobří", ale pokud jim projde podraz, budou podrážet dál, dokud to pro ně bude výhodné. Proto jsem Velkého psa nazval též "Pragmatickým algoritmem".

Při testování proběhlo několik milionů kol a nakonec vykrystalizovalo pořadí algoritmů podle ziskovosti. Nejziskovější je Velký pes (cca 5000), následován těsně TF2T, pak TFT (oba cca 4500) a s dalším odstupem jsou Kavky (3000). Následuje Malý pes, Podrazák, Dobrý a Špatný. Pořadí podle toho, jak se "vyplatí" podraz, vedou kavky (ovšem hypoteticky, protože ty nikdy nepodrazí a takové zisky mohou mít jen díky neúmyslným podrazům, vznikajícím vlivem rušení a šumů). Po kavkách se s velkým náskokem před jinými vyplácí podraz Velkým psům. Pak zhruba stejně přináší podraz TFTa TF2T, s odstupem následuje Malý pes. Za Malým psem jsou Dobří, Podrazáci a nakonec Špatní – těm se podraz vyplatí ještě míň než Podrazákům... Důsledné podrážení se tedy vyplatí víc než podrážení s občasnou snahou o spolupráci. :)

Následně jsem zkoušel odolnost skupin proti "napadení zlem" – tedy proti objevení "špatných" algoritmů. Zde je už tolik možných kombinací, že popíšu jen několik zajímavostí:

Skupina kavek napadená podrazákem zmutuje na TF2T algoritmy, které dokáží nad podrazáky vyhrát. Následuje několik generací TFT/TF2T společenství a vývoj se ustálí na Velkých psech.

Skupina Velkých psů, napadena jedním, dvěma či třemi podrazáky útok ustojí – zmutuje na TFT algoritmy, které podrazáky vyženou a za čas se vrátí opět na Velké psy. Velcí psi ovšem neustojí útok Malých psů, kteří používají stejný postup jako ti Velcí, ale je na jejich straně výhoda onoho prvního kroku, kdy oni podrazí a Velcí spolupracují. Jsou tedy v takovémto souboji o trochu ziskovější, a to stačí k tomu, aby se rozšířili.

"Psí" algoritmy mají tu výhodu, že pokud nevyhrávají, tak často ani neprohrávají. Mohou tak relativně dobře přežít v cizích společenstvích (s výjimkou samých podrazáků či špatných) a využít toho, že mutují ostatní. Jakmile mutacemi vznikne většina Psů, tak se bleskurychle rozšíří po celé skupině.

TFT algoritmy jsem nazval "čistícími". Jediné dokáží odolat útoku Špatných, Dobrých i Podrazáků, zastavit jejich šíření a konsolidovat skupinu. Pokud opravdu důsledně sledují egoistický cíl "maximálního zisku", zmutují nakonec na pragmatické Velké psy, kteří nejsou tak náchylní k "šumovým" podrazům. Tím se výkon společenství opět dostane na nejvyšší reálné hodnoty.

Zajímavé je, že TFT nedokáže čistit, vyskytne-li se mezi nimi jedna jediná ortodoxní kavka, která odmítá spolupracovat na společném cíli "ochrany společenství". Taková kavka se totiž stane okamžitě nejméně výnosným členem, ale protože odmítá mutovat, tak společenství nic nenutí k tomu, aby se měnilo. Bohužel takový status quo ale není pro zbytek skupiny výhodný – při kombinaci 6 TFT + 2 Podrazáci si TFT udržují zisky na téměř 7000 a nutí podrazáky zmutovat. Když se objeví ortodoxní kavka, tak toto nucení zeslábne, protože zisky podrazáků vzrostou na dvojnásobek a zisky TFT mírně poklesnou. Ortodoxní kavka tak nejenom brání vyčištění společenství tím, že se odmítá změnit, ale zároveň zvyšuje zisky podrazákům a tím zmenšuje tlak na změnu jejich chování.

Lze tedy říct, že samočištění funguje tehdy, pokud všichni důsledně sledují egoistický cíl maximalizace zisku. Sledování tohoto cíle totiž vede ke kooperaci a efektivnímu zničení škodiče. Ortodoxní pacifisté pomáhají paradoxně škůdci přežít a tak svým postojem škodí možná víc. (Paralely jistě najdete sami... Nejsme jako oni, že...)

Skupina podrazáků odolává jakýmkoli samovolným mutacím. Jediný způsob, jak ji proměnit, je nasadit do ní několik TFT. Ty jsou velmi tvrdé a svou drobnou ztrátu z prvního kroku spolupráce s podrazáckým okolím si dokáží vynahradit spoluprací s ostatními TFT. V simulaci leckdy stačilo vsadit mezi podrazáky dva TFT, které dokázaly přežít a díky mutacím "na vítěze" se nakonec pomalu rozšířily a převládly. Vyčistily tak společenství a pomalu se proměnily v efektivnější Velké psy.

Simulátor máte k dispozici, můžete si, pokud vás to baví, simulovat z plna hrdla a sledovat, jak se ty neživé algoritmy chovají docela inteligentně a racionálně... :)

A to i když jsou pravidla velmi prostá a zjednodušená...


Závěr je možná radostnější, než by se z předchozích dílů zdálo:

1. Existuje vzorec chování, které odpovídá Kantovu imperativu (tedy mohou se tak chovat všichni), a společenství, která se jím řídí, jsou stabilní (nepodléhají příliš drobným mutacím a excesům) a jsou odolná (dokáží se vypořádat s napadením příživnickými algoritmy). Takové společenství zároveň zajišťuje maximální možný dlouhodobý zisk pro všechny své členy.

2. Důsledné sledování egoistického cíle (maximálního zisku) nakonec často vede k vytvoření stabilního společenství nejefektivnějších algoritmů a k altruistickému výsledku – tedy nejvyššímu reálnému zisku pro všechny.

3. Absolutní dobro, nenásilí a spolupráce jsou výhodné pouze v nerušených uzavřených společenstvích bez mutací a šumů. V "reálných" společenstvích je výhodnější chování pragmatické, zde naopak ortodoxně mírumilovní představují vysoké riziko pro bezpečí a stabilitu společenství v případě napadení.

4. Zlo nemusí nakonec vždy zvítězit. Může být poraženo. Ovšem nejde to jinak, než být na zlého zlý a na hodného hodný. Nestačí být "jen hodný".


Na závěr miniseriálu bych rád poděkoval diskutujícím a komentátorům za jejich podnětné připomínky, nápady, návrhy a komentáře, byl jsem úrovní diskuse velmi příjemně překvapen.

Předpokládám, že se v budoucnu přihlásím ještě s jedním "vězeňským" článkem a simulátorem, kde nechám bojovat další Vámi navržené algoritmy. Teď děkuji všem čtenářům za pozornost a trpělivost s ne zrovna jednoduchými články a budu se těšit na vaše závěry, úvahy a aplikace.

Příště bych rád zareagoval na Pixyho článek o samočištění... Mám totiž dojem, že přílišná důvěra v skupinové samočistící mechanismy není na místě, protože ani samočistící mechanismy často nepočítají s některými vlastnostmi lidské psychiky...

Dne 4.10.2006

Twittni

Přidej do: asdf.sk StumbleUpon Toolbar Stumble It!

Komentáře

[1] (Mirek - WWW) 11.12.2007, 07:56:21 [X] [D]
To je moc zajímavé ... jen si říkám, na kolik je možné výsledky simulace vztahovat k realitě. myslím, že moc ne, protože simulátor i jednotlivé algoritmy nereflektují některé, možná podstatné vlastnosti reálných lidí:

1) na každý má jako svůj cíl maximalizaci zisku. Každý má jistou úroveň, kterou pokládá za dostatečný zisk a nad ní už není tak ochotný k mutacím, které by narážely na jeho přesvědčení, morálku, víru atd.

2) jestli jsem to dobře pochopil, tak simulace předpokládá izolované konfrontace vždy právě mezi dvěma jedinci bez jiných vazeb na ostatní, než je osobní zkušenost z této a předchozích konfrontací. Předpokládá se, že každý jedinec má už předem určený typ chování v této konfrontaci, bez ohledu na soupeře. Jediné co chování jedince ovlivňuje, je jeho minulá zkušenost a pak "povaha", která mu umožňuje zkušenost přetvořit různým způsobem do nového vzorce chování. V reálu:

2.a) nedochází jen k duálním konfrontacím ... často jde o skupinový střet a ve rámci skupiny nejsou každý proti každému, ale existují zde také koalice, takže jedinec bojuje za sebe i za koalici

2.b) každý jedinec má k dispozici více vzorců chování, které v danou chvíli může uplatnit - vybere si podle nějakého kritéria - např. podle pověsti, kterou má u něj protivník (na hrubý pytel hrubá záplata) - pověst může vyplývat z osobní zkušenosti a také z informací, které ve skupině kolují. I ve vztahu ke zpracování informací a zkušenosti se dají nadefinovat různé algoritmy.

2.c) ve skupině je najednou rozehráno několik různých her o různé statky (zde se hraje stále jen o jeden) ... různé statky jsou pro různé jedince různě důležité, takže např. když jde o peníze neznám bratra a v otázce kdo najde více borůvek v lese klidně prohraju a naopak. Každý jedinec má omezené množství energie, které musí distribuovat na boje na různých frontách - každý jedinec má různě velké množství energie

2.d) jedinci nebojují jen sami za sebe, ale bývají členy jedné či více zájmových skupin - často bojuje jedinec proti skupině

3) Problém samočištění jakoby předpokládal, že existuje nějaký stabilní ideál, který se nám pořád špiní a je nutné se od té špíny očišťovat. Hm, co když to je trochu jinak? Co když jde jen o tzv. sedlové body (oblasti) - viz teorie her. A vúbec, co když pro společenství není důležitá stabilní situace, ale neustálá dynamika - změna statusu quo?

[2] (vosel ) 04.07.2008, 23:46:14 [X] [D]
Jsou tam chyby:
1. TFT2 nemá mezi kavkami výhodu.
2. Pokud se k samým tft a dvoum podrazákům přidá kavka, tak se zvýší zisk i tft. (nedostanou se s kavkou do smyčky) Tratí jen kavka.
3. Nezdá se mi že by samí velcí psi byli výkonnější než samé kavky a tft2. Pokud se u dvou velkých psů vyskytne náhodně podraz, tak každý jednou získá maximum, jednou nic a jednou jako dva podrazáci.
1. psi A i B spolupracují
2. oba spolupracují, ale je šum, tedy pes A vnímá podraz a změní strategii.
3. A podrazí, B spolupracuje. B mění strategii.
4. A podrazí, B podrazí, oba se vrací do spolupráce.

Tedy šum vyvolá 4 ztráty, kdežto u kavek a tft2 vyvolá jen jednu. Tedy samí psi by na tom měli být o něco málo hůř než samí tft2 nebo samé kavky.

[3] (vosel ) 04.07.2008, 23:52:58 [X] [D]
1. I když vlastně má, ale minimální. Pokud je dvakrát za sebou šum, tak podrazí nazpátek.

[4] (Arthur Dent [openID] - Mail - WWW) 05.07.2008, 00:26:28 [X] [D]
[2] Pokud chcete křičet "chyba", tak:

- ocitujte tvrzení, s nímž polemizujete
- předložte důkazy, že tvrzení je nesprávné
- v důkazech vyjděte ze stejných materiálů jako já, tedy ze simulace chování, nikoli ze svých "zdání" (viz bod 3)

[5] (vosel ) 06.07.2008, 01:29:06 [X] [D]
No tak snad víte co píšete, ale no dobře:
(1. jsem už odvolal)
2. "Když se objeví ortodoxní kavka, tak toto nucení zeslábne, protože zisky podrazáků vzrostou na dvojnásobek a zisky TFT mírně poklesnou."
3. "Skupina Velkých psů je evolučně úspěšná a tvoří druhou velmi stabilní skupinu. Menší či větší mutace jednoho či dvou členů celkem bez potíží zvládne. Zároveň má mezi všemi algoritmy nejvyšší zisk na krok hry."

Důkazy jsem předložil hned. Pokud s nimi nesouhlasíte tak je vyvraťte.

Bod 3 potvrzuje jednoznačne simulátor v článku, pro bod 2. by bylo zapotřebí víc her, vychází tam moc velký odchylky a zapisovat a počíta průměry se mi nechce. Vy máte možnost to jednoduše upravit tak aby to počítalo dýl, tak to zkuste.

[6] (vosel ) 06.07.2008, 01:36:47 [X] [D]
Stačí zvýšit riziko a kladný vliv kavky je jasně vidět.

[7] (Arthur Dent [openID] - Mail - WWW) 06.07.2008, 01:56:56 [X] [D]
[5] OK, takže zbývají dva body:

2. Pokud vzroste riziko šumu, tak je TFT v podstatě podrazák s "prvním krokem dobrým". Taková simulace za A) nemá moc smysl, protože by degradovala TFT na podrazáky a Psy na "náhodné", za B) neodpovídá příliš realitě. V dynamickém rozboru jsem uvažoval pro všechny sehrávky riziko stejné, nesledoval jsem vliv změny úrovně šumu.

3. Je mi líto. Ze všech simulací všech sehrávek a různých kombinací populace a jejich změn mi vyšel Velký pes jako algoritmus s průměrným nejvyšším ziskem, jak píšu. Problém je v tom, že vy asi uvažujete homogenní společenství (tam by nejspíš platilo vaše zdání), já jsem vycházel z heterogenních, navíc dynamicky se měnících společenství.

Vy jste nepředložil důkazy, přišel jste s domněnkami a uvedl jste je tvrzením "jsou tam chyby". Já nebudu vaše zdání vyvracet. Vy nesouhlasíte, vy vyvraťte.

[8] (vosel ) 06.07.2008, 02:34:10 [X] [D]
2. Není, stačí 1/50. Pokud se nesmíříte s ničím míň než 1/400 tak holt budete muset zkusit delší simulaci

3. Ano, protože ta věta tak vyzní, že společenství samých velkých psů je lepší než společenství samých TFT2.

A ještě nový algoritmus:
Jako TFT, ale pokud v posledních dvou kolech kvůli náhodě podrazil přesto že neměl, tak spolupracuje.

[9] (vosel ) 06.07.2008, 02:44:41 [X] [D]
A nevím jak si představuejte abych to vyvrátil. Vždyť jsem to napsal naprosto jasně. TFT má proti sobě místo TFT kavku, ostatní se nemění, bude tam tedy výsledek v obou případech stejný, tedy ho můžeme zanedbat. TFT proti kavce má v průměru lepší výsledky než proti TFT - nehorozí zacyklení do vendetty. Proto se zisk TFT zvýší. Čím vyšší je riziko náhodného podrazu, tím víc kavka TFT přidá. Simulace to potvrzuje.

[10] (Arthur Dent [openID] - Mail - WWW) 06.07.2008, 02:52:59 [X] [D]
[8]
2. Co není? Na druhou stranu je jedno, jestli zisk TFT mírně poklesne nebo naroste kvůli kavce, závěr ("nucení ke změně slábne") platí i tak, protože podrazáci nejsou ti s nejnižšími zisky a jejich zisky se vyrovnávají zisku TFT.

3. Ta věta je jasně zasazena do kontextu dynamicky se měnícího společenství ("ustojí mutce členů"), takže vyznívá zcela jednoznačně. O "lepším" v ní nepadlo ani slovo, to je vaše interpretace. Statická společenství jsem probíral v minulém článku, tento článek je o dynamických společenstvích, a u nich to platí takto. Od boku střelím zdůvodněníí: TF2T tratily při "čištění" společenství od zmetků. Navíc když nechám hrát TF2T proti Psům, mají Psi v průměru o kousek větší výkon. Viz http://www.maly.cz...mp;hrajese=Hra

Co přesně znamená "podrazil přestože neměl"? Jak zjistí, že "neměl podrazit"? Algoritmus nemá šanci se dozvědět, jestli byla komunikace zašuměná nebo ne.

[11] (Arthur Dent [openID] - Mail - WWW) 06.07.2008, 02:56:43 [X] [D]
[9] Napsal jste to sice jasně, ale tvrzení jste tím nevyvrátil. I při zašumění 1/40 stále platí: přítomnost kavky znamená, že podrazáky nic nenutí mutovat. Polemizujte prosím s celým tvrzením.

[12] (vosel ) 06.07.2008, 03:02:54 [X] [D]
Předpokládal jsem že informace o tom jak proběhlo předchozí kolo jsou ze zisku. Tak přece pozná že získal víc než by měl.

Já nepolemizuju s tím že podrazáky nic nenutí mutovat, já polemizuju s tím, že TFT kavka sníží zisk!

[13] (Arthur Dent [openID] - Mail - WWW) 06.07.2008, 03:42:20 [X] [D]
[12] Nerozumíme si nebo vám něco uniká. Jak by mohl vědět, kolik "má" získat?

Polemizujete hezky, ale bohužel: V prostředí, které jsem v pokusech používal (a které je zde popsáno a které po mně ověřilo několik desítek lidí) zisky TFT kvůli kavce klesly. Ohrazuji se tedy proti tvrzení o chybě. Za daných podmínek se stalo tak, jak píšu. Chyba by to byla, pokud by vám za stejných podmínek vyšel jiný výsledek. Vyšel snad?

Můžete oponovat tím, že v jiných podmínkách (větší rušení) neklesnou, ale mírně stoupnou. To uznávám. Na druhou stranu je vyvozený závěr i tak správný a na celkovém vyznění to nic nemění. Pro závěr je totiž důležitá druhá část pozorování (tj. to, že podrazáci v takové situaci nejsou nejméně výkonní) a to, na co jste se upřel, je pro výsledek nepodstatné.

To, co předvádíte, se nazývá "bazírování na nepodstatném detailu". Ale že se na něm točíte hezky! :)

[14] (vosel ) 06.07.2008, 04:20:25 [X] [D]
Jak tedy pozná jestli spolupracoval nebo podrazil soupeř? Ale no dobře, tak je to teoretický příklad, no.

Jaký je tedy zisk při situacích podraz podraz, spolupráce spolupráce a spolupráce podraz? Mě vychází že bez náhody se pro tft přidáním kavky situace nezmění a pokud náhoda je tak se pro tft situace zlepší.

[15] (Arthur Dent [openID] - Mail - WWW) 06.07.2008, 20:21:39 [X] [D]
[14] Smutná je diskuse s lidmi, kteří nedokážou pregnantně formulovat své myšlenky. Chtěl jste napsat "pokud byla spolupráce dvakrát po sobě vnímána soupeřem vlivem rušení jako podraz"?

Algoritmus nepozná, jestli soupeř spolupracoval nebo podrazil. Vidí jen, jak se mu jeho krok jevil a nedokáže posoudit, jestli soupeř opravdu udělal to či ono nebo jestli do hry vstoupilo rušení. Algoritmus totiž, stejně jako v reálném životě, neví, kolik "má" získat. Zkrátka hraje (ani neví, kolik kol hra má) a na konci se dozví celkovou bilanci. Nemá tak šanci zjistit, jestli v konkrétním kroku byla komunikace zašuměná.

[16] (vosel ) 07.07.2008, 11:32:11 [X] [D]
Nechtěl, chtěl jsem napsat co jsem napsal, že když krok vyjde jako podraz z jeho strany, přestože spolupracoval, tak bude dvě další kola spolupracovat.

Ptal jsem se jak tedy třeba tft pozná jestli soupeř podrazil nebo jestli spolupracoval, když neví kolik mu krok přinesl. Bez toho by přece nemohl vůbec fungovat.

A ještě by mě tedy zajímalo kolik kdo dostane (spolupráce/spolupráce, spolupráce/podraz, podraz/podraz) Už se vás ptali jiní a taky jste neodpověděl. Nechápu proč to tajíte. Jak to potom mají ostatní ověřit? Nebo to se to v každém kroku volí náhodně?

Samozřejmě že neví jak dlouho se bude hrát, ale to je proto aby poslední kolo nepodrazil.

[17] (Arthur Dent [openID] - Mail - WWW) 07.07.2008, 16:38:25 [X] [D]
[16] Aha. Platí totéž: Algoritmus neví, jak jeho krok vnímal protihráč, tyhle informace nemá a nemá možnost je získat, viz [15].

Algoritmus ví, jak jeho soupeř reagoval (lépe řečeno "nějak jeho krok vnímá"), ale neví, kolik mu krok přinesl. Je to tak těžké k pochopení? Algoritmus se svůj průběžný zisk nedozví. Není to potřeba, není to ani vhodné a bylo by to proti smyslu celé simulace.

Kolik kdo dostane při jednotlivých kombinacích - tyhle informace nejsou tajné, ale jestli jste si všiml, tak:

1. tyhle články jsou téměř dva roky staré, takže si čísla nepamatuju, musel bych se dívat do zdrojových kódů.
2. doteď jsem s vámi komunikoval v noci a opravdu se mi nechtělo vstát a běžet zkoumat zdrojové kódy
3. přes den jsem si na to nevzpomněl, pracuju a mám v hlavě jiné starosti než se koukat do zdrojáku

"Nechápu proč to tajíte." Protože to je strategická informace podléhající vojenskému tajemství asi, ne? ;)

"Samozřejmě že neví jak dlouho se bude hrát, ale to je proto aby poslední kolo nepodrazil." - jsem srdečně rád, že jste aspoň tohle pochopil.

PS: P = podraz, S = spolupráce

S + S - oba 5
P + P - oba 1
S + P - podrazák 10, spolupracant -10