Mým statistikům...

Ještě jedna DerrenBrownovka, ano? Tentokrát něco pro matematické mozky...

Představte si, že se objeví nebezpečná nemoc, a přestože postihne pouze jednoho z deseti tisíc lidí, je bez výjimky smrtelná. Děláte si starosti, a proto se rozhodnete podstoupit vyšetření, abyste věděli, zda jste zdraví. Lékař vám vysvětlí, že vyšetření na tuto chorobu je přesné na 99% bez ohledu na to, jestli chorobu máte nebo ne (jinými slovy řečeno, pozitivní i negativní výsledek bude správný v 99 případech ze sta). Rozhodnete se podstoupit vyšetření. lékař odebere vzorky a sdělí, že za týden přijdou výsledky.

O týden později máte ve schránce zprávu z laboratoře. Otevřete ji a přečtete si výsledek. Před očima máte odpověď, které jste se obávali: Výsledek je pozitivní. Vyšetření naznačuje, že máte smrtelnou chorobu. Jste zoufalí.

A máte k tomu důvod, nebo ne? 

Projděte si ještě jednou naznačený scénář a položte si otázku, která je na pohled velmi jednoduchá: Jaká je pravděpodobnost, že máte tuto chorobu? Odpovězte na tuto otázku. Nejste-li si jisti, zkuste výsledek odhadnout.

(A opět jako včera: Zkuste odpovědět v komentářích, svou odpověď zdůvodněte... Pokud "víte", tak si to nechte pro sebe a nekažte ostatním kouzlo přemýšlení. Příklad je ocitován z knihy Derrena Browna "Magie a manipulace mysli", vydalo Argo v roce 2007 – kapitola Myšlenkové pasti.)

Dne 5.12.2007

Twittni

Přidej do: asdf.sk StumbleUpon Toolbar Stumble It!

Komentáře

[1] (Katoga - WWW) 05.12.2007, 14:14:06 [X] [D]
napadá mne, že bude neporovnatelně pravděpodobnější to, že někdo z těch 9'999 lidí z mý desetitisícovky "využil" to svý jedno procento na omyl a chorobnej je on
jinými slovy - každej stej z těch, co dostali negativní nález (tudíž zaokrouhleně 100 lidí z nich), měl dostat ve skutečnosti pozitivní. ale už nevim jak to dát dohromady s tim, že je nemocnej jen jeden z 10k lidí...

závěr: můžu bejt v pohodě, s pravděpodobností limitně se blížící jistotě jsem zdravej

[2] (Stepan ) 05.12.2007, 14:28:14 [X] [D]
pravdepodobnost 1%, dalsich 99 lidi je rovnez "pozitivnich"

[3] (Kondr - Mail ) 05.12.2007, 14:40:56 [X] [D]
V době, kdy jsem si ještě myslel, že budu s to psát něco jako blog jsem o tom zkusil něco napsat :)

http://kondr.ic.cz...s=blog&t=4

Pro člověka, který není zvyklý v pravděpodobnosti chodit je to celkem překvapivé...

[4] (Ondra - WWW) 05.12.2007, 14:47:25 [X] [D]
Vezmu si ku pomoci rovný milion lidí, ať se mi to dobře počítá. Z milionu mám 100 nemocných a 999900 zdravých. Z těch 100 nemocných dostane 99 (správný) pozitivní výsledek z testu. Z těch zdravých dostane (špatný) pozitivní výsledek 9999 lidí. Takže máme 10098 pozitivních výsledků a z toho jen 99 skutečně nemocných. Takže pravděpodobnost že jsem nemocný je někde okolo 1%, řekl bych.

[5] (Vita Kubanek ) 05.12.2007, 15:09:05 [X] [D]
Pokud přijde výsledek testu pozitivní, tak si jim můžu být jistý na 98,99%. Vycházím z pravděpodobnosti chyby testu (1%) a pravděpodobnosti, že se chyba objeví právě u mě (0,01%). Už mě z toho bolí hlava, tak to nemůžu překontrolovat :o)

[6] (Vita Kubanek ) 05.12.2007, 15:11:17 [X] [D]
Ale blbost. Na 99,99%.

[7] (Ťapinka ) 05.12.2007, 15:47:08 [X] [D]
Jo, tak statistika mi ve škole nikdy nešla, tam se právě používají ta dlouhá slova. Ale jednoduchou úvahou docházím k závěru, že pravděpodobnost falešně pozitivniho výsledku je mnohem (100x?) vyšší, než pravděpodobnost onemocnění, takže bych byla v klidu.

[8] (zcr - WWW) 05.12.2007, 15:52:51 [X] [D]
Výsledek testu říká, že v okamžiku odběru osoba chorobou trpěla, a to se spolehlivostí 99 %. Pokud by byla tím šťastným "jedním ze sta", u nějž je choroba diagnostikována omylem testu, vyhráno nemá, protože během onoho týdenního čekání mohla onemocnět. Tedy pravděpodobnost, že chorobu má, je kousíček nad 99 %.

[9] (lummox ) 05.12.2007, 16:05:18 [X] [D]
Uvažoval bych takto: kolika lidem z 10 000 vyjde, že chorobu mají? To jsou jednak ti, co ji mají a vyšlo jim, že ji mají, tedy 1 x 0,99 = 0,99 případů z deseti tisíc, druhak ti, co ji nemají a vyšlo jim, že ji mají, tedy 9 999 x 0,01 = 99,99 případů z deseti tisíc. Dohromady nám tedy vyjde v deseti tisících lidí 100,98 pozitivních nálezů, ovšem chorobu má ze zadání pouze jeden z nich. Pravděpodobnost, že člověk s pozitivním nálezem chorobu skutečně má je tedy 1/100,98 čili zhruba 0,98%.

[10] (lummox ) 05.12.2007, 16:09:58 [X] [D]
ad [9] Ale abych tu ze sebe nedělal chytřejšího než jsem, tak musím připustit, že má první úvaha byla prostě vynásobit pravděpodobnosti toho, že mám chorobu a toho, že mi test vyšel správně, což mi vyšlo něco pod jednou desetinou promile. Až když jsem si zkusil vzít pokusnou skupinu lidí a rozepsat si, kdo co má a nemá a komu co vyšlo, mi došlo, že to mám blbě.

[11] (Jarda ) 05.12.2007, 16:13:47 [X] [D]
..kazdopadne neskodi sepsat posledni vuli a vubec se chovat jakoby nastal jeden z poslednich dnu vaseho zivota. Kdyz tak budete mit na co vzpominat... ;-)

[12] (spacák ) 05.12.2007, 16:42:29 [X] [D]
myslím, že mám důvod být dost zoufalý. napsali mi, že jsem pozitivní a vím, že pravděpodobnost, že se test mýlí je jen 1 %.

správné řešení, tedy přesnou pravděpodobnost, že jsem nemocný zatím nechci psát (ani s přesností jen na jedno desetinné číslo). kdyby to náhodou bylo správně. ;-)

[13] (Johnny - WWW) 05.12.2007, 16:54:49 [X] [D]
Nečetl jsem předchozí komentáře, takže možná budu někoho opakovat, ale moje úvaha je taková:

Jestliže mi přijde pozitivní výsledek, nemusí mě zajímat, kolik lidí z populace tu nemoc dostane, ale zajímá mě jen nakolik je ten výsledek přesný. Vzhledem k tomu, že je přesný na 99%, tak se bojím a to hodně, protože mám pravděpodobnost 99% že umřu.

I kdybych byl jediný na Zemi, kdo to může chytit nebo by to postihovalo skoro celou populaci, vždy záleží na přesnosti výsledku.

Nějaké matematické výpočty mají smysl PŘED tím, než si test nechám udělat - to pak kalkuluji s dvěma věcmi: 1)jestli mám nemoc a 2) pokud platí, že ano, tak na kolik je to přesně.

Protože nemoc postihuje menšinu populace, byl bych na začátku v klidu, protože mám malou šanci, že dostanu nemoc, bez ohledu na to, jak přesné jsou výsledky testů, které tu nemoc dokazují. A pak, když se stane nepředvídatelné a testy nemoc odhalí, zajímá mě už jen to, nakolik je to relevantní údaj a tady mám vysokou pravděpodobnost, že je to dobře.

[14] ( #13 - WWW) 05.12.2007, 17:01:10 [X] [D]
Podle mě je ta pravděpodobnost už zmíněných 99 %. Úspěšnost testu nemá s faktickou četností nemoci nic společného.

[15] ( #13 - WWW) 05.12.2007, 17:02:05 [X] [D]
Sakra, zas mě někdo předběh! :)

[16] (mike ) 05.12.2007, 17:33:10 [X] [D]
[13][14] Asi tak. Procitam zadani a komentare a marne premyslim, co se vlastne resi, kdyz je odpoved primo v zadani (v zavorce). No, nejsem dneska zrovna ve forme a mozna mi neco zasadniho unika.

[17] (Vita Kubanek ) 05.12.2007, 17:42:35 [X] [D]
[16] Pokud je má teorie správná, tak se řeší pravděpodobnost, kde se ta chyba nestane mně, ne kolik % testů není chybných.

[18] (Arthur Dent [openID] - Mail - WWW) 05.12.2007, 17:54:33 [X] [D]
Řeší se to, jestli má smysl být zoufalý - tedy jestli je s pozitivním výsledkem pravděpodobnější, že tu nemoc máte než že ji nemáte :)

[19] (Roj - WWW) 05.12.2007, 18:04:25 [X] [D]
Jsou to nezavisle jevy, takze prabdepodobnost, ze jsem nemocny je zhruba rovna podilu prabdepodobnosti, cili 0.01

[20] ( #13 - WWW) 05.12.2007, 18:12:37 [X] [D]
[19] Můžeš to nějak vysvětlit? Tu závislost? Proč je podle tebe úspěšnost testu závislá na četnosti choroby?

Závisí úspěšnost testu na AIDS na tom, kolik lidí už ho má? (Odhlédněme od toho, že se testovací metoda pořád vyvíjí.)

[21] (agathaXie - Mail - WWW) 05.12.2007, 18:31:02 [X] [D]
Pravděpodobnost, že tu chorobu skutečně mám je 99%, tj. rovna pravděpodobnosti, že test je provedený správně.(test je správný v 99 případech ze sta) Úspěšnost testu není nijak závislá na podílu nemocných ve společnosti ani na jejich počtu.

Pro ty co, tipují směšně malé pravděpodobnosti, jako 0,01 atp.: Jak vystvětlíte, že při superúspěšném testu (99%), tipujete pravděpodobnost choroby přesně naopak?

Zajímavá otázka: Kolik procent lidí je skutečně nemocných v populaci, jestliže se "nemocnost" testuje právě výše uvedeným testem?

[22] (Stepan ) 05.12.2007, 19:01:40 [X] [D]
myslite si, ze je stejne mit 99% sanci onemocnet z celkoveho poctu 100 lidi nebo z poctu 10 000 lid?

[23] (Tomík - Mail ) 05.12.2007, 19:04:31 [X] [D]
[21]: Směšně malé pravděpodobnosti si vysvětluji takto: pravděpodobnost, že se test splete, je u nemocných i zdravých stejná (1%). Ale protože zdravých je 9999x víc než nemocných, dělá u nich to 1% procento "falešných poplachů" (tedy nepovedených testů) mnohem víc než oněch 99% procent správně testovaných nemocných.

Konkrétně mi vychází pravděpodobnost 0,98% že jsem skutečně nemocen, mám-li pozitivní test (úvaha velmi podobná [4], [9] a dalším). Ta je sice mnohokrát vyšší, než pravděpodobnost nemocnosti při negativním testu (dle mého názoru zhruba 0,00000001%), přesto bych se neobával.

[24] (agathaXie - Mail - WWW) 05.12.2007, 19:04:33 [X] [D]
Tak jsem si to spočítal a vyšlo mi to přesně naopak, tj. nemoc mám v 1% případů. Vzhledem k tomu, že by řešení mělo být neintuitívní, tak je docela velká pravděpodobnost, že je správné a já jsem jelen:-)

[25] (Stepan ) 05.12.2007, 19:07:02 [X] [D]
to jsem spatne formuloval...uz na to s*ru :)

[26] (Alex - Mail - WWW) 05.12.2007, 19:08:53 [X] [D]
Docela bych se bál. Dle zadání je 99% pravděpodobnost úmrtí. :)

[27] ( #13 - WWW) 05.12.2007, 19:10:53 [X] [D]
[22] To si teda myslim.

[28] (Alex - Mail - WWW) 05.12.2007, 19:11:48 [X] [D]
[23] Nechal sis udělat test. Jsi nemocný. Test se mýlí v 1% případů. Tj. na 99% je správně. Umřeš. Bál bych se.

Proč by to mělo záležet na tom, jestli je nemocný tvůj soused a jeho milenka?

[29] (Stepan ) 05.12.2007, 19:18:03 [X] [D]
vime to jen na padesat procent, ale ze sta ucastniku jste mozna vyhral milion! A co kdyz reknou z 10 000 ucastniku? Kolik jich se mnou v obou pripadech jeste "souperi"?

[30] (Tomík - Mail ) 05.12.2007, 19:36:58 [X] [D]
[28]: Ale test se mýlí i v případě zdravých lidí, taktéž v 1% případů. Jedno procento ze zdravých je zhruba stokrát víc než 99% z nemocných, kterých je 9999x méně než zdravých. V podstatě opakuji to, co už jsem napsal předtím, doufám, že srozumitelněji.

[31] ( #13 - WWW) 05.12.2007, 19:38:16 [X] [D]
[29] Vypadá to, že chápete jinak (špatně) slovo pravděpodobnost.

[32] (Pan Filuta ) 05.12.2007, 20:20:20 [X] [D]
Tak nejprv jsem si říkal, že by se to mělo dát vyřešit matematicky, ale pak (asi za minutu) napadlo, že mně může být putna, jestli jsou ostatní nemocní nebo ne, proto je na 99 % výsledek správný. Pak jsem nad tím začal přemýšlet, dvakrát jsem změnil úhel pohledu a způsob řešení a pak se mi z mozku stala jahodová marmeláda. Tož tak.

[33] (mike ) 05.12.2007, 20:24:44 [X] [D]
Hmm, na druhou stranu... Kdyz si se mnou necha test udelat 10000 lidi, bude priblizne 100 pozitivnich vysledku. A z toho jeden skutecne nemocny. Pravdepodobnost, ze to budu zrovna ja, je tedy asi 1%. No nic, jdu radeji programovat, nejak mi to nemysli :)

[34] (matej ) 05.12.2007, 20:44:07 [X] [D]
ano, test se splete 100x (jednou ze sta v 10 000 tedy 100x)- uz nezalezi jestli v pozitivnich nebo negativnich nalezech. Jsem tedy jeden ze sta= 1%

[35] (Vycurat_Aspat - Mail ) 05.12.2007, 21:25:44 [X] [D]
99% ze 100 je to stejny jako 99% z 10 000 a 99% z 10 000 je 100 lidi.. Beru v uvahu, ze to ma 1 clovek z ticice, jsem mezi 100 lidma kterí to muzou mit.. moje sance je 1%

[36] (Vycurat_Aspat - Mail ) 05.12.2007, 21:27:13 [X] [D]
ehm 99% z 10 000 je samozrejme 9 900 ale pochopili ste to ;)

[37] (otaznik [openID] - WWW) 05.12.2007, 22:06:24 [X] [D]
Poté co jsem to dočetl, jsem předpokládal, že se dozvím ze zadání něco jako "..po nakažení nastává do 48 hodin smrt.." a tedy týdení čekání na výsledek by bylo poměrně jasnou odpovědí =) Myslím že člověk musí brát v úvahu informace, které se týkají danného jevu (jak bylo psáno v [8]).

[38] (Jan Červinka - Mail - WWW) 05.12.2007, 22:07:10 [X] [D]
Mám testovací metodu, jak zjistím její chybovost? Vezmu 100 zdravých lidí a otestuji je. Zjistím že jednoho z nich označil test chybně za nemocného. Vím tedy že je test na 99% úspěšný ale to rozhodně neznamená že ten jeden chybný je na 99% nemocný.

Teď to aplikuji na 10000 lidí z nichž vím že je 1 nemocný. Který? na 10000 lidí nadělá test 100 chyb a dost pravděpodobně k správně odhalí i toho nemocného - tj. přibližně 101 lidí označí za nemocné a 100 z toho jsou chyby - 1% že jsem nemocný.

Je to zjednodušené - neberu v úvahu že taky možná udělal chybu a vůbec toho nemocného neoznačil a tak..


Nerozumím ale jedné věci. Když test na vzorku 100 lidí udělá jen jedu chybu, tak mám 99% šanci že nejsem chyba a tudíž 99% šanci že můj výsledek je správně. Na tom co testuji by snad záležet nemělo, ne? Proč to neplatí? Prosím vysvětlete.

[39] (Laco - WWW) 05.12.2007, 22:23:14 [X] [D]
Že já sem přijdu vždycky těsně před spaním, kdy jsem unavenej jako pes a vůbec mi to nemyslí. Takhle se nezmůžu na nic jinýho než na toto:
-- Jak jeden z tisíce?
-- No, bylo tisíc chlapů, jeden z nich dal a zbylých 999 šlo domů, pak přišel další tisíc a zase jeden z nich dal

[40] (zcr - WWW) 05.12.2007, 22:29:15 [X] [D]
Jen tak do diskuze - řekněme, že mám generátor náhodných čísel, který generuje 0 a 1 se stejnou pravděpodobností. Udělám sto pokusů a on mi ten šmejd hodí osmdesát jedniček v řadě. To je asi vadný, ne? ;-)

[41] (Roj - WWW) 05.12.2007, 22:29:19 [X] [D]
[20] Jsou dve kriteria s dvojim vysledkem. Kdyz vezmeme vsssechny kombinace, dostavame se k poctu 4 stavu. Pak jen staci si spocitat prabdepodobny pocet lidi v kazdem ze 4 stavu. takle se resi vsechny podobne ulohy. Ja vim, je to makacka na bednu ;-)

1. Zdravi lide s negativnim vysledkem.
2. Zdarvi lide s positivnim vysledkem
3. Nemocni s positivnim vysledkem
4. Nemocni s negativnim vysledkem

A ted prichazi klicova veta: Do jedne s techto skupin MUSI kazdy prvek patrit. Zbytek je aritmetika :-)

[42] (Roj - WWW) 05.12.2007, 22:58:53 [X] [D]
[20] Nebucmutnej :-)

[0] Artie, da se ta kniha koupit nekde v mistnosti, kde ja jim dam na pult prachy a oni mi daji do ruky tu knihu? Nepouzivam Ceskou postu a platbu jinak, nez prachama na stul.

[43] (rinamon ) 05.12.2007, 23:19:32 [X] [D]
[42] ráda využívám kosmas.cz - mají knihu i obchod v Perlové 3 :)

[44] (ShadoW - Mail ) 05.12.2007, 23:21:59 [X] [D]
Když zkombinuju komentáře [41] a [4], vychází to nějak takhle:

1 000 000 lidí, z toho:

a) zdraví lidé s negativním výsledkem: 990 000
b) zdraví lidé s pozitivním výsledkem: 9 900
c) nemocní lidé s pozitivním výsledkem: 99
d) nemocní lidé s negativním výsledkem: 1

Jelikož jsem v příkladu dostal pozitivní výsledek, patřím do skupiny b nebo c (a + b = 9999 lidí).
Pak už je to jednoduchá matematika: (99 * 100) / 9999 = 0,990099...

[45] (Roj - WWW) 05.12.2007, 23:28:11 [X] [D]
Tak ja to tady pro Nenu vycislim pro pocet lidi deset tisic. Skupiny beru jako nahore.

1. zdravi neg - (9899)
2. zdravi pos - ( 100)
3. nemocn pos - ( 1)
4. nemocn neg - ( 0)

Tohle je snad jasne vsem. Ted ale prichazi podminka:
vybirame z mnoziny positivne testovanych

Pohledem do tabulky vidime, ze v teto mnozine je 1 nemocny a 100 zdravych. Cili nemocnych je jen 1/100, tedy 0.01.
Pravdepodobnost, ze jste ten jeden zrovna vy, je tedy jedno procento, cili neni duvod skakat z Nuselaku.

[46] (Roj - WWW) 05.12.2007, 23:36:31 [X] [D]
Nutno podotknout, ze v praxi se nechavaji testovat jen lide s podezrenim na nemoc, popripade uz s priznaky. To je pak vysledek uplne jiny, uz se nejedna o nezavisle jevy. Ovsem to v zadani nebylo ;-)

[47] (ShadoW - Mail ) 05.12.2007, 23:37:32 [X] [D]
Oprava [44]: Samozřejmě jsem měl na mysli (b + c = 9999) lidí.

[45] Moc malý vzorek, vzniká tam zaokrouhlovací chyba. :-)

[48] (pixy - Mail ) 05.12.2007, 23:42:17 [X] [D]
Achjo, skoro spim, tohle mi dělat na noc.

Na první pohled mi selský rozum říká: z definice je "výsledek správný v 99 případech ze 100". Na tom, kolik lidí je nebo může být nemocných, přece vůbec nezáleží, pozitivní jsem na 99 %, to je řečeno přímo v zadání.

Jenže pak taky přemýšlím o extrémním případu - řekněme, že to bude třeba choroba, kterou má na celém světě jen 100 lidí. Když bych otestoval všechny lidi na světě, pro jednoduchost řekněme 10 mld., a nemocné označil správně v 99 %, budu mít chybnou diagnózu jen u jediného člověka na celém světě - jedna ku 10 mld., že přes negativní výsledky je člověk skutečně nemocný. Když ale naopak označím 1 % zdravých lidí za nemocné, je to skoro 100 milionů chybných diagnoz na 100 skutečně nemocných lidí - téměř jedna ku milionu, že pozitivní výsledky skutečně znamenají nemoc...

(V daném příkladu není četnost choroby 1:100 mil, ale 1:10.000, tedy pravděpodobnost toho, že jsem s pozitivním výsledkem skutečně nemocný, by zde byla 1:100.)

Osobně celý problém vnímám v chápání toho pojetí "správnosti". Co označuje těch 99 %? Že o 99 % nemocných řeknu správně, že jsou nemocní, a o 99 % zdravých řeknu správně, že jsou zdraví? Anebo že 99 % lidí řeknu správně jejich zdravotní stav? Obávám se, že zadání hovoří jen o tom prvním, a to druhé není s tím prvním ekvivalentní. Jenže všichni předpokládáme právě to.

Ale už mi to moc nemyslí...

[49] (pixy - Mail ) 05.12.2007, 23:46:27 [X] [D]
Hm, tak než jsem to sesmolil, byl Roj rychlejší...

[50] (rinamon - Mail ) 05.12.2007, 23:49:53 [X] [D]
[49] na rychlosti nezáleží ;)

[51] (Roj - WWW) 06.12.2007, 00:09:48 [X] [D]
[43] Diky, Perlovka je moje oblibena ulice ... hlavne teda v noci :-)

[52] (zcr - WWW) 06.12.2007, 00:11:45 [X] [D]
V krabici máme kočku (no jo, není to moc originální), která je živá nebo mrtvá (v našem případě je mnohem větší šance, že je živá, ale je to jedno). Rozhodnu se, že zjistím, jak to s ní je. Podívám se do krabice a vidím mrtvou kočku. Samozřejmě je tu malá šance, že jsem se přehlédl, a to, co jsem považoval za mrtvou kočku, je kočka živá... ale to se mi stává tak s jednou ze sta koček. Mám důvod ke smutku? Mám, protože moje kočka s největší pravděpodobností chcípla. (No a kdybych si ji jen vyfotil a podíval se za týden - a na obrázku uviděl mrtvou kočku - je sice možné, že jsem se opět přehlédl (ale to se mi zase stává jen...), ale kočka mohla chcípnout během toho týdne.

[53] (dgx - WWW) 06.12.2007, 00:11:47 [X] [D]
Tentokrát jsem zkusil nejprve přečíst komentáře a na článek se teprve chystám. Prvních čtyřicet kousků mě pěkně mátlo, ale pak mi Roj následován Pixym celou věc tak krásně vysvětlil, že s nimi prostě musím souhlasit. Mají recht!

No a teď si jdu přečíst zadání :-)

[54] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 00:48:40 [X] [D]
[42] Viz odkaz... Já tu knížku koupil na nádraží v trafice, když jsem hledal něco na čtení do vlaku.

[55] (Hekko [openID] - Mail - WWW) 06.12.2007, 01:03:15 [X] [D]
Možná se pletu, ale beru jako stěžejní tohle: vyšetření na tuto chorobu je přesné na 99% bez ohledu na to, jestli chorobu máte nebo ne (jinými slovy řečeno, pozitivní i negativní výsledek bude správný v 99 případech ze sta)

Já tomu rozumím tak, že ze sta testů jeden vyjde jinak, než by měl - bez ohledu na to, jestli je pozitivní nebo negativní. Pravděpodobnost, že je to právě ten můj, je 1 %. Ergo pravděpodobnost, že jsem nemocná, když test říká, že jsem nemocná, je 99 %. Informace o četnosti nemoci v populaci je nadbytečná.

Na chvíli jste mě zviklali, ale pak mi mozek zapnul/vypnul (nehodící se škrtněte) a už jsem pevná jako skála ;)

[56] (dgx - WWW) 06.12.2007, 01:15:15 [X] [D]
Tak jsem si přečetl zadání a svůj souhlas odvolávám :-)

Pokud v zadání stojí, že pozitivní výsledek bude správný v 99% případů, a já jsem tím případem, tak prostě na 99% nemoc mám.

Pokud však v zadání zároveň stojí, že i negativní výsledek bude správný v 99% případů, a zároveň platí, že nemoc postihuje 1 člověka z 10000, tak výpočtem mi vychází, že po 10000 provedených testech odejde 10101 lidí s negativním výsledek a -101 lidí s výsledkem pozitivním.

Tedy: chyba v zadání?

[57] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 01:29:20 [X] [D]
[56] "vyšetření na tuto chorobu je přesné na 99% bez ohledu na to, jestli chorobu máte nebo ne (jinými slovy řečeno, pozitivní i negativní výsledek bude správný v 99 případech ze sta)."

[58] (dgx - WWW) 06.12.2007, 01:39:42 [X] [D]
[57] teď se nechytám. Kde je rozpor?

[59] (dgx - WWW) 06.12.2007, 01:47:30 [X] [D]
"pozitivní i negativní výsledek bude správný v 99 případech ze sta" se dá chápat takto:

- pozitivní výsledek bude správný v 99 případech ze sta (pozitivních výsledků) & negativní výsledek bude také správný v 99 případech ze sta (negativních výsledků). Platí řešení [56]
- ze sta výsledků, ať už pozitivních nebo negativních, je 99 správných. Platí řešení [45]



[60] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 01:51:24 [X] [D]
Tvrdím snad že je rozpor? Pouze jsem re-citoval.

[61] (Hekko [openID] - Mail - WWW) 06.12.2007, 02:00:54 [X] [D]
[56] Kde se bere souvislost mezi procentuálním vyjádřením přesnosti testu a procentem výskytu v populaci? Já ji tam nevidím - ty dvě věci jsou na sobě absolutně nezávislé. Ten test bude přece stejně přesný v oblasti, kde se nemoc rozšíří na každého druhého, i v oblasti, kam právě dorazil první nemocný. Ten test bude stejně přesný, ať už je to nemoc genetická, infekční nebo vyvolaná erekcemi na slunci.

[62] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 02:23:17 [X] [D]
Tak, opět chvíle CH, opět citace z knihy:

(...) Předpokládám, že většina z vás si znovu přečetla předchozí odstavce a dospěla k závěru, že onu zhoubnou chorobu máte na 99%. Některé z vás vyvedla z rovnováhy moje žádost, abyste ještě jednou zvážili svou odpověď, a nemáte v úmyslu se přiklonit k tak vysokému procentu pravděpodobnosti, ale patrně se domníváte, že chorobu spíš máte než nemáte. Správnou odpověď znají jen ti, co se vyznají ve statistice. Na základě až dosud uvedených informací byste si neměli dělat starosti s pozitivním výsledkem. Pravděpodobnost, že tu chorobu máte, je menší než jedno procento.

Je to tak. Přestože je test přesný na 99%, nemáte ani jedno procento pravděpodobnosti, že tu chorobu máte. Klíč k rozluštění této zdánlivě protismyslné skutečnosti spočívá v informaci, kterou jste patrně opomenuli nebo jste ji nezahrnuli do svých výpočtů: Choroba postihuje jednoho člověka z deseti tisíc. Pozitivní výsledek vašeho vyšetření se svou přesností 99% může znamenat, že jste jedním z 99% lidí, u kterých byla správně zjištěna přítomnost choroby, nebo že jste jedním z jednoho procenta lidí, kteří tuto chorobu NEmají, ale kteří ji podle chybného výsledku testu domněle mají. (Nezapomínejte na to, že přesnost testu je 99% bez ohledu na to, zda chorobu máte nebo nemáte.) Co je tedy pravděpodobnější, že jste jedním z lidí, kterým byla správně diagnostikována choroba, nebo že jste jedním z těch, kterým bylo chybně potvrzeno, že chorobu mají?

Choroba postihuje jednoho z deseti tisíc lidí. Když na chvíli zapomeneme na výsledky testů, tak je zřejmé, že je mnohem pravděpodobnější (9999:1) že chorobu nemáte. Představte si, že vyšetření podstoupí milion lidí. Chorobu má jen sto z nich. U 99 z nich bude správně diagnostikována choroba, protože přesnost vyšetření je 99%. Na druhé straně 999 900 lidí z onoho milionu bude zdravých, ale u jednoho procenta z nich (tedy 9999) bude chybně diagnostikována choroba. Jste tedy jedním z oněch 99, kteří chorobu mají, nebo jedním z oněch 9999, kteří ji nemají? Máte stokrát vyšší pravděpodobnost, že patříte do druhé, tedy zdravé kategorie.

Tolik Derren Brown a doslovná citace. Děkuji všem za komentáře, pokud je toto vysvětlení v rozporu s vašimi názory, neviňte z toho prosím mne...

[63] (Hekko [openID] - Mail - WWW) 06.12.2007, 02:37:12 [X] [D]
A sakra... teď abych až do rána hledala logickou chybu... to jsem si zas naběhla.

[64] (dgx - WWW) 06.12.2007, 02:41:38 [X] [D]
Kurňa já tu píšu Hekko sáhodlouhý elaborát a ty to zatím rozřešíš :-)

Fintu vidím hlavně v tom, že doktor by nikdy neřekl osobě s pozitivním výsledkem v ruce, že "test je přesný na 99 %", pokud by to reálně znamenalo, že 99 procentům zdravých lidí potvrdí jejich zdraví, zatímco 99 % pozitivních výsledků je mylných.

Ale hezké. Těším se na další hádanku:-)

[65] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 02:44:54 [X] [D]
Bonusová otázka - najdi rozpor:

[0] "Lékař vám vysvětlí, že vyšetření na tuto chorobu je přesné na 99% bez ohledu na to, jestli chorobu máte nebo ne (...) Lékař odebere vzorky a sdělí, že za týden přijdou výsledky."

vs

[64] doktor by nikdy neřekl osobě s pozitivním výsledkem v ruce, že "test je přesný na 99 %"

[66] (Stepan ) 06.12.2007, 02:46:44 [X] [D]
Poznamka:
Nema byt v reseni tato formulace?

"Pozitivní výsledek vašeho vyšetření se svou přesností 99% může znamenat, že jste jedním z 99% lidí, KTEREMU byla správně zjištěna přítomnost choroby, nebo že jste jedním z jednoho procenta lidí, kteří tuto chorobu NEmají, ale kteří ji podle chybného výsledku testu domněle mají."

A pote ta formulace dole opet rika neco ve smyslu jednim z lidi...pritom existuje prave jeden clovek, ktery chorobu ma.

Drobnosti; diky za peknou ulohu :)

[67] (Hekko [openID] - Mail - WWW) 06.12.2007, 02:49:43 [X] [D]
[64] Jo, Arthur za všechno může! :)
Elaborát mi asi nepomůže, nejde o to, že bych to takhle nepochopila, spíš mám pocit, že nějak jinak rozumím "99% přesnosti". To si holt teď nějak vyřeším na procházce se psem, to je můj osobní problém.

[68] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 02:51:02 [X] [D]
[66] Citace jsou doslovné. K druhé výtce: Je jeden člověk z deseti tisíc. Malá země s deseti miliony obyvatel má tedy tisíc nemocných - a vzhledem k tomu, že není specifikováno, kolik lidí bylo na testech, tak je zcela v pořádku použít "jedním z lidí..."

[69] (lummox ) 06.12.2007, 03:02:02 [X] [D]
Problém u komentátorů s odlišným řešením bude nejspíš v tom, že se zadání (konkrétně věta "pozitivní i negativní výsledek bude správný v 99 případech ze sta") dalo pochopit dvěma způsoby:

1) 99% testovaných lidí dostane správný výsledek
2) 99% pozitivních výsledků je správných a zároveň 99% negativních výsledků je správných

Možnost 2) by potom skutečně vedla k řešení, že pokud jste dostal pozitivní výsledek, tak jste na 99% nemocný. Při bližším rozboru ovšem vede tato možnost ke sporu - proto, aby čísla seděla, potřebovali bychom záporný počet pozitivních výsledků. To se ovšem neukáže, dokud si to člověk skutečně nespočítá.

[70] (dgx - WWW) 06.12.2007, 03:04:31 [X] [D]
[63] Tak stručně ;)

1) "ze sta testů jeden vyjde jinak, než by měl ... pravděpodobnost, že je to právě ten můj, je 1 %" To souhlasí.

2) "Ergo pravděpodobnost, že jsem nemocná, když test říká, že jsem nemocná, je 99 %" - Nikoliv, na 99 % ti správně vyšel "pozitivní nález". Ale "pozitivní nález" znamená nemoc jen v určitém (mizivím) procentu případů.

[71] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 03:24:16 [X] [D]
[69] Problém je v tom, že tato věta není takto napsána osamoceně, že je v kontextu s větami jinými, například s tou předchozí, která říká, že "vyšetření je přesné na 99%, ať chorobu máte nebo ne", jinými slovy řečeno - výklad zadání je takový, že "JAKÝKOLI výsledek, který obdržíte, ať pozitivní nebo negativní, je správný na 99%".

Můžeme to brát i jako test chápání psaného textu... ;)

[72] (Hekko [openID] - Mail - WWW) 06.12.2007, 04:05:01 [X] [D]
Tak já už vím, kde vznikl ten rozpor, napadlo mě to během prvních deseti minut procházky:

Podle toho, jak jsem pravděpodobnost pochopila já (a jestli jsem ji pochopila špatně, to abych šla vrátit maturitní vysvědčení), 99% pravděpodobnost správného výsledku znamená, že jeden každý výsledek bude na 99 % správný. Je to jako když házíte kostkou: pravděpodobnost, že hodíte šestku, je jedna ku šesti, bez ohledu na to, kolikrát jste už hodili a jestli už šestka padla.

ex [62]: Představte si, že vyšetření podstoupí milion lidí. Chorobu má jen sto z nich. U 99 z nich bude správně diagnostikována choroba, protože přesnost vyšetření je 99%. Na druhé straně 999 900 lidí z onoho milionu bude zdravých, ale u jednoho procenta z nich (tedy 9999) bude chybně diagnostikována choroba. (já vím, už to tady je, ale kdo má furt listovat nahoru dolů)

Tohle rozložení nemocných a zdravých testovaných a správných a špatných výsledků testů je správné. Jenže ne jediné správné.
Už první předpoklad - že z milionu vyšetřených má sto lidí onu smrtelnou chorobu - je jen statistická pravděpodobnost. Nejspíš to bude přibližně sto. Nemusí to ale být žádný. Na světě je kolik - šest a půl miliardy lidí? Při dané četnosti výskytu přibližně 650000 nemocných celosvětově. Zase - přibližně. Abychom zjistili přesné číslo, museli bychom vyšetřit všechny, přičemž lidi se neustále rodí a umírají (někteří na chorobu CH). Takže v tom milionu vyšetřovaných máme jakýkoli počet nemocných od nuly po cca 650000, nejspíš (s nejvyšší pravděpodobností) něco kolem stovky.

Ne nadarmo se říká, že statistika je věda, která provádí přesné výpočty s nepřesnými čísly. ;)

Uběhne týden a máme milion výsledků, z nichž tedy přibližně stovka bude pozitivních (pokud nebyla vybrána extrémni skupina obyvatel). Pan Brown tvrdí, že 99 % pozitivních výsledků bude správných, 1 % chybné. A stejně tak negativní výsledky.
Hekko tvrdí, že přibližně 99 % výsledků bude správných, zbytek chybně. Jenže přibližně 99 % může být taky 100 %. Je to sice extrémní, ale pravidla pravděpodobnosti nevylučují, že v daném vzorku prostě k žádné chybě nedošlo. Odskáče to sousední milion... nebo až ten další... nebo třeba taky nikdo. A kromě slova přibližně tvrdím (nadutě :))), že je tam ještě jeden rozdíl.
Kdo říká, že z těch chybných výsledků bude taková a taková část pozitivní? Třeba budou všechny pozitivní. Třeba žádný. Třeba jeden jediný. A to pořád nevíme, kolik těch chybných výsledků je.

Ano, statistika ve velkých číslech funguje. V průměru. Zhruba. Ale hoďte si cvičně šestkrát kostkou...

[73] (dgx - WWW) 06.12.2007, 04:20:52 [X] [D]
[72] zkus to jinak.

- Máš pozitivní nález.

- Ten je na 99 % správný.

- Takže buď jsi to jedno procento, kde se test zmýlil a jsi zdravá...

- ...nebo jsi tam jedna setina procenta trpících onou nemocí.

- Co je pravděpodobnější?

- Že jsi to jedno procento. Stokrát pravděpodobnější.

[74] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 04:27:08 [X] [D]
[72] Hodil jsem si cvičně šestkrát mincí a výsledek hodů jsem si zapsal. Když mi padla panna, napsal jsem si P, když orel, napsal jsem si O.

Pro své vlastní zvrácené potěšení jsem si napsal následující seznam. Seznam zachycuje tři sady výsledků, ale jenom jedna z nich je skutečná. Která z těchto sad s největší pravděpodobností zachycuje skutečný výsledek mých šesti hodů?

1. PPPPPP
2. OOOOOO
3. POOPOP

[75] (Hekko [openID] - Mail - WWW) 06.12.2007, 04:46:59 [X] [D]
[74] Trojka, samozřejmě.
Ale je některá z nich nemožná? A jaká je pravděpodobnost, že ti padne POOPPP?
S tou kostkou je to líp vidět, tam nemáš jen dvě možnosti. Při házení mincí tomu odpovídá hodit dvakrát ;)

[73] A jaká je pravděpodobnost, že mi vyjde pozitivní test?

Srovnáváš nesrovnatelné. Pravděpodobnost, že jsem nemocná, je čistě statisticky 1:10000. Tohle číslo bylo zjištěno empiricky: ve skupině lidí, o kterých víme, jestli jsou zdraví nebo nemocní, je na každých 9999 zdravých jeden nemocný.

Z deseti tisíc testů tím pádem vyjde taky tak jeden pozitivní. Přibližně.

[76] (Hekko [openID] - Mail - WWW) 06.12.2007, 04:53:49 [X] [D]
a, chybička - těch pozitivních samozřejmě vyjde víc než jeden, bude jich (brm brm, je pět ráno) sto, plus mínus.

Já věděla, že tam mám něco blbě :)

[77] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 05:06:19 [X] [D]
[75] SAMOZŘEJMĚ? No, právě že SAMOZŘEJMĚ ne...

Jaká je pravděpodobnost, že padne ta první posloupnost? Pravděpodobnost P při prvním hodu je 1:2. Při druhém hodu padne P se stejnou pravděpodobností, PP je tedy s pravděpodobností 1:4. PPP s pravděpodobností 1:8 atakdále, až PPPPPP je s pravděpodobností 1:64. Jest tak? Mince nemá paměť, mince vždy dopadá s pravděpodobností 1:2. při šesti hodech je pravděpodobnost posloupnosti PPPPPP jedna ku šedesáti čtyřem.

Jaká je pravděpodobnost, že padne OOOOOO? Pravděpodobnost O při prvním hodu je 1:2. Při druhém hodu padne O se stejnou pravděpodobností, OO je tedy s pravděpodobností 1:4. OOO s pravděpodobností 1:8 atakdále (...) Pravděpodobnost toho, že padne OOOOOO je opět 1:64.

Jaká je pravděpodobnost třetí posloupnosti? P při prvním hodu, 1:2. O při druhém hodu opět 1:2. PO s pravděpodobností 1:4. POO je 1:8... atakdále. Mince nemá paměť. Pravděpodobnost toho, že padla ta třetí série, je... jedna ku šedesáti čtyřem.

Opět ocituju Derrena Browna: Přesto nás ale svádí skutečnost, že třetí z nabízených možností vypadá "typičtěji". Podle stejných zákonitostí, kdo by si v loterii vsadil na kombinaci čísel 1, 2, 3, 4, 5 a 6? A přesto je pravděpodobnost této posloupnosti stejná jako pravděpodobnost jakékoli jiné posloupnosti, kterou zvolíte. Záměna "pravděpodobného" za "typický" vede ke slavnému hráčskému omylu: Pokud kulička přistála pětkrát po sobě v černém políčku, zdálo by se rozumné vsadit na červenou. jenže to není pravda!

[78] (Hekko [openID] - Mail - WWW) 06.12.2007, 05:36:20 [X] [D]
[77] Já mám ale den... jo, když to bude posloupnost, tak jsou všechny stejně pravděpodobné. Stačilo nakopnout, nejsem úplně blbá, i když to tak zrovna dneska vypadá... Udělala jsem chybu a mylně se k nim chovala jako ke kombinacím.

[76]... a tím pádem jsme v situaci, kdy máme sto testovaných s pozitivním výsledkem, z nichž pravděpodobně jeden je opravdu nemocný => pravděpodobnost 1:100, že jsem to já, ještě o něco snížená faktem, že ten chudák, co opravdu brzo umře, mohl zrovna dostat falešně negativní výsledek (takže všechny pozitivní jsou chybné).
Takže jsem se tady hezky vztekala a nabírala na obrátkách a nakonec jsem došla přesně tam, kam Roj [19], pixy [48], dgx [53](měla jsem to číst pozorněji), pan Brown [62] a ten zbytek na stejné palubě. Prostě míň než jedno procento.

Beru za pozitivní dopad, že jsem k tomu závěru nakonec donutila vlastní mozek, a děkuji sparring partnerům :)

[79] (Johnny [openID] - Mail - WWW) 06.12.2007, 08:04:44 [X] [D]
Já se ale nevzdám:
[73] - ano, tím, že se dozvím, že mám pozitivní tst, sklouznu do té skupiny, která je daleko méně pravděpodobná (jsem jeden z deseti tisíc), ale potvrzení toho, že to tak je, je na 99%.
Já stejně pořád tvrdím, že jak psala Hekko kdesi výše, že pravděpodobnost výskytu nemoci v populaci NEOSUVISÍ s pravděpodobností správného výsledku testu.
Na začátku je velmi malá prvaděpodobnost, že jsem nemocný. Jsem v klidu.
Ale pak nastoupí test a ten mě uvrhne do té skupiny 1 ku 10 tisícům s nemocí. A pravděpodonost, že jsem v té skupině správně, je 99%.

Kdyby měl v populaci tu nemoc každý druhý a přesnost testování by byla stejná, výsledek je zase stejný. Prostě polovina lidí je nemocná a já chci zjistit, jestli já taky.
Nechám si udělat 99%-ní test a vyjde mi, že ano. Takže tu nemoc mám na 99%.

JINÁ VĚC by byla, kdyby mi vyšel NEGATIVNÍ výsledek. Pak mám totiž pořád malou pravděpodobnost (1%), že se test mýlil, ale protože má nemoc jen 1 z 10 tisíc, tak se bát nemusím, protože pravděpodobnost je 1:10000, že ji mám.

Vtip je podle mě v tom, že testování RUŠÍ předchozí pravděpodobnost, protože nastoluje novou.

[80] (Johnny [openID] - Mail - WWW) 06.12.2007, 08:30:26 [X] [D]
Ještě mě to napadlo jinak:
Řekněme, že já, jako osoba Johnny si dneska půjdu udělat test na AIDS. Ta pravděpodobnost výskytu v populaci možná bude někde u těch 1:10 000.
A řekněme, že ten test je stopro, tedy že neexistuje možnost, že by se mýlil. A doktor mi řekne, že je pozitivní. Podle vašich propočtů, by pravděpodobnost, že mám nemoc, by byla nulová. Já naopak tvrdím, že je JISTÉ, že ji mám.

Těch 99% úspěšnosti testu vychází z počtu testovaných osob, nikoliv z počtu 10.000 v populaci. Nikde se nepíše, kolik osob bylo testováno a pravděpodobnost správnosti testu je tedy brána jako fakt.

Takže... když to srovnám s Arthurovou citací:
Je pravděpodobnější, že se test mýlí, nebo že se nemýlí? A zajímá mě v tu chvíli, kolik lidí nemoc má? Ale to už se opakuju...

[81] (Jago ) 06.12.2007, 08:30:37 [X] [D]
Bohužel, zdůvodnění pana Browna neberu. Podstatná je udaná spolehlivost testu (jak se k ní došlo, nevím, ale berme to jako fakt), která na četnosti výskytu nemoci v populaci nezávisí (tato informace je redundantní, pokud jsem se přesto rozhodl test podstoupit). Otázka vlastně zní: Jak interpretovat výsledek na mně provedeného testu? Statistik by po obdržení laboratorních výsledků konstatoval, že s pravděpodobností 0,99 onu chorobu má. Ne, že by to byl nějaký extra významný interval spolehlivosti. Skutečnost, že 99 % procent populace chorobou netrpí, je z jeho hlediska k vzteku, ale to je tak všechno.

[82] (Roj - WWW) 06.12.2007, 08:39:40 [X] [D]
[79] Johnny, nebojuj s matematikou :-)
Da se bojovat s nazorem na radar, na Paroubka, na Tacheci, ale ne s matematikou . Kdo bojuje zatvrzele s matematikou, dela ze sebe blbce. Ty si to nezaslouzis :-)

[83] (Roj - WWW) 06.12.2007, 08:42:22 [X] [D]
Johnny a Jago, odpoved je v mem komentari [46].

[84] (Hekko [openID] - Mail - WWW) 06.12.2007, 08:56:43 [X] [D]
[79] Ale Hekko to potom přepočítala a hlavně dopočítala a došla k trochu jinému (opačnému) závěru.

Jde o to, že ten test ukáže nějaký soubor výsledků, z nichž 1 % je chybné. Tento soubor sestává z výsledků negativních a pozitivních, přičemž těch negativních je tam víc (nemoc je vzácná).
V souboru 10000 vzorků by se statisticky měl objevit jeden pozitivní. Předpokládejme, že tam je (bez něj bych musela moc počítat). Jenže cca 1 % těch vzorků je chybných, což při právě jednom opravdu nemocném dělá cca 100 falešných pozitivních výsledků.
Dejme tomu, že vyšlo právě 100 pozitivních výsledků. Možnosti jsou dvě:

A) ten nemocný dostal chybný výsledek (negativní) a těch 100 pozitivních nálezů jsou samé chyby. (celkový počet chyb 101, což zhruba odpovídá procentu úspěšnosti testu)
B) nemocný dostal správný výsledek (pozitivní) a chybných je těch 99 zbylých. (celkový počet chyb 99, což taky zhruba sedí)

No a když se vrátím na začátek: pravděpodobnost, že při vyhodnocování testu dojde k chybě, je 1 %. Jenže my máme ve vzorku deseti tisíc lidí nejspíš jen jednoho opravdu nemocného. Co to znamená? Že v každých deseti tisících testovaných je jeden, možná dva nemocní - řádově jednotlivci - zato pozitivních výsledků okolo stovky.
Více než 90 z těchto pozitivních výsledků jsou chyby. Prostě mezi pozitivními nálezy je těch chybných mnohem víc. Proto je taky tak malá pravděpodobnost, že právě ten jeden pozitivní nález, který právě držím v ruce, je tak malá.

Ve výše uvedeném modelu je to pro A 0 % (všechny pozitivní jsou chybné) a pro B 1 % (ze sta pozitivních jen jeden je opravdu nemocný).
Pokud uvažuju model, kde je na 10 000 testů vždy právě 100 chybných, přičemž ve vzorku je právě jeden nemocný, tak pravděpodobnost, že jsem to já, je asi 0,98 %.

[85] (Roj - WWW) 06.12.2007, 09:18:29 [X] [D]
[84] Hekko, zase cpes zavislost tam, kde neni.
Tvoje A je nesmysl. I kdyby nakrasne ten jediny nemocny dostal falesne negativni vysledek, prabdepodobnost ostatnich vysledku to neovlivni.
Klic ke vsemu je ta tabulka se ctyrmi radky.

Vzdycky se to resi tak, ze si soubor rozdelis na vsechny disjunktni podmnoziny a paxi vycislis jen ty, ktere vyhovuji podmince.
A podminka je ta, ze vyberes jen podmnoziny s positivnim vysledkem testu. Pak uz je to trivialni uloha.
Pokud ti to mozek nebere, proste se to nauc jako neco noveho a priste to jen papouskuj. Vsechny ostatni cesty vedou ke zblbnuti :-)

Znovu opakuju, ze k tomu, aby to fungovalo, musi byt oba vybery nezavisle, coz zadani splnuje.

[86] (Jago ) 06.12.2007, 09:27:57 [X] [D]
[84] Doporučuji věřit odborníkům - 99 %. Existuje k tomu jedna statistická disciplína zvaná teorie odhadu a testování hypotéz... Pravděpodobnost, že test dá nesprávný výsledek, je pevně dána. Tedy spíš předložena k věření, protože způsob zjištění spolehlivosti testu neznáme stejně jako metodu zjištění četnosti nemoci v populaci (i to je odhad v rámci nějakého intervalu spolehlivostí). Tak proč znova rozebírat, jak se k tomu došlo? Mě zajímá můj výsledek, mám-li odpovědět na položenou otázku.

[87] (Roj - WWW) 06.12.2007, 09:32:11 [X] [D]
[86] Jago, hazardem se zabyvam jiz delsi dobu. Tyhle teorie prabdepodobnosti a relativni cetnosti mam overene praxi. Dokonce se tim zivim. A hlady jsem dosud neumrel :-)

[88] (Johnny [openID] - Mail - WWW) 06.12.2007, 09:43:12 [X] [D]
[84] OK. Vezměme si v úvahu, že test se nemýlí. Je jisté, že když je test pozitivní jsem nemocný. Tady se asi shodneme, že statistika a pravděpodobnost odpadá a já mám JISTOTU, že jsem nemocný.
Klesne přesnost testu o 1% a vy říkáte, že v tu ránu klesne pravděpodobnost ze 100% na méně než 1%? Chápu to správně?

[89] (Roj - WWW) 06.12.2007, 09:55:14 [X] [D]
[88] No konecne :-)

[90] (Ťapinka ) 06.12.2007, 09:55:36 [X] [D]
Tohle je typický rozpor, mezi nemocí matematickou a nemocí biologickou. V praxi samozřejmě test spolehlivý na 99% je spolehlivý dostatečně, protože se netestuje náhodně vybraný vzorek populace, ale lidi s důvodným podezřením, že nemoc mají. A v jejich skupině už zastoupení nemocných může být klidně 1 z 10.
Ale vlastně mám příklad z praxe, který ukazuje, že souvislost mezi četností nemoci v populaci a přesností testu nelze zanedbávat. FIP - kočičí infekční peritonitida. Nemoc, která se diagnostikuje testem z krve. Tenhle test ale odhalí skupinu virů, ne ten konkrétní jeden, který způsobuje smrtelnou nemoc, čili pozitivní test má 30 % koček v populaci, ale nemocí trpí (dejme tomu, tohle přesné číslo neznám, ale snad nebudu příliš daleko od pravdy) 1 %. Teď, jak zformulovat myšlenku a nenadělat chaos.
Ze 100 testovaných jedinců 30 má pozitivní výsledek.
Ze 100 jedinců v populaci 1 je nemocný.
Dalo by se z toho usuzovat, že spolehlivost takového testu je 71 %? Já myslím, že dalo, jestli ne, tak mě opravte, fakt jsem na statistiu levá. Ale vycházím z toho, že 29 jedinců ze 100 dostane výsledek "chybný".
FIP se chová jak jako nemoc biologická, tak jako nemoc matematická. Testují se kočky, které mají klinické příznaky, pokud jsou potvrzeny pozitivním testem, je velice téměř jisté, že se o tuhle nemoc jedná. Ale testují se i kočky bez příznaků, negativní výsledek zvyšuje důvěryhodnost chovatele například při krytí. A jsme u toho. Kočka, která nemá žádné klinické příznaky, má pozitivní výsledek. Pokud budu ignorovat četnost výskytu v populaci, musela bych říct, že je 71% pravděpodobnost, že onemocní a zemře. Jenže já vím, že na 100 koček připadá 30 pozitivních a jen 1 nemocná, a když tohle vezmu v úvahu, vyjde mi, že ta moje kočka má "šanci" být nemocná 1:29, což je něco přes 3 procenta.

[91] (Hekko [openID] - Mail - WWW) 06.12.2007, 10:12:02 [X] [D]
[85] Vybrala jsem pro ilustraci jednu konkrétní skupinu deseti tisíc testovaných, ve které platí, že je tam právě jeden nemocný a právě sto pozitivních výsledků. Ta čísla mohou být jiná; pravděpodobně (pokud nelze odhalit a testovat pouze skupinu, která je z nějakého důvodu ohrožená nemocí více než jiní, viz [90]) ale budou podobná a celé to slouží pro ilustraci toho, že 99% přesnost testu sice platí, jenže to jedno procento chybových se ponejvíce nacpe do skupiny pozitivních výsledků.
Ano, premisa je zmanipulovaná, taky z toho nic nepočítám ;)

[88] Ono jde o to, že jsou to dvě různé pravděpodobnosti. 99 % je pravděpodobnost toho, že můj test bude správný - to vím předem, vyplývá to zřejmě z charakteru toho testu.
Ovšem nás zajímá pravděpodobnost, že je správný tenhle konkrétní pozitivní výsledek. No a z četnosti choroby v populaci vyplývá, že na deset tisíc testů padá průměrně jeden, který být pozitivní, ostatní mají být negativní. Cirka stovka z těch testů bude špatně, tj. bude mít opačný výsledek.
Do negativního výsledku lze znegovat (statisticky) jen jeden test. Ten zbytek do stovky jsou chybné výsledky zdravých jedinců.

To je to, co mi trvalo tak dlouho pochopit (asi až do půl šesté ráno): ve skupinách pozitivních výsledků a negativních výsledků je rozložení chybných a správných testů jiné.

[92] (Jago ) 06.12.2007, 10:16:08 [X] [D]
[90]Já netvrdím, že souvislost nelze zanedbat. Jenom konstatuji, že v této úloze nám byly předloženy jakési "nesporné" údaje, o nichž sice nevíme, jak se k nim došlo, ale z nichž musíme vycházet při interpretaci výsledků. BTW: Popisovaný kočičí test se zřejmě pro zdravé jedince nehodí, třicetiprocentní pravděpodobnost chyby je strašně veliká.

[93] (Jago ) 06.12.2007, 10:20:15 [X] [D]
[91] Statistické rozdělení je u obou skupin stejné. Jen těch zdravých je halt víc.

[94] (Johnny [openID] - Mail - WWW) 06.12.2007, 10:32:05 [X] [D]
OK a teď zajímavý nápad mojí ženy:
Když je tedy při testování s účinností 99% pravděpodobnost jen méně než 1%, že jste skutečně nemocní, co se stane, pokud doktor test zopakuje?
Bude pravděpodobnost pořád stejná? Nový test přece vychází ze stejných hodnot.
Bude větší? Na kolik? Bude při dvou testech dvojnásobná? Tedy 2%? A otázka z praxe, která nesouvisí se statistikou a pravděpodobností, ale PŘESNĚ odpovídá na položenou otázku:
Pokud si to představíte v reálu, BÁLI BYSTE SE nebo JSTE V KLIDU?

[95] (Hekko [openID] - Mail - WWW) 06.12.2007, 10:34:31 [X] [D]
[93] Testů je 10 000.
Chybných je 100.
Nemocný je jeden.
Pozitivních výsledků je 99 (test toho nemocného vyšel pozitivní, pravděpodobnost 1 %) nebo 101 (test nemocného vyšel správně, pravděpodobnost 99 %).

Nejde o rozdělení správnosti testů mezi zdravé a nemocné, ale mezi pozitivní a negativní výsledky. Ve skupině pozitivních výsledků je výrazně vyšší chybovost - musí být, protože chybných testů je řádově (stokrát) víc než nemocných.

[96] (Jago ) 06.12.2007, 10:44:33 [X] [D]
[95] Chápu-li chybovost jako podíl počtu chybných k celkovému počtu, pak ne. Jedna setina je totéž jako tisíc stotisícin.

[97] (Ťapinka ) 06.12.2007, 10:44:47 [X] [D]
[92]No, to už je na jinou diskuzi, jestli se test hodí nebo nehodí. Ona to totiž není chyba v pravém slova smyslu, ten virus tam je, jen nemusí být smrtelný. Takže v praxi se pak u pozitivních koček doporučuje opatrnost při kontaktu s ostatními, zachází se s nimi jako s jedinci, kteří MOHOU přenášet chorobu. A to svoje opodstatnění má.

[98] (Hekko [openID] - Mail - WWW) 06.12.2007, 10:50:57 [X] [D]
[94] Pravděpodobnost, že výsledek je chybný, u jednoho testu je 1 %. Pouze pokud je test pozitivní, je chybný s pravděpodobností přesahující 99 %.

Druhý test bude zase chybný s pravděpodobností 1 %. Tak. A když teď budu počítat - teď si to musím rozmyslet, než to zase zvorám :) ale už si to začínám vybavovat ;) - budu počítat s pravděpodobností, že NASTANE chyba, tj. 1 %.

Pravděpodobnost, že oba testy vyšly chybně, je 0,01 * 0,01 = 0,0001, čili setina procenta. Teoreticky, pokud by dva testy stejné osoby nezávisle na sobě vyšly pozitivně, už bych se počítáním nezabývala, protože pravděpodobnost, že výsledek bude špatně, už je minimální.
Jenže otázka je, proč vyšel ten první test chybně. Tady nemusí jít o nějakou chybu v průběhu nabírání krve a vyhodnocování vzorku - co když v tom testu může vyjít pozitivní výsledek zdravému člověku prostě protože má netypický krevní obraz nebo já nevím co? Pokud existuje člověk, který bude mít vždycky pozitivní výsledek, i když je zdravý, tak pro něj se pravděpodobnost nemění (je vždycky 1). Ťapinka možná bude vědět, co se s tím v praxi dělá :)

No a na otázku z praxe - napsala bych závěť, zajistila, že se o muže a psa bude mít kdo postarat, ujistila se, že mi platí životní pojistka... no a prostě bych byla na nervy :) Je to sice pravděpodobnost menší než jedno procento, ale pořád je větší, než kdyby mi test vyšel negativně.

[99] (Jago ) 06.12.2007, 10:53:48 [X] [D]
[94] To je přesně to, co nám bylo v úloze zatajeno - jak se test organizoval (opakovaný?, kolikrát?) a jak se tedy určovala jeho spolehlivost.

[100] (Hekko [openID] - Mail - WWW) 06.12.2007, 10:56:38 [X] [D]
[96] Jedna skupina jsou všichni testovaní. 1 % z nich dostane špatný výsledek.

Tu skupinu rozdělíme na dvě podskupiny:
A) dostali negativní výsledek
B) dostali pozitivní výsledek

Ve skupině A může mít chybný výsledek jen nemocný člověk. Takový je jeden na 10 000, v průměru - pravděpodobně to pro konkrétních deset tisíc nebude víc než pár jedinců.

Zbytek lidí s chybným výsledkem bude mít výsledek pozitivní a budou ve skupině B. Ve skupině B může mít správný výsledek jen nemocný člověk - ne, nebude to víc než pár jedinců na 10 000 testovaných.

Na deset tisíc testů padá sto testů chybných. Z toho nemocní s negativním výsledkem bude pár kusů, zatímco zdravých s pozitivním pár desítek kusů.

Takže na 10 000 testovaných budou podskupiny:
A) tisíce jedinců, z toho několik málo dostalo chybný výsledek
B) desítky jedinců, z toho několik málo dostalo správný výsledek

Když vím, že jsem ve skupině B, chybovost ve skupině A mě nezajímá.

[101] (Jago ) 06.12.2007, 11:05:04 [X] [D]
[100] To souhlasí včetně závěru. A jak to souvisí s chybovostí jako poměrem?

[102] (#13 - WWW) 06.12.2007, 11:55:08 [X] [D]
Zajímavé :).

Nejdřív jsem si myslel, že to nebude 99 %, ale pak jsem se rozhodl, že ano, a zatím jsem se nijak nepřesvědčil zpět o původní myšlence.

Test je správný na 99 %, to beru jako fakt, který není ovlivněn tím, jaký výsledek mi vyjde, ani tím, jestli si potom budu propočítávat pravděpodobnost.

A jestli to tak neni, tak ať mě zašlápne obří pštros :)

[103] (pixy - Mail ) 06.12.2007, 12:15:47 [X] [D]
Já při počítání a odhadování nejraději pracuju s extrémy, protože na nich jsou většinou dané zákonitosti nejlíp vidět.

Řekněme, že:

A) nemoc je extrémně výjimečná, má ji jen 1 člověk na 100 milionů zdravých
B) nemoc je extrémně častá, zdravý je jen 1 člověk na 100 milionů nemocných

a tomu máme dánu statistickou přesnost testů, tedy procento diagnóz odpovídajících skutečnému zdravotnímu stavu, např.:

1) 50 % = 1:1 (polovina testů je špatných)
2) 99 % = 1:99 (jeden test ze 100 je chybný)
3) 99,99 % = 1:9999 (jeden test z 10.000 selže)
4) 99,99999999 % = 1: 9.999.999.999 (jeden test z 10 mld selže)

Počet nemocných osob v populaci je N, počet zdravých je Z. Počet zdravých s negativním testem je Zz, počet zdravých s negativním testem je Zn (Zz+Zn=Z); obdobně počet nemocných s pozitivním testem je Nn, nemocných s negativním testem je Nz (Nn+Nz=N). Lidé Zn a Nz mají chybnou diagnozu. Jejich zastoupení závisí na té přesnosti testů - pokud je jen 50%, polovina lidí bude míst správnou a polovina špatnou diagnozu. Ta přesnost testů udává vlastně poměr chybných ku správným, Zn/Zz, resp. Nz/Nn (za povšimnutí stojí, že přesnost může být jiná pro potvrzení a jiná pro vyvrácení podezření z nemoci, zde ji ale máme stejnou).

Pokud je tedy přesnost testů 99 %, je poměr špatně a dobře označených lidí 1:99. Tedy:

Zn/Zz = Nz/Nn = 1/99 = obecně 1/P
Z čehož plyne Zz=P.Zn, Zn=Zz/P; Nn=P.Nz a Nz=Nn/P. To se bude za chvilku hodit.

Současně taky máme daný výskyt nemoci v populaci, tj. poměr nemocných a zdravých:

N/Z = (Nn+Nz)/(Zz+Zn) = 1/Q

A teď. Byl jsem označen testem jako nemocný ("n") a zajímá mě, jaká je pravděpodobnost, že jsem skutečně nemocný (tedy patřím mezi Nn), nebo zda test selhal a jsem ve skutečnosti zdravý (tedy patřím mezi Zn). Jinými slovy, potřebuju nejprve vědět, jaký je v dané situaci poměr nemocných s pozitivním testem ke zdravým s pozitivním testem, tj. poměr Nn/Zn.

=> (Nn+Nz)/(Zz+Zn) = (Nn+Nn/P)/(P.Zn+Zn) = 1/Q
=> (Nn.(P+1)/P) / (Zn.(P+1)) = 1/Q
=> Nn/Zn = P/Q

Skutečně nemocných ku mylně označeným nemocným je tedy P/Q. Pravděpodobnost toho, že jsem při pozitivním testu skutečně nemocný, je pak (počet vyhovujících možností k celkovému počtu):

p = Nn/(Nn+Zn) = (Nn/Zn)/(Nn/Zn+Zn/Zn) = (P/Q) / (P/Q + 1)


Tedy v konrétních případech:

A) 1 člověk skutečně nemocný na 100 mil. zdravých
N/Z = 1/100.000.000; Q = 10^8

1) P = 1 => P/Q = 10^-8 => p = 9,9999.10^-9
2) P = 99 => P/Q = 99/10^8 => p = 9,899.10^-7
3) P = 9.999 => P/Q = 9999/10^8 => p = 9,998.10^-5
4) P = 9.999.999.999 => P/Q = (10^10-1)/10^8 => p = 0,990099

B) Pouhý 1 člověk je zdravý na 100 mil. nemocných
N/Z = 100.000.000; Q = 10^-8

1) P = 1 => P/Q = 10^8 => p = 0,99999999
2) P = 99 => P/Q = 99/10^-8 => p = 0,9999999999
3) P = 9.999 => P/Q = 9999/10^-8 => p ~= 1
4) P = 9.999.999.999 => P/Q = (10^10-1)/10^-8 => p ~= 1

C) Zpět k původnímu Brownovu příkladu: 1 člověk skutečně nemocný na 10.000 zdravých
N/Z = 1/10.000; Q = 10^4

1) P = 1 => P/Q = 10^-4 => p = 9,999.10^-5
2) P = 99 => P/Q = 99/10^4 => p = 0,00980295 = 0,98 %
3) P = 9.999 => P/Q = 9999/10^4 => p = 0,4999 ~= 50 %
4) P = 9.999.999.999 => P/Q = (10^10-1)/10^4 => p = 0,999999


Případ C2 je ten, co nás zajímal - tedy pravděpodobnost, že jsme skutečně nemocní, že menší než 1 %. Za další povšimnutí stojí i to, jak velkou roli hrají desetinná místa za těmi 99 % - pro spoustu lidí je 99% a 99,99% přesnost skoro totéž, ale ve výsledku to pak znamená, že nejsou nemocní s méně než 1% pravděpodobností, ale už to mají fifty-fifty. ;)

Q.E.D.
uf.

[104] (Jago ) 06.12.2007, 12:36:03 [X] [D]
[103] Chybička se vloudila. Přesnost (chybovost) testu není poměr chybný výsledek/správný výsledek, ale chybný výsledek/počet všech testů. Pak to zřejmě vyjde jinak.

[105] (dgx - WWW) 06.12.2007, 13:02:21 [X] [D]
[103][104] Přesně tak.

Místo: Zn/Zz = Nz/Nn = 1/99
Má být: (Zn + Nz) / (Z+N) = 1/99

Mimochodem, zkuste si představit extrém, že nemoc je dávno vymýcena, tedy netrpí ji nikdo. Stejně může existovat test (co by nemohl), který 1 % lidí řekne, že nemocí trpí (chybně). Tedy 99 % řekne pravdu = má přesnost 99 %.

[106] (Roj - WWW) 06.12.2007, 13:09:23 [X] [D]
[105] Nadherne! :-) Bingo!

[107] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 13:44:09 [X] [D]
Achich ouvej... Opravdu nedokážete přijmout slovní úlohu, hledáte a dlani chlup a bazírujete na tom, jestli by se v realitě něco takového mohlo stát, jestli byl test opakovaný atd. atd.? Pro vás, milí šťouralové, zní úloha takto: V souboru dat se vyskytuje případ P tak, že na 10.000 dat připadá jedno P. Při kontrole každého záznamu je možno určit, zda je záznam normální, nebo zda je P a... (atakdále).

Ale vsadím se, že byste i "Dva kopáči kopou příkop" dokázali rozebrat a nípat se v tom, jestli musí kopat OD SEBE a jak tedy začali, že museli začít po sobě a ne ve stejnou chvíli, že jeden tedy musel kopat delší dobu a že v zadání není řečeno nic o tom, jestli kopou JEDEN příkop (a proto že vám vyšel špatný výsledek, protože jste to POCHOPILI tak, že ... atakdále).

Mno nic.

[108] (Hekko [openID] - Mail - WWW) 06.12.2007, 13:48:41 [X] [D]
[107] Sím, já to asi pochopila špatně, jaký kopáči? :P

[109] (pixy - Mail ) 06.12.2007, 14:15:56 [X] [D]
[104], [105] Ale kdepak, já jsem si přece převedl procentní chybovost na poměr. Když je přesnost 99 %, znamená to, že správně je 99 testů z celkových 100. Tedy potažmo chybný je 1 ku 99 správným, tedy poměr chybně/správně je 1/99. Poměr a procentní zastoupení jsou přece dvě různé věci. Jestli to chcete v procentech, je ten poměr (100-p)/p. Mám to správně.

ad [105] - Davide, myslím, že opět jde o problém, který jsem zmínil na konci [48]. Troufám si tvrdit, že ten druhý případ není pravda.

Ten extrém až do nuly mě protáhnout nenapadlo, moc hezký příklad. Ostatně to sedí i v těch rovnicích - když Q jde do nekonečna, 1/Q tedy k nule, jde ta pravděpodobnost taky k nule.

[110] (Zdenda ) 06.12.2007, 14:22:54 [X] [D]
Několik poznámek ke komentářům, reakcím, citacím...
Test je spolehlivý na 99% NEZÁVISLE na tom, zda testuji zdravého, či nemocného. Chyba se vloudí zcela náhodně - všechny nemocné ohodnotí správně a pár zdravých šoupne k nemocným, nebo naopak, nebo něco mezi. Takže rozdělování do oněch skupin moc nemá smysl.

Co když si tedy udělám ještě jeden test a zase mi vyjde, že jsem nemocný. Kolik si mám udělat testů...:-)

[111] (dgx - WWW) 06.12.2007, 14:34:53 [X] [D]
[109] s tím v podstatě souhlasím, na druhý možný výklad jsem také upozorňoval ([59]). Zadání funguje jako ten obrázek se dvěma tvářemi nebo svícnem, člověk vidí buď jedno nebo druhé.

Ale tím spíš si nemyslím, že máš výpočet správně. Mně vyšlo za předpokladu Zn/Zz = Nz/Nn = 1/99, že z 10000 testů bude 10101 s negativním výsledek a -101 s pozitivním (viz [56]). V kterém místě se rozcházíme?

[112] (Johnny [openID] - Mail - WWW) 06.12.2007, 14:40:25 [X] [D]
Arthure: jde jen o jedno: Každý si myslí, že má pravdu a každý si je schopen za tím stát. A čím víc mu někdo jeho pravdu vyvrací, tím hloub se do teorie zakopává.
Když už dáváš příklad založený na matematickém výpočtu a demonstruješ ho na poměrně věrohodném modelu z praxe, nelze se divit, že lidé hledají "nematematické" ALE. Kdybys to hned zadal tou matematickou řečí jako v [107], bylo by reakcí tak čtvrtina..

Podle mě kdyby to bylo v reálu, tak 99% z těch, kterým řekli, že jsou nemocní, tak by taky opravdu zemřeli. A báli by se a to hodně... a to je přece odpověď na tvoji otázku, ne? Mají důvod se bát? No mají důvod v tom výsledku testu, přece.

To je stejné, jako když řekneš, že modrá barva je modrá a hned vyskočí pár lidí, co řekne, že modrá je vlastně žlutá+zelená. Máte pravdu oba, ale ve skutečnosti... má cenu bádat, jestli je obloha směsí žluté a zelené nebo jestli je to dáno osvitem atmosféry sluncem nebo.... prostě je modrá, ne? :-)

[113] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 15:44:49 [X] [D]
[112] ...na dlani chlup.

[114] (pixy - Mail ) 06.12.2007, 15:45:52 [X] [D]
Jestliže se někde ve výsledku objeví -101 lidí, je zaručeně chyba ve výpočtu, nikoli v zadání.

[115] ( #13 - WWW) 06.12.2007, 16:15:49 [X] [D]
Moji milí statistikové. Už jsem pochopil, kde je zakopán pes! Správně je samozřejmě to, co od začátku tvrdí třeba Roj. Jenže na dlani chlup -- je k něčemu test, jehož spolehlivost je mnohem nižší než četnost výskytu nemoci, tedy je nespolehlivý? Tím jsem se nechal zmást, Browne! Ale jednou tě dostanu :)

[116] (dgx - WWW) 06.12.2007, 16:17:01 [X] [D]
[114] myslím, že máš chybu už ve výchozím bodu:

> představte si, že se objeví nebezpečná nemoc, a přestože postihne pouze jednoho z deseti tisíc lidí.

Formálně: (Nn+Nz)/(Zz+Zn) = 1/9999 (nikoliv 1/10000)

> Lékař vám vysvětlí, že vyšetření na tuto chorobu je přesné na 99% bez ohledu na to, jestli chorobu máte nebo ne.

Zde akceptujme tvůj dvojí výklad viz [48]. Varianta a) Že o 99 % nemocných řeknu správně, že jsou nemocní, a o 99 % zdravých řeknu správně, že jsou zdraví?

Formálně:
(Nn + Zn) / (Nn + Nz) = 99/100
(Nz + Zz) / (Zn + Zz) = 99/100

(nikoliv Zn/Zz = Nz/Nn = 1/99)

Varianta b) Anebo že 99 % lidí řeknu správně jejich zdravotní stav?

Formálně: (Zz + Nn) / (Z + N) = 99/100

[117] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 16:21:30 [X] [D]
[114] Kdepak... Jak matematici vědí: Jakmile se někde objeví -101 lidí, tak stačí, aby tam 101 lidí přišlo - a pak tam nebude nikdo! ;)

[115] Těžko říct jestli k něčemu je, faktem je, že jich je v realitě spousta...

Mimochodem, Pixy, DGX: V té knize je i známá úloha s třemi dveřmi... Pamatujete? http://neskodny.own.cz/?cmt=970 To byl rachot, co? "Vidím to, ale nemůžu tomu uvěřit" ;)

[118] (pixy - Mail ) 06.12.2007, 17:08:44 [X] [D]
[116] Jsem přesvědčen, že já tam chybu nemám, a naopak ty to zašmodrcháváš. ;-)

[119] (dgx - WWW) 06.12.2007, 17:25:04 [X] [D]
[118] nene ;-))

Cituji [103]: "Ta přesnost testů udává vlastně poměr chybných ku správným, Zn/Zz, resp. Nz/Nn (za povšimnutí stojí, že přesnost může být jiná pro potvrzení a jiná pro vyvrácení podezření z nemoci, zde ji ale máme stejnou)."

To právě nemáme. Stejná by mohla být pouze tehdy, pokud by nemocí trpěla právě polovina lidí. Protože každé 1 procento chybně diagnostikovaných zdravých by vyvážilo 1 procento chybně diagnostikovaných nemocných, a tedy by chybně diagnostikovaných zdravých i nemocných muselo být stejně.

[120] (pixy - Mail ) 06.12.2007, 17:43:03 [X] [D]
[120] Nechám stranou matematické otázky a soustředím se jen na jeden detail. Z čeho prosím tě usuzuješ, že u tohohle problému platí princip "vyloučeného třetího"? Že testem diagnostikovaná nemoc a testem diagnostikované zdraví jsou disjunktní a úplné protiklady? Notabene v situaci, kdy i ty sám uznáváš, že se zde musejí rozlišovat ne dva, ale čtyři případy? Chybná/správná diagnoza u zdravého člověka je něco jiného než chybná/správná diagnoza u člověka nemocného. Chyba v testu je v obou případech jiné povahy a to, že je chybovost v obou případech stejná, je podle mě jen náhodná shoda okolností. Obecně se to asi bude většinou lišit (chybovost negativního vs. chybovost pozitivního testu).

Tohle je čtyřstavový, nikoli dvoustavový model. Zkus si představit, že vstupní podmínky jsou mírně upraveny: test nemá obecně 99% spolehlivost, ale platí, že pozitivní diagnóza je správná v 99 % případů, zatímco negativní je spolehlivá jen ze 66 %. Jak se s tím vypořádáš?

(Mimochodem nejsou podobně spolehlivé třeba testy na HIV nebo podobné nemoci? Pokud je pozitivní, jsi skutečně pozitivní s poměrně vysokou pravděpodobností - pokud je test negativní, jsi skutečně zdravý s pravděpodobností podstatně menší).

[121] (mike ) 06.12.2007, 18:28:08 [X] [D]
[115] Takovy test samozrejme smysl ma. Viz Tapinka; v praxi se test pouzije, kdyz je k tomu nejaky duvod. Treba priznaky, prislusnost k rizikove skupine apod. Tahle uloha se tvari jako ze zivota, ale ve skutecnosti je to ciste statisticka hricka. Coz je presne ten duvod, proc je vysledek pro spoustu lidi (vcetne mne) tezko akceptovatelny. Odpovida situaci, kdy by byl testovany nahodne vybran a odpovida na otazku, zda si v pripade pozitivniho vysledku ma zoufat. Jenze v zadani je "delate si starosti". Zrejme ma ke starostem nejaky duvod, coz zasadne meni situaci. Uz neni jednim clovekem z 10000, ale treba jen jednim ze sta (pokud je jeden clovek ze 100 s podobnymi priznaky skutecne nemocny). Jinymi slovy, vysledek se odviji od puvodni pravdepodobnosti, s jako by mohl byt dany clovek nemocny. Pokud ji dokazeme urcit, uloha smysl ma.

[122] (dgx - WWW) 06.12.2007, 18:45:32 [X] [D]
[120] aha, už tomu rozumím! Mrkni na ten závěr [48]:

> Co označuje těch 99 %? Že o 99 % nemocných řeknu správně, že jsou nemocní, a o 99 % zdravých řeknu správně, že jsou zdraví? Anebo že 99 % lidí řeknu správně jejich zdravotní stav? Obávám se, že zadání hovoří jen o tom prvním, a to druhé není s tím prvním ekvivalentní. Jenže všichni předpokládáme právě to.

To mě zmátlo. Totiž oba tyto výklady, nepletu-li se, ekvivalentní jsou. A já mluvil o výkladu viz [56], kde procentuálním základem není počet nemocných/zdravých, ale počet negativních/positivních výsledků.

Tož tak ;)

[123] (Arthur Dent [openID] - Mail - WWW) 06.12.2007, 18:48:49 [X] [D]
[121] Jak se srovnat s tou úkohou o kopáčích, která se tváří taky jako ze života...?

... na dlani chlup!

[124] (dgx - WWW) 06.12.2007, 18:52:30 [X] [D]
...aj, odkaz měl směřovat na [59]:

> pozitivní výsledek bude správný v 99 případech ze sta (pozitivních výsledků) & negativní výsledek bude také správný v 99 případech ze sta (negativních výsledků)

[125] ( #13 - WWW) 06.12.2007, 19:02:29 [X] [D]
[121] Podle mě ne. Když tou nemocí nebude trpět na světě nikdo (axiom), ale ten test bude pořád stejně (ne)spolehlivý. Vy sice budete mít důvodné podezření, že tu nemoc máte, test vám to dokonce potvrdí, přesto ale nemocný se 100% jistotou nebudete.

[126] (mike ) 06.12.2007, 19:08:34 [X] [D]
[121] Kopaci jsou beznemu hypochondrovi ukradeni, ale vysledky testu jsou zasadni vec ;-)

Rozdil mezi cistou a aplikovanou matematikou. Statistika sama o sobe nema pro vetsinu lidi vyznam, ale jeji aplikace uz ano. Proto je dulezite pochopit, co ta procenta ve skutecnosti znamenaji a jaky je jejich prakticky vyznam. Vysledek ulohy je neintuitivni i pro toho, kdo si to spocitat umi (jak je videt z komentaru). Snazil jsem se naznacit proc.

[127] (mike ) 06.12.2007, 19:15:05 [X] [D]
[121] Sazmozrejme zalezi na tom duvodu. Pokud je jediny duvod ten, ze si prectu priznaku nemoci a okamzite je na sobe zacnu pozorovat (viz Tri muzi ve clunu :), tak se tim nic nemeni a vysledek je stejny. Pokud jsem se pred casem zapomel s lehkou devou a ted si jdu pro jistotu udelat test na AIDS, tak mam jinou vychozi pravdepobnost, nez vetsina populace.

No, ve skutecnosti se ta vychozi pravdepodobnost stejne urcit neda. Takze se nejspis bude test overovat, pokud mozno jinym zpusobem.

[128] (mike ) 06.12.2007, 19:20:35 [X] [D]
[125] Jeste dodam (predchozi melo byt taky k tomuhle): tohle je limitni pripad. Pokud je vyskyt nemoci nulovy (pravdepodobnost 0), tak muzu mit k testu jakykoli duvod (vychozi pravdepodobnost) a stejne bude vysledna pravdepodobnost 0. S nasobenim nulou se toho moc nenadela :)

Sel bych jeste kousek dal. Vyskyt nemoci je 0 a mam 100% spolehlivy test. Vyjde pozitivni vysledek. Co ted?

[129] (Hekko [openID] - Mail - WWW) 06.12.2007, 19:42:30 [X] [D]
[128] Buď není výskyt nemoci 0, nebo test není 100% spolehlivý.

[115] No tak, jak jen ten test nastavený, mi taky přijde nesmyslný. Ale pochopila bych, kdyby "favorizoval" falešně pozitivní výsledky před falešně negativními: něco jako presumpce viny. Pokud by pravděpodobnost, že označím pozitivní vzorek jako negativní, byla téměř nulová (nebo kdyby nemoc nebyla tak vzácná), pak by lidé s pozitivním nálezem vytvořili skupinu, ve které jsou téměř všichni nemocní z původní testované skupiny, ale která je o dost menší (v tomto případě setina). Na tuhle skupinu aplikuju druhé kolo testů, nejspíš trochu jiných (a možná dražších), čímž vyloučím další zdravé.
Akorát je to tak trochu sci-fi, netuším, jestli to tak opravdu jde :)

[130] (KlepeTo - Mail - WWW) 06.12.2007, 22:25:19 [X] [D]
Mohl bych prosím požádat pana Denta, aby mi zaslal správnou odpověď na mail, či ji zde zveřejnil, poku to již nemá v plánu? ;)

[131] (Jago - Mail ) 06.12.2007, 22:33:21 [X] [D]
[128] Co teď? Kdysi jsme na koleji našemu kamarádovi, pozdějšímu velmistrovi, nadiktovali úplně šílenou šachovou pozici a když se zeptal, co dál, odpověď zněla: Bílý táhne a zblázní se. :)

[132] (pixy - Mail ) 06.12.2007, 22:55:26 [X] [D]
[130] Pokud vám [62] (a několik dalších komentářů) nestačí, drahé Klepeto, obávám se, že byste se měl začít smiřovat s faktem, že ničeho víc se vám už nedostane...

[133] (Ivan - Mail ) 06.12.2007, 23:41:56 [X] [D]
on je to trochu tažké vysvetliť, preto skusme použiť trošku
matematiky:

vezmime skupinu ľudí X
predpokladajme že X = a + b kde
a- sú chorí ľudia
b- sú zdraví
(toto berme ako fakt, v každej skupine X bude vždy a chorých a b zdravých)

takže skupinu ludí X necháme otestovať hore spomínanou metodou ktorá má uspešnosť 99%.

a výsledkom budú 4 menšie skupiny ludí:
ZZ - zdraví skutočne , zdraví výsledok testu
ZN - zdraví skutočne , NEzdraví výsledok testu
NN - NEzdraví skutočne , NEzdraví výsledok testu
NZ - NEzdraví skutočne , zdraví výsledok testu

no a mozme vyjdadrit

ZZ=0.99xa
ZN=0.01xa
NN=0.99xb
NZ=0.01xb

no a náš pacient (podla zadania teda my:), kedže mu vyšlo
že je nezdravý , može patriť do skupiny
ZN=0.01xa
alebo do skupiny
NN=0.99xb

no a prichadza vrchol,.. ake su pacientove šance ze naozaj ma chorobu ???
no to je jednoduche : NN/(NN+NZ) = 0.99b/(0.99b+0.01a)

takže pravdepodobnosť že chorobu mám je 0.99b/(0.99b+0.01a) percenta

problem ale je ze aby som naozaj vedel pravdepodobnosť vyčísliť (v percentách), potrebujem vedieť hodnoty a , b
presne hodnoty nevie nikto ale odhaduje sa že chorobu má 1 človek z 10 000 , po dosadení a=9999 b=1 ,
NN/(NN+NZ) =~ 1% ,

nazaver polemika ,
citujem zadanie:
"
Vyšetření naznačuje, že máte smrtelnou chorobu. Jste zoufalí.
A máte k tomu důvod, nebo ne?
"

mám , šanca ze umriem je 1% , pričom bežní človek má šancu že umrie na túto chorobu 0.01% čiže moja šanca je 100x vačšia !!!





[134] (Hekko [openID] - Mail - WWW) 07.12.2007, 04:39:23 [X] [D]
[133] Ovšem zadání je jinak:

Projděte si ještě jednou naznačený scénář a položte si otázku, která je na pohled velmi jednoduchá: Jaká je pravděpodobnost, že máte tuto chorobu? Odpovězte na tuto otázku.

;)

[135] (mike ) 07.12.2007, 05:10:27 [X] [D]
[134] Jenze vyse uvedena otazka je v zadani taky, kousek vys :)

[129] Jak nulovy vyskyt, tak 100% uspesnost testu jsou axiomy a o tech se nediskutuje :) Takze pozitivne testovanemu nezbude, nez se propadnout do vznikle singularity a vsechno bude zase v poradku ;-)

[136] (ag - Mail - WWW) 07.12.2007, 09:41:13 [X] [D]
Stejná úloha je taky uvedená v skvělé knížce Jiřího Anděla: Matematika náhody. (2. vyd.), Matfyzpress, Praha, 2003, 290 s., ISBN 80-86732-07-X

Jsou to teda povětšinou řešené úlohy, a hafo matematiky, jak to počítat, ale je zábava si číst i jenom zadání a řešení :)

[137] (Kondr ) 07.12.2007, 11:56:45 [X] [D]
[115] Test je zdánlivě nespolehlivý, ale opakováním se to spraví...
viz již jednou odkazovaný http://kondr.ic.cz...s=blog&t=4

[138] (KlepeTo - Mail - WWW) 07.12.2007, 12:59:35 [X] [D]
[132] díky za odkaz na ten komentář - v diskuzích tohoto druhu nezasvěcený čtenář (já) nevyzná, kdo má pravdu a kdo ne, což je celkem mizerná situace.

[139] (KlepeTo - Mail - WWW) 07.12.2007, 13:02:14 [X] [D]
Nechtěly se mi pročítat všechny příspěvky, takže snadné řešení mi uniklo - děkuji pane Pixy...btw četl jsem Vaši knihu o CSS ;)

[140] (Johnny [openID] - Mail - WWW) 07.12.2007, 13:36:14 [X] [D]
Já si prostě nemůžu odpustit ještě jeden dotaz:
Jestliže je test spoelhlivý na 99%, neznamená to náhodou, že 99% POZITIVNĚ otestovaných zemřelo? Takže mám jako pozitivně otestovaný 99% šanci, že zemřu, i kdyby otestovaných bylo 10 nebo milion a jestli nemocí trpí jeden člověk na Zemi nebo skoro všichni?

[141] (Hekko [openID] - Mail - WWW) 07.12.2007, 13:54:24 [X] [D]
[140] Tak v tomhle trvám na tom, čím jsem začínala: 99 % spolehlivost testu znamená, že každý test bude s 1% pravděpodobností chybný.
Ve velkých číslech to pak bude vypadat tak, že ze sta testů jeden bude mít chybný výsledek.

[142] (pixy - Mail ) 07.12.2007, 14:15:24 [X] [D]
[140] Celá finta je právě v tom, že 99 % pozitivně otestovaných nezemřelo. Ta implikace je totiž obráceně: z těch, co zemřeli, bylo předtím 99 % pozitivně testováno. :-)

[143] (Arthur Dent [openID] - Mail - WWW) 07.12.2007, 14:20:48 [X] [D]
Když tak na to koukám...

Už jste někdo zvažovali, že se budete šťourat v tom, že zadání nic neříká o tom, že někdo může být negativně testován, a přesto zemře, např. v důsledku autonehody, cirhózy jater nebo na následky zauzlení mozku z vašich komentářů?

[144] (Hekko [openID] - Mail - WWW) 07.12.2007, 14:28:01 [X] [D]
[143] Už to chápu - tobě vyšel test pozitivně! :)

[145] (Arthur Dent [openID] - Mail - WWW) 07.12.2007, 14:44:07 [X] [D]
[144] Jojo, ten na to zauzlení mozku...

[146] (pixy - Mail ) 07.12.2007, 14:49:40 [X] [D]
[140] Napadlo mě ještě jedno poměrně polopatické řešení - sice mírně zjednodušuje, ale je to stále v mezích dostatečné přesnosti:

Máme nemoc, která postihuje v průměru jednoho člověka z 10.000. A máme test na tuto nemoc, který se zmýlí v průměru u jednoho člověka ze 100.

Vezměme si vzorek 10.000 zdravých lidí a k nim jednoho skutečně nemocného - to téměř přesně odpovídá četnosti té nemoci ve skutečné populaci. Když tyto lidi otestujeme, náš chybový test označí plus mínus 100 zdravých lidí jako nemocné (a s velkou pravděpodobností i toho jednoho nemocného). Máme tedy 101 pozitivních testů, ale jediného skutečně nemocného. Každý, kdo měl ten test pozitivní, je tím jediným nemocným s pravděpodobností 1:101. Tedy necelé 1 %.

Už OK?

[147] (Johnny [openID] - Mail - WWW) 07.12.2007, 15:00:53 [X] [D]
[146] Jo, tohle je mi jasný už od samýho začátku. Co mi není jasný je definice spolehlivosti testu. Vy píšete, že ne všichni z těch 99% pozitivně testovaných zemřeli, ale já potom tvrdím, že v tom případě neplatí, že úspěšnost testu je 99%.

Jo a Arthie... já celou dobu chápu, v čem je vtip: ukázat, že to, co je zřejmé, tak vůbec být nemusí. Ale když já mám rád přesná zadání a přesné odpovědi. Tuhle MDŽ mále zešílela, když jsem se u každé otázky MAXI Cleveru rozčiloval... :-)

[148] (Arthur Dent [openID] - Mail - WWW) 07.12.2007, 15:07:11 [X] [D]
[146] Chudák Monouš...

- "Tati, proč je nebe modrý?"

- "Takováhle otázka... Musíš nejdřív říct, co myslíš tím NEBE. Navíc není modrý, ale někdy i dozelena, dočervena, oranžové... A v noci je černý... Teda někdy i svítí, takže není úplně černý... jen pro přesnost... PROČ BREČÍŠ...?"

[149] (Johnny [openID] - Mail - WWW) 07.12.2007, 15:08:53 [X] [D]
Ty nechápeš o co mi jde... já chci slyšet, že MÁM PRAVDU :-))

[150] (Hekko [openID] - Mail - WWW) 07.12.2007, 15:10:52 [X] [D]
[149] Na to máš ale manželku, ne Arthuroj zápisník ;)

[151] (pixy - Mail ) 07.12.2007, 16:48:50 [X] [D]
[147] Jo, Clever, to jsem taky u každé otázky rostl, wtz. "No to samozřejmě záleží, co s tim tekutým dusíkem udělají, že jo..."

[152] (running - WWW) 15.12.2007, 21:35:15 [X] [D]
150 příspěvků o tomtéž číst nebudu, takže napíšu to, co tu už určitě někdo psal, ale jsem přesvědčen že to Brown v [62] má špatně.

Protože CO znamená 99% úspěšnost? Může znamenat dvě ÚPLNĚ rozdílné věci.

1)1% všech výsledků je špatně
2)1% pozitivních výsledků je špatně a 1% negativních výsledků je špatně

Pokud by Brown obě možnosti slučoval do jedné, dopouštěl by se toho, co sám milionkrát kritizuje - tedy zdánlivou rovnost nahradil skutečnou. Což ale dělá.

Pokud by platilo 1), je všechno podle Browna - těch, co dostanou do obálky nemoc a jsou zdrávi je sice strašně moc, ale procento nějak špatných diagnostik hrozně klesne díky tomu, že je strašně málo těch, co dostanou do obálky zdraví a jsou nemocni. (a s tímhle počítají všechny výpočty, co jsem tu rychle přejel okem)

Pokud ale platí 2), je špatně jak Brown, tak většina výpočtů tady. Zopakuju znova - 1% pozitivních výsledků je špatně a 1% negativních výsledků je špatně. Nemluvím o 1% jakýchkoliv lidí(!!), ale 1% testů. Pokud platí 2), jak ale Brown v zadání tvrdí ("pozitivní i negativní výsledek bude správný v 99 případech ze sta"), tak člověk, co dostal do ruky obálku s nápisem "pozitivní", má 99% šanci, že je pozitivní.

Kdyby si ale vzal ten člověk do ruky papír a tužku tak by zjistil, že mu doktor kecal, protože kdyby spolehlivost byla 99% v obou případech tak je na zemi nula lidí (tedy Brown buď udělal v zadání chybu nebo byl špatně přeložen).:)

proč?

nejdřív se kouknu na lidi, co (by) dostali do obálky, že jsou zdrávi [+]. Jedno procento z nich je označeno chybně a jsou nemocni, označme je a - budu tu jejich situaci zapisovat třeba (+)[-]. 99x víc zdravých lidí ale správně dostane, že jsou zdrávi, tedy 99a lidí je (-)[-].

pak se kouknu na ty, co by dostali, že jsou nemocni [-]. Jedno procento je zase označeno chybně, označme je b. Tedy b lidí je (-)[+] a 99b lidí je (+)[+].

Pak ale platí, že 9999x počet OPRAVDU nemocných - (+) je počet OPRAVDU zdravých - (-). Tedy
9999(99b+a)=99a+b

tedy

9900a+98900b=0.

Protože ale a i b jsou z podstaty nezáporná čísla, tak a=0 a b=0. Pak i 99a=0 a 99b=0 a lidí je na zemi 0. Protože ale existuje minimálně doktor a vy s obálkou, tak je někde chyba v Matrixu.

[153] (running - WWW) 15.12.2007, 21:39:41 [X] [D]
a pardon, koukám, že tam mám chybu, když jsem si u těch obálek spletl na začátku každého odstavce, co jsem to vlastně značil [+] a [-], pardon :)

[154] (Ťapinka ) 17.12.2007, 13:14:49 [X] [D]
[152]Jaký je rozdíl mezi
1)1% všech výsledků je špatně
2)1% pozitivních výsledků je špatně a 1% negativních výsledků je špatně?
1) mám 100 výsledků a 1 z nich je špatně
2) mám 100 pozitivních výsledků a 1 z nich je špatně a pak mám 100 negativních výsledků a 1 z nich je špatně. To mám v dnešní době 200 všech výsledků, z nichž 2 jsou špatně, tedy 1 %, ne?