Analýza dat v neurologii
XXI. Kontingenční tabulky: test nezávislosti kategoriálních znaků
Autoři:
L. Dušek; T. Pavlík; I. Jarkovský; J. Koptíková
Působiště autorů:
Institut biostatistiky a analýz, Masarykova univerzita, Brno
Vyšlo v časopise:
Cesk Slov Neurol N 2010; 73/106(3): 315-320
Kategorie:
Okénko statistika
Úvod: co je kontingenční tabulka
V tomto díle seriálu budeme pokračovat ve výkladu testů pro kategoriální data; na řadě je velmi často používané hodnocení vztahu mezi dvěma kategoriálními znaky. Jde např. o zkoumání vztahu mezi charakteristikami pacienta a výskytem komplikací při léčbě, sledování souvislostí ve výskytu znaku u rodičů a dětí nebo testy vzájemné nezávislosti prognostických faktorů. Výklad nám usnadní předchozí díl seriálu, kde jsme vysvětlili tzv. test dobré shody. Tento test hodnotí pomocí χ2 statistiky rozdíly mezi očekávanými a pozorovanými četnostmi kategorií znaků.
Hodnotíme‑li vzájemnou souvislost dvou znaků (např. pohlaví pacienta a komplikace při léčbě), musíme oba znaky sledovat u náhodného výběru N pacientů. Výskyt obou znaků považujeme za náhodný. Získaná data zapisujeme do tabulky, která staví výskyt kategorií obou znaků proti sobě a obsahuje pozorované četnosti jednotlivých kategorií. Řádky tabulky odpovídají možným hodnotám (kategoriím) prvního znaku, sloupce pak možným hodnotám (kategoriím) druhého znaku. Jde o tzv. kontingenční tabulku (contingency table). Nejjednodušší verzi tabulky (dva znaky, každý jen o dvou kategoriích) označujeme jako tabulku 2 × 2 (příklad 1), při více kategoriích pak obecně hovoříme o tabulce R × C, kde R je počet řádků a C počet sloupců tabulky (příklad 2). Toto označení je používáno i mezinárodně. Nejjednodušší verze tabulky 2 × 2 bývá někdy označována jako čtyřpolní tabulka četností (sloužící ke srovnání dvou binárních neboli dichotomických znaků).
Znaky zpracovávané v kontingenční tabulce musí nabývat diskrétních hodnot, musí tedy jít o data nominální nebo ordinální. Spojité (kvantitativní) znaky v tabulce četností zpracovat nelze, je ale možné je rozdělit do tříd a tyto jako kategorie následně do tabulky zadat.
Test nezávislosti kategoriálních znaků
Jak vidno, sestavení kontingenční tabulky není složité, v podstatě tak zpřehledňujeme výskyt všech kombinací kategorií dvou znaků mezi N subjekty. Obdobně jednoduché je i statistické hodnocení kontingenční tabulky. Nejčastěji testovanou hypotézou je nezávislost výskytu sledovaných znaků. K hodnocení se zde standardně používá nám již známý test dobré shody s testovou statistikou, která má χ2 rozdělení. Výpočet stručně shrneme v následujících bodech, blíže jej přibližují příklady 1– 4:
- K pozorovaným četnostem v tabulce musíme vypočítat četnosti očekávané, které jsou kalkulovány pro teoretickou situaci naprosté nezávislosti výskytu sledovaných znaků.
- Testovou statistiku χ2 počítáme jako součet vážených čtverců rozdílů pozorovaných a očekávaných četností přes všechna políčka kontingenční tabulky. Jde tedy o klasický výpočet testu dobré shody, pouze počet stupňů volnosti je jiný než při porovnávání očekávaných a pozorovaných četností u kategorií jednoho znaku (díl XX seriálu). Test nezávislosti dvou znaků v kontingenční tabulce má počet stupňů volnosti roven μ = (počet řádků – 1) × (počet sloupců – 1).
- Vypočítanou hodnotu testové statistiky srovnáváme s hodnotou kvantilu rozdělení χ2, a pokud tuto hranici odpovídající zvolené hladině chyby 1. druhu (α) překročí, pak zamítáme nulovou hypotézu o nezávislosti sledovaných znaků. Zamítnutím takto postavené hypotézy prokazujeme závislost, tedy existující vztah (vazbu, asociaci) ve výskytu kategorií sledovaných znaků. Naopak nezamítnutí nulové hypotézy znamená, že oba znaky jsou ve svém výskytu nezávislé a hodnota jednoho znaku neovlivňuje podmíněné rozdělení znaku druhého a naopak.
Test dobré shody pro hodnocení nezávislosti dvou znaků je neparametrický, nicméně i on má jistá omezení daná především výrazně heterogenním nebo nízkým výskytem kategorií v kontingenční tabulce. Pro takovou situaci lze nabídnout dva alternativní postupy výpočtu:
- Yatesova korekce je doporučena, pokud v jakémkoli poli kontingenční tabulky klesne pozorovaná četnost pod 5. Za této situace je klasický výpočet χ2 testu nevhodný. Yatesova korekce je využitelná pro tabulky četností 2 × 2, kde má výsledná statistika χ2 jeden stupeň volnosti. Ze vztahu pro výpočet korigovaného testu (viz příklad 1) je patrné, že oproti nekorigovanému výpočtu statistiky χ2 odečítáme v čitateli hodnotu N/ 2, a tím číselnou hodnotu statistiky χ2 snižujeme. Budeme tedy hůře zamítat nulovou hypotézu o nezávislosti znaků (říkáme, že test je více konzervativní), neboť nižší hodnota testové statistiky pochopitelně méně pravděpodobně překročí kritickou mez.
- Fisherův exaktní test je permutační ne-parametrický test vyvinutý k hodnocení nezávislosti dvou binárních znaků; tedy dat, která lze vložit do tabulky četností 2 × 2. Výhodou je použitelnost i pro velmi malé náhodné výběry. Test byl podrobně vysvětlen ve XIV. díle seriálu.
Korekce testu dobré shody při malé velikosti vzorku jsou v literatuře doporučovány, ale i zatracovány. Snížením hodnoty χ2 snižujeme pravděpodobnost chyby 1. druhu (tedy zamítnutí platné hypotézy), ale na druhou stranu klesá naše šance rozpoznat skutečně neplatnou hypotézu (roste pravděpodobnost chyby 2. druhu). Nadto publikovaná doporučení, kdy přistoupit ke korekci, nejsou zcela jednoznačná. Těmto diskuzím se lze vyhnout následovně:
- plánovitým výběrem hodnocených subjektů o dostatečném N,
- při malém N v některých polích tabulky slučováním řádků nebo sloupců tabulky (vzácné kategorie mohou být spojeny); vždy je však možno sloučit pouze kategorie, kde to dovoluje logika nebo podstata problému,
- pokud není možné dosáhnout dostatečného N, pak je vysoce doporučenou alternativou Fisherův exaktní test, který jsme detailně rozebrali v díle XIV našeho seriálu.
Další metodou provedení testu nezávislosti kategoriálních znaků je tzv. G test. G test lze použít pro výpočet testu dobré shody, kdykoli platí pro jakoukoli buňku tabulky, že |fi,j – Fi,j| > Fi,j (viz též příklad 5).Opět tedy jde o situace, kdy je rozdělení pozorovaných četností v tabulce heterogenní a kdy je v některých polích nedostatečná četnost. G test ale není jen jakousi alternativou testu dobré shody, naopak sám χ2 test je vlastně aproximací G testu. G test je založen na principu maximální věrohodnosti (MLE, maximum likelihood estimation), což je obecná statistická metoda pro získávání odhadů. Výpočet touto metodou byl před nástupem výkonných osobních počítačů velmi náročný, a proto Karl Pearson odvodil na počátku minulého století aproximaci v podobě testu dobré shody. Nicméně dnes již aplikaci obecnějšího výpočtu nic nebrání, a v mnoha statistických programech tak naleznete vedle „obyčejného“ testu χ2 také ML χ2 (tedy maximum likelihood χ2).
Stručný přehled dalších ukazatelů asociace kategoriálních znaků
Kromě testu nezávislosti založeného na χ2 testu se v literatuře často objevují i jiné ukazatele vztahu dvou kategoriálních znaků. Jde o různé koeficienty, které aspirují i na kvantifikaci síly vztahu. Avšak ne vždy bývají tyto ukazatele přehledně vysvětleny a uživatelé si pak relativně často pletou jejich význam a někdy i názvy, které jsou dost podobné. Z tohoto důvodu jsme připravili komentovaný přehled nejvýznamnějších ukazatelů v tab. 1 a 2, jednoduchou ukázku výpočtu obsahuje příklad 6.
Je patrné, že hlavní přidaná hodnota těchto koeficientů je v měření síly vztahu, kterou vyjadřuje již sama hodnota příslušného koeficientu. Na rozdíl od hodnoty testu χ2 nabývají tyto ukazatele hodnot v známém rozsahu, například od 0 (žádný vztah) do 1 (maximální vztah). Známý rozsah možných hodnot koeficientu usnadňuje posouzení míry vztahu dvou znaků nebo srovnání výsledků analýzy v různých náhodných výběrech.
Zvláštní situaci představují kontingenční tabulky, které dávají do vztahu dvě ordinální proměnné. Zde již můžeme uvažovat i o jistém trendu v jejich případném vztahu, neboť ordinalita znamená, že kategorie znaků umíme seřadit od nejnižší po nejvyšší. Kromě obecného průkazu závislosti, který nabízí test dobré shody, zde můžeme sledovat, zda jde o závislost kladnou (oba znaky spolu v kategoriích rostou), nebo naopak zápornou. Tab. 2 krátce shrnuje dva tzv. neparametrické koeficienty korelace, které umí tento trend podchytit; škála jejich hodnot je od – 1 do +1.
Průkaz a kvantifikace závislosti ordinálních znaků jsou velmi významné i pro biomedicínské obory. Mnoho klinických a diagnostických znaků je vyjadřováno na ordinální škále (stupeň toxicity léčby, škály dosahované léčebné odpovědi, hodnocení semikvantitativních metod tzv. křížkováním apod.). Zkoumání vzájemného vztahu těchto znaků je tedy velmi důležité a budeme mu věnovat samostatně jeden z následujících dílů seriálu.
Kontingenční tabulky jako nástroj zviditelnění a konzolidace dat
Ačkoli jsou kontingenční tabulky spjaty se statistikou, celá řada oborů s nimi pracuje, aniž je využívá pro statistické testování. V ekonomice nebo v manažerském rozhodování jsou kontingenční tabulky využívány čistě jako nástroj pro zviditelnění, popis a zpřehlednění dat. Pojem kontingenční tabulka tak nalezete v manuálu mnoha softwarových produktů zaměřených na práci s daty, ale často bez výše popsané statistické nadstavby. Například nástroje pro prohlížení dat nad datovými sklady nabízejí kontingenční tabulky pro interaktivní křížení parametrů. Numerické výstupy pak pracují s procentickými přepočty původní tabulky (řádková, sloupcová nebo celková procenta) anebo graficky znázorňují marginální součty řádků a sloupců. Příklad 7 stručně ukazuje práci s kontingenční tabulkou v MS Excel. Chceme‑li ale provádět testy nezávislosti znaků a jiná statistická hodnocení, musíme sáhnout po statistickém programu (např. Statistica for Windows, SPSS, R…).
Závěrem: není test jako test
Doufáme, že jsme relativně jednoduché téma příliš nezkomplikovali. Základ hodnocení nezávislosti kategoriálních jevů je a zůstává stejný již více než sto let: sestavíme kontingenční tabulku a použijeme test dobré shody s adekvátním počtem stupňů volnosti. Avšak způsobů výpočtu a využitelných ukazatelů je mnohem více a v dnešním světě se i početně náročné postupy stávají lehce dostupnými laickému uživateli. Statistické programy nabízejí pro analýzu kontingenčních tabulek často několik ukazatelů současně, a pokud se v nich uživatel neorientuje, je vlastně obětí redundantní nabídky. Jistě jste i vy již někdy slyšeli větu: „Nabídlo mi to na stejná data několik výpočtů a pokaždé to vyšlo jinak, tak jaká je v tom věda?“ Snad je po pročtení našeho textu jasné, jaký výpočet bychom si měli v jaké situaci vybrat. To je zcela zásadní, protože zamítnutá hypotéza nezávislosti dvou znaků znamená jejich faktickou závislost nebo vazbu mezi nimi. Odtud je již jen krůček k závažným interpretacím o příčině a následku. Jistě nikdo z nás nechce publikovat tak vážné závěry na základě špatných výpočtů.
doc. RNDr. Ladislav Dušek, Dr.
Institut biostatistiky a analýz
Masarykova univerzita, Brno
e-mail: dusek@cba.muni.cz
Zdroje
Plackett RL. Karl Pearson and the Chi- Squared Test. International Statistical Review 1983; 51(1): 59– 72.
Sokal RR, Rohlf FJ. Biometry: the Principles and Practice of Statistics in Biological Research. 3rd ed. New York: Freeman 1994.
Štítky
Dětská neurologie Neurochirurgie NeurologieČlánek vyšel v časopise
Česká a slovenská neurologie a neurochirurgie
2010 Číslo 3
- Metamizol jako analgetikum první volby: kdy, pro koho, jak a proč?
- Nejčastější nežádoucí účinky venlafaxinu během terapie odeznívají
- Perorální antivirotika jako vysoce efektivní nástroj prevence hospitalizací kvůli COVID-19 − otázky a odpovědi pro praxi
- Pregabalin je účinné léčivo s příznivým bezpečnostním profilem pro pacienty s neuropatickou bolestí
Nejčtenější v tomto čísle
- Spondylogenní cervikální myelopatie
- Zlomeniny pátého bederního obratle
- Standardizace české verze The Confusion Assessment Method for the Intensive Care Unit (CAM‑ICUcz)
- Využití regionální mozkové oxymetrie jako neinvazivní metody ke sledování pacientů v neurointenzivní péči