Analýza dat v neurologii
XXXIX. Statistické nástroje pro posouzení homogenity a korekci odhadů poměru šancí a relativního rizika
Autoři:
L. Dušek; T. Pavlík; J. Jarkovský
; J. Koptíková
Působiště autorů:
Masarykova univerzita, Brno
; Institut biostatistiky a analýz
Vyšlo v časopise:
Cesk Slov Neurol N 2013; 76/109(3): 374-378
Kategorie:
Okénko statistika
V předchozím díle seriálu jsme se zabývali možnostmi grafického srovnání výstupů více asociačních studií, které jsou prováděny vzájemně nezávisle, avšak na základě stejného experimentálního plánu a se stejným cílem. Jde o studie observační (díl XXXV seriálu), uspořádané retrospektivně nebo prospektivně. Jejich nejjednodušším číselným výstupem je tabulka četností, ze které odhadujeme vliv expozice nějakým faktorem (rizikovým nebo protektivním) na výskyt sledované události („event, outcome“). Typickým způsobem hodnocení těchto dat je v díle č. XXXVI vysvětlený odhad poměru šancí („odds ratio“, OR) nebo relativního rizika („relative risk“, RR). U těchto odhadů můžeme hodnotit jejich statistickou významnost pomocí intervalů spolehlivosti nebo je můžeme vzájemně srovnávat pomocí statistických testů či grafických metod (díly č. XXXVI– XXXVIII seriálu). V předchozím díle jsme uvedli zvláštní formu grafického znázornění, která se uplatňuje především v metaanalýzách již publikovaných studií, tzv. forest plot. Nyní na tento výklad navážeme a vysvětlíme nejčastější statistické testy, jež jsou zásadní pro správnou interpretaci odhadů OR nebo RR:
- Korekční postupy (adjustace) odhadů OR nebo RR s ohledem na vliv faktorů, které mohou výsledky asociační analýzy ovlivnit nebo zkreslit.
- Testy homogenity (konzistence) více odhadů OR nebo RR, které jsou výstupem analýzy vzájemně nezávislých studií nebo nezávislých výběrových souborů dat.
Nejprve krátce uveďme, jaké studie vedou badatele ke korekci nebo srovnání více odhadů poměru šancí či relativního rizika:
- Ve všech asociačních studiích je zcela zásadní vzájemná srovnatelnost případů a kontrol (retrospektivní studie) nebo exponované a kontrolní kohorty (prospektivní studie); a to zejména ve faktorech, které mohou ovlivnit výstup analýzy. Nejsme‑li schopni takovou srovnatelnost zajistit samotným náběrem probandů, je nutná zpětná korekční analýza, jež minimalizuje riziko zkreslení výsledků.
- Zpětné srovnání výstupů již publikovaných studií s cílem zjistit, zda jsou jejich dílčí odhady OR (RR) vzájemně srovnatelné (homogenní). Při potvrzení hypotézy o homogenitě více vzájemně nezávislých odhadů OR (RR) získáváme silnější důkaz o vlivu zkoumaného faktoru na sledovaný jev, což je jeden z hlavních cílů metaanalýz již publikovaných prací. Následně můžeme dílčí studie sloučit nebo souhrnně interpretovat.
- U retrospektivních studií případů a kontrol často provádíme zpětné zařazování subjektů ve více centrech (nemocnicích) nebo ve více jinak odlišených jednotkách. Je smysluplné srovnat výsledné odhady poměru šancí po jednotlivých centrech. Potvrzení hypotézy homogenity zde znamená, že data z dílčích jednotek můžeme spojit v jeden celek bez výrazného rizika zkreslení odlišným výběrem pacientů a kontrol v některých jednotkách.
- Rovněž u prospektivních studií je možné vzájemně srovnávat odhady relativního rizika mezi nějak určenými jednotkami, např. mezi nemocnicemi participujícími na studii. Analýza slouží k odhalení jednotek, které ve výstupech neodpovídají ostatním.
Všechny typy studií uvedené v předchozím odstavci spojuje jeden společný prvek. V zásadě stojíme před úkolem zjistit, zda několik vzájemně nezávislých odhadů OR nebo RR není ovlivněno (zkresleno) vlivem nějakého dalšího faktoru, který sice není přímo předmětem studia vztahu „expozice verzus účinek“, ale může podstatně ovlivnit jeho výsledek. Takovým faktorem mohou být již zmíněné nemocnice, tedy dílčí jednotky (centra) skládající celkový soubor dat. Jiným, téměř učebnicovým, příkladem je vliv věku zařazených osob na výsledek asociační analýzy, např. „vedlejší účinky chemoterapie versus nemocniční mortalita při léčbě zhoubného nádoru“. Je zřejmé, že nežádoucí účinky cytostatické léčby se mohou na mortalitě podílet u mladých a starých pacientů různě. Pokud se v analyzovaném souboru liší věk zařazených případů a kontrol, je na místě otázka, do jaké míry věk ovlivňuje závěry analýz. U studií sledujících mortalitu se v podobné pozici jako věk velmi často vyskytují i nejrůznější komorbidity, jejichž prevalence s věkem narůstá.
Faktory, které takto mohou ovlivnit výsledek asociační analýzy typu „expozice versus účinek“, nazýváme zavádějící („confounding factor“). Vedle pojmu zavádějící faktor můžeme v literatuře také nalézt méně častá označení, jako chybový faktor, kovarianční faktor nebo kovariáta. Pokud o nich víme, snažíme se mít zavádějící faktory pod kontrolou, a minimalizovat tak riziko zkreslení výstupů asociační analýzy. Toho lze principiálně dosáhnout dvěma způsoby:
- Při samotném plánování studie, kdy očekávaný (známý) vliv zavádějícího faktoru zohledníme již ve fázi náběru subjektů do studie. To lze provést jak u prospektivních, tak u retrospektivních studií. Můžeme například omezit náběr pouze na jednu kategorii hodnot zavádějícího faktoru, a tím zabránit rozdílům v jejich výskytu ve skupině experimentální a ve skupině kontrolní. U prospektivních studií můžeme zvolit randomizační plány respektující různé úrovně zavádějícího faktoru; u retrospektivních studií obdobně zavádíme kvótami řízený tzv. matching (proporcionální vážení výskytu různých kategorií daného znaku ve skupinách případů a kontrol).
- Zpětně, tedy analýzou vlivu zavádějících faktorů na výsledek studie. V takovém případě hovoříme o korekci výsledků studie neboli o tzv. adjustaci výsledků na vliv zavádějícího faktoru. V mezinárodní literatuře zdomácněly pojmy „adjustment“ nebo „adjusted estimate of OR (RR)“. Je‑li takto korigován například vliv věku na odhad poměru šancí, označili bychom výsledný odhad jako „age-adjusted OR“.
Ačkoli se přístup uvedený výše v bodě 1může jevit jako moudřejší, zdaleka není všestranně účinný. Kontrola jednoho zavádějícího faktoru (např. vyvážení poměru pohlaví ve skupině pacientů a kontrol) totiž nezabrání problémům v jiném faktoru (např. věku). S rostoucím počtem zavádějících faktorů dříve nebo později tento přístup narazí na své limity. Nadto poměrně často zavádějící faktory dopředu neznáme nebo je jejich identifikace samotným předmětem bádání. Právě z těchto důvodů má zpětně provedená analýza homogenity odhadů OR nebo RR velký význam a testy, které dále představíme, patří v současnosti téměř do povinné výbavy nástrojů pro analýzu biomedicínských dat.
Nejprve popišme obecný postup analýzy možného vlivu zavádějícího faktoru na výsledek asociační analýzy. Celkový soubor dat (tabulka četností 2 × 2) rozdělíme do několika podsouborů právě podle úrovní (kategorií) zavádějícího faktoru, čímž získáme sadu tabulek četností k × 2 × 2, kde k značí počet kategorií zavádějícího faktoru. Tomuto dělení souboru dat dle zvoleného kategoriálního kritéria říkáme stratifikace a výsledné podskupiny nazýváme strata. Logickým vyústěním třídění je analýza zkoumající, do jaké míry zavádějící faktor ovlivňuje závěry asociační analýzy.
Standardním postupem pro tento typ analýz je tzv. Mantelův- Haenszelův (MH) odhad váženého (adjustovaného) OR nebo RR. Vlastní výpočetní postup přibližují příklady 1 a 2, zde se pokusíme stručně popsat jeho princip. Představme si celkovou vstupní tabulku četností 2 × 2, ve které zkoumáme při retrospektivním náběru exponovaných a neexponovaných jedinců vztah mezi alkoholizmem a vznikem zhoubného nádoru plic (příklad 1). Přímý výpočet poměru šancí ze získaných dat někdy označujeme jako „hrubý“ odhad OR, v mezinárodní literatuře „crude OR“. V příkladu 1 tento odhad vede prvoplánově ke kvantifikaci statisticky významného vztahu zkoumaných jevů. Avšak tento závěr může být zkreslen vlivem nerovnoměrného rozdělení kuřáků ve skupinách případů a kontrol; kouření jako zavádějící faktor může samozřejmě silně ovlivnit jak vznik tohoto onemocnění, tak i vlastní efekt alkoholizmu. Jelikož ve studii nebyl výskyt kuřáků při náběru probandů zohledněn, musíme výsledek v tomto ohledu korigovat (adjustovat). Východiskem Mantelova‑ Haenszelova výpočtu je předpoklad, že v celkovém výběrovém souboru (a tedy i v cílové populaci) je asociace ve všech stratech stejná, a tudíž v našem případě nezávislá na parametru kouření. Pokud by tomu tak bylo, pak korekce závěr studie nezmění, neboť odchylky v dílčích výpočtech poměrů šancí mezi jednotlivými straty budou způsobeny pouze náhodnými vlivy. Výsledný výpočet vede k váženému odhadu OR, který anglicky nazýváme „Mantel‑Haenszel OR“ nebo „Mantel‑Haenszel estimate of common odds ratio“ (ORMH), a můžeme pro něj odhadnout i příslušný 95% interval spolehlivosti. Z výpočtu v příkladu 1 je patrné, že Mantelův‑ Haenszelův odhad poměru šancí je váženým průměrem dílčích odhadů OR vypočítaných v jednotlivých stratech.
V diskutovaném příkladu 1 se vážený odhad ORMH velmi podstatně liší od původního hrubého odhadu, a to v důsledku nehomogenity vztahu mezi abúzem alkoholu a vznikem rakoviny plic v podskupinách daných kouřením. Vážený (adjustovaný) odhad ORMH tak zabránil vážnému zkreslení závěru studie a nadto nás upozornil, že daný vztah nelze studovat bez znalosti o kuřáctví probandů. Obdobný závěr vyplývá rovněž z příkladu 2, jenž demonstruje použití MH výpočtu v prospektivní studii odhadující vážené relativní riziko. Je zřejmé, že odhad ORMH a RRMH je silný nástroj, který umožňuje cennou korekci výstupů asociačních studií. Tím jednak zabraňuje zkreslení, ale také umožňuje samotnou identifikaci zavádějících faktorů a jejich případné další studium. Tomuto diagnostickému potenciálu MH odhadů se budeme věnovat i v příštím díle našeho seriálu.
Výklad doplníme ještě jedním testem, opět nazvaným dle jeho autorů, test dle Breslowa‑ Daye (značený také jako BD test), jehož aplikaci pro hodnocení homogenity dílčích odhadů OR dokládáme v příkladu 3. Z výpočtu je patrné, že test pracuje s váženým odhadem OR dle Mantela‑ Haenszela (ORHM) a hodnotí odchylky dílčích odhadů OR v jednotlivých stratech (značíme OR1, …k, neboť celkem máme k strat) proti hodnotě předpokládané při platnosti homogenity dílčích OR. Čím větší jsou tyto odchylky od předpokládané průměrné hodnoty, tím větší je výsledná statistika χ2 a tím větší je pravděpodobnost zamítnutí nulové hypotézy o shodě dílčích odhadů OR. BD test lze jako test homogenity aplikovat pouze v tabulkách četností k × 2 × 2. Pro systém větších tabulek (typu k × R × C) je nutné pro testy homogenity využít např. log‑lineární regresní modely, jejichž aplikaci přiblížíme v některém z příštích dílů seriálu.
Výše uvedený výklad samozřejmě nepředpokládá, že čtenář bude tyto testy počítat bez pomoci počítačů. To by bylo velmi pracné a zbytečné, neboť oba testy jsou standardní součástí nabídky komplexních statistických programů. Pro správné použití je ale nezbytné znát jejich uplatnění, přínos a interpretaci, neboť jejich závěry mohou být v medicíně velmi závažné. Zanedbání vlivu silného zavádějícího faktoru může například vést ke zcela mylnému závěru o vlivu určitého léku na mortalitu pacientů. Samozřejmě lze namítnout, že takový faktor by měl být ve studii kontrolován plánovitě a měl by být zohledněn již při zařazování probandů. To lze ale zajistit jen účinnými randomizačními plány u prospektivních studií. U studií observačních a zejména retrospektivních velmi často nelze všechny potenciální zavádějící faktory kontrolovat, a ověření jejich vlivu na výstup studie by tedy mělo být povinným zakončením každé analýzy.
S přibývajícím počtem publikovaných observačních studií nabývají analýzy nejrůznějších zavádějících faktorů na významu. Do značné míry k tomuto trendu přispívá i nástup tzv. personalizované medicíny, která směřuje, často na základě vícečetných molekulárních a genetických znaků, až k individuální optimalizaci léčebných postupů. Velký počet vysvětlujících faktorů často nejde při limitované velikosti vzorku kontrolovat prospektivně v randomizačních schématech a ke slovu přichází zpětná („post hoc“) analýza podskupin celkového souboru dat. I zde však musíme počítat s faktem, že pokud dílčí analýzy rozdělí soubor na velké množství podskupin, pak tomu musí odpovídat i adekvátní počet zařazených subjektů. V příkladech 1– 3 jsme jako stratifikační kritérium použili vždy jen jeden potenciálně zavádějící faktor. Obdobně je ovšem možné nasadit více faktorů nebo jejich úrovně zkombinovat do složitějšího třídícího kritéria, pokud to velikost souboru dat dovolí.
Při zpětné analýze již získaných dat se ovšem nabízí otázka účinnosti a samotného vlivu použité stratifikace na výsledek studie. Smysluplnost stratifikace je dána několika základními pravidly, o nichž stojí za to se zmínit:
- Velikost souboru dat zcela zásadně determinuje, co si můžeme při analýze dat dovolit. S počtem potřebných strat logicky roste i požadavek na velikost souboru. Malé soubory dat detailní studium zavádějících faktorů vůbec neumožní, a nesou s sebou tedy značné riziko zkreslení výsledků.
- Vnitřní homogenita strat je základní smysl stratifikace. Vždy chceme vytvořit takové podskupiny celkového souboru, v rámci kterých budou hodnoty zavádějícího faktoru homogenní nebo neměnné.
- Klíčový je i adekvátní počet strat, tedy počet použitých úrovní třídění zavádějícího faktoru. Kategorizace by měla být optimalizována co nejvíce s ohledem na již dosažené poznání. Je‑li např. u daného faktoru známo, že je klinicky relevantní jej třídit na tři kategorie podle určitého klíče, nemá smysl při analýze vytvářet kategorie jiné.
- Výsledkům analýzy škodí jak příliš velký počet strat (malá velikost takto vzniklých dílčích souborů dat), tak neadekvátně malý počet strat (strata zůstávají uvnitř v daném faktoru heterogenní).
Dobrá zpráva na závěr tohoto dílu zní, že pokud je stratifikace dobře nastavena, pak výpočet vážených odhadů OR nebo RR dle Mantela‑Haenszela zvyšuje statistickou sílu detekce asociace mezi zkoumanými jevy (Wallenstein a Wittes, 1993). I proto velmi často najdeme v popisu statistické analýzy klinických studií například níže uvedený text, který zde citujeme v originále pro jeho instruktivnost. Představme si hypotetickou studii, kde zpětně stratifikací zkoumáme vliv zavádějícího faktoru X na vztah mezi pohlavím probandů a výskytem určité události, „event“: „A Mantel‑ Haenszel estimate with stratification according to categories of factor X was performed and common odds ratios (ORs) with 95% confidence intervals (CIs) were calculated for between‑ group comparisons in the gender × event frequencies. Breslow‑ Day tests were applied for homogenity of the odds estimates.“
Příští díl seriálu budeme věnovat dalším příkladům odhadů OR nebo RR a jejich využití pro diagnostiku různých zavádějících faktorů v asociačních studiích.
doc. RNDr. Ladislav Dušek, Dr.
Institut biostatistiky a analýz
MU, Brno
e-mail: dusek@cba.muni.cz
Zdroje
1. Breslow N, Day NE. Classical methods of analysis of grouped data. In: Statistical Methods in Cancer Research. Volume 1 – The analysis of case‑ control studies. Lyon: International Agency for Research on Cancer 1980: 122– 159.
2. Fleiss JL, Levin B, Paik MC. Combining Evidence from Fourfold Tables, In: Statistical Methods for Rates and Proportions. 3rd ed. New Jersey: Wiley & Sons: 234– 283.
3. Mantel N, Haenszel W. Statistical aspects of the analysis of data from retrospective studies of disease. J Natl Cancer Inst 1959; 22(4): 719– 748.
4. Tripepia G, Jagerb KJ, Dekkerb FW, Zoccalia C. Stratification for confounding – part 1: the Mantel‑ Haenszel formula. Nephron Clin Pract 2010; 116(4): c317– c321.
5. Wallenstein S, Wittes J. The power of the Mantel‑ Haenszel test for grouped failure time data. Biometrics 1993; 49(4): 1077– 1087.
6. Zoccali C, Mallamaci F, Tripepi G, Parlongo S, Cutrupi S, Benedetto FA, Bonanno G, Seminara G, Fatuzzo P, Rapisarda F, Malatino LS. Chlamydia pneumoniae, overall and cardiovascular mortality in end‑stage renal disease. Kidney Int 2003; 64(2): 579– 584.
Štítky
Dětská neurologie Neurochirurgie NeurologieČlánek vyšel v časopise
Česká a slovenská neurologie a neurochirurgie
2013 Číslo 3
- Metamizol jako analgetikum první volby: kdy, pro koho, jak a proč?
- Nejčastější nežádoucí účinky venlafaxinu během terapie odeznívají
- Pregabalin je účinné léčivo s příznivým bezpečnostním profilem pro pacienty s neuropatickou bolestí
- Neodolpasse je bezpečný přípravek v krátkodobé léčbě bolesti
Nejčtenější v tomto čísle
- Mechanizmy spasticity a její hodnocení
- Lidské prionové nemoci v České republice – 10 let zkušeností s diagnostikou
- Myozitida s inkluzními tělísky se slabostí šíjových svalů a pozitivním efektem imunoglobulinu – kazuistika
- Extrakraniálně metastazující meningeomy