Umělá inteligence zlepšuje screening karcinomu prsu
Artificial intelligence improves breast cancer screening
Rychlý rozvoj strojového učení (zejména hlubokého) podporuje jeho využití ke zpřesnění screeningu nádorových onemocnění. Hodnocení screeningové mamografie je v Česku prováděno nezávisle dvěma radiology. Zapojení umělé inteligence do algoritmu druhého čtení mamografických snímků přispívá ke zvýšení specifity a sensitivity mamografického vyhodnocování.
Neuronová síť dokáže zachytit vstupní obraz a na základě natrénovaných číselných parametrů (vah), kterým je přirazena konkrétní hodnota, definuje vlastnosti, které se ve snímcích hledají, což ovlivňuje konečný výsledek mamografického vyšetření.
Cílem zavedení umělé inteligence je lepší záchyt maligních nádorů v časném stAdiu a zároveň snížení falešně negativních nebo pozitivních mamografických nálezů s následnou redukcí doplňujících vyšetření, což povede k ekonomickému zefektivnění screeningového procesu.
Keywords:
artificial intelligence – breast cancer – breast screening – neural network
Autoři:
Livia Večeřová 1; Daniela Kuklová 2
Působiště autorů:
Radiodiagnostické oddělení Fakultní nemocnice Na Bulovce, Praha
1; Trask Solutions, a. s., Praha
2
Vyšlo v časopise:
Čas. Lék. čes. 2021; 160: 323-328
Kategorie:
Přehledový článek
Souhrn
Rychlý rozvoj strojového učení (zejména hlubokého) podporuje jeho využití ke zpřesnění screeningu nádorových onemocnění. Hodnocení screeningové mamografie je v Česku prováděno nezávisle dvěma radiology. Zapojení umělé inteligence do algoritmu druhého čtení mamografických snímků přispívá ke zvýšení specifity a senzitivity mamografického vyhodnocování.
Neuronová síť dokáže zachytit vstupní obraz a na základě natrénovaných číselných parametrů (vah), kterým je přirazena konkrétní hodnota, definuje vlastnosti, které se ve snímcích hledají, což ovlivňuje konečný výsledek mamografického vyšetření.
Cílem zavedení umělé inteligence je lepší záchyt maligních nádorů v časném stadiu a zároveň snížení falešně negativních nebo pozitivních mamografických nálezů s následnou redukcí doplňujících vyšetření, což povede k ekonomickému zefektivnění screeningového procesu.
Klíčová slova:
umělá inteligence – karcinom prsu – screening prsu – neuronová síť
ÚVOD
Preventivní vyšetření prsu probíhá radiodiagnostickou vyšetřovací metodou – mamografickým vyšetřením. Analýzu a hodnocení provádí zkušený radiolog. Každé screeningové centrum musí mamograficky vyšetřit nejméně 5000 žen ročně a současně alespoň jeden lékař centra musí ročně zhodnotit mamografie nejméně u 3500 žen, včetně druhého čtení (1).
Celosvětově je nepodkročitelnou normou hodnocení preventivní screeningové mamografie dvěma lékaři nezávisle na sobě, a protože v nemocnicích, a nejenom českých, mamodiagnostici chybějí, v některých státech zkoušejí práci jednoho z nich nahrazovat umělou inteligencí (AI – artificial intelligence). Výsledky testů ukazují, že umělá inteligence zvyšuje přesnost hodnocení vyšetření a umí rozeznat nálezy, které lidské oko nevidí.
Umělá inteligence kombinuje pokročilou a prediktivní analytiku. Využívá hluboké neuronové sítě a nejmodernější IT technologie. I když návrhy prvních umělých neuronových sítí v 50. letech byly inspirovány zkoumáním procesů uvnitř lidského mozku, dnešní umělé neuronové sítě se liší v mnoha aspektech od těch biologických (2). V případě mamodiagnostiky jsou neuronové sítě využity při analýze obrazu.
Mamodiagnostik v průběhu dne odečte 70–100 mamografických nálezů. I když si dá pauzu, jeho oči jsou přirozeně unavené. Pozornost umělé inteligence však zůstává po celou dobu stoprocentní. Navíc analýza pomocí AI je v porovnání s lidským faktorem méně časově náročná. Aktuálně mamodiagnostici zkoumají jeden snímek zhruba 64 sekund. Přitom mají najít jakékoliv sotva viditelné změny. Když odborníci ve Fakultní nemocnici Na Bulovce měřili, jak dlouho to trvá dvojici člověka a stroje, dostali se na hodnotu skoro poloviční. To by mohlo znamenat významnou úsporu v zemích, kde se na mamografické vyšetření čeká až půl roku. Veškeré zpracování informací zabere maximálně minuty, a tak by jednou ženy mohly získávat prvotní vyhodnocení svých snímků dříve, než po prohlídce opustí ordinaci lékaře.
HISTORIE A VÝVOJ V OBLASTI UMĚLÉ INTELIGENCE
Umělá inteligence je obor informatiky, který se zaměřuje na strojově řízenou inteligenci. Vychází z předpokladu, že stroje dokážou interpretovat, těžit a učit se z vnějších dat a funkčně napodobovat kognitivní postupy, které se připisují lidem. AI je založena na představě, že lidské myšlenkové procesy lze replikovat i mechanizovat.
Geneze automatizace a umělé inteligence sahá do dob starověkého Řecka. Stanfordská profesorka Adrienne Mayor ve své knize „Bohové a roboti“ analyzuje nejstarší projevy umělých autonomních strojů v řecké mytologii. Prvním známým robotem byl automatizovaný bronzový obr Talos, který byl vyroben Héfaistem. Bůh ohně a metalurgie navrhl také okřídlenou přilbu a sandály. Hermovi propůjčily schopnost doručovat informace kamkoliv, a to rychlostí převyšující rychlost ostatních olympských bohů. Tyto a mnohé další příběhy z řecké mytologie vyjadřují témata umělé inteligence a všudypřítomnosti, které jsou základem mnohých příslibů moderních digitálních technologií (3).
Mezi první automatizovaná zařízení patří plně funkční mechanický orchestr. Vznikl ve 3. století př. n. l. v Číně.
Významný podíl na technologickém rozvoji mají arabské země. Polymatik Al-Džazárí popisuje padesát mechanických zařízení, z nichž některé jsou považovány za rané prototypy mnoha moderních technologií. S myšlenkou automatizace a robotů, které budou vykonávat lidskou práci, Al-Džazárí přišel 250 let před Leonardem da Vinci a předvedl ji na několika technologických novinkách, které vyvinul (4).
V roce 1822 britští matematici Ada Lovelace s Charlesem Babbagem vyvinuli „analytický stroj“ poháněný parou, který je považován za historicky první programovatelný počítač. Autorkou prvního počítačového programu je také Ada Lovelace.
Ve 40. letech 20. století navrhl „otec kybernetiky“ Norbert Wiener první samoregulační a samoopravné systémy, které vedly k integraci automatického pilota do letadel. Wiener měl zásadní vliv na výzkum umělé inteligence především poznáním, že inteligence je v podstatě výsledkem mechanismů zpětné vazby. První krok k umělým neuronovým sítím, jež se v současnosti používají v hlubokém učení, učinili v roce 1943 Warren McCulloch a Walter Pitts, kteří vyvinuli výpočetní metody napodobující funkčnost biologických neuronů.
Po druhé světové válce se problematikou umělé inteligence zabývala celá řada vědců, matematiků a filozofů. Mezi nimi také britský polymatik Alan Turing, který objevil matematickou možnost umělé inteligence. V roce 1950 zveřejnil studii pod názvem „Počítačové stroje a inteligence“. Její součástí je tzv. Turingův test, který se zabýval otázkou, zda počítače dokážou myslet. Vycházel z jednoduchého předpokladu – počítač projde testem, pokud s ním člověk dokáže 5 minut konverzovat, aniž by si uvědomil, že hovoří s počítačem (5). Turingův test vedl mnoho vědců a vývojářů k úvahám o tom, co vlastně tvoří podstatu našeho lidství. Zároveň je inspiroval k tomu, aby počítače učili komunikovat přirozenějším a lidštějším způsobem.
Podle průzkumu mezi předními odborníky na umělou inteligenci lze s 50% pravděpodobností očekávat, že umělá inteligence bude srovnatelná s lidskou do roku 2050. Do roku 2075 by měla být umělá inteligence přetvořena do superinteligence, která mnohonásobně předčí duševní schopnosti člověka (6).
UMĚLÁ INTELIGENCE JAKO VĚDA
Počítačový systém s umělou inteligencí vytváří předpovědi, na základě vzorů provádí ve stávajících datech akce a dokáže se učit z vlastních chyb, čímž zvyšuje svou přesnost. Vyspělá AI zpracovává nové informace mimořádně rychle a přesně. Je užitečná zejména pro komplexní scénáře, jako jsou virtuální asistenti, autonomní vozidla nebo programy pro rozpoznávání obrazu.
Tyto technologie jsou spojovány se strojovým a hlubokým učením. Strojové učení je podoblastí umělé inteligence. Hluboké učení je podoblastí strojového učení a hluboké neuronové sítě tvoří páteř hlubokého učení. Hluboké neuronové sítě jsou definovány jako struktury, které mezi vstupní a výstupní vrstvou obsahují alespoň jednu skrytou vrstvu.
Zpracováním, analýzou a extrakcí relevantních předpokladů z dat získaných strojovým učením se zabývá datová věda. Datoví vědci hledají skryté vzory v datech a využívají strojové učení k predikci budoucích událostí.
Strojové učení představuje proces, podle kterého počítačové systémy postupují, aby dosáhly umělé inteligence (obr. 1).
Základní premisou strojového učení je propůjčit počítačovým systémům schopnost lidské inteligence prostřednictvím samostatného učení z okolního prostředí. Strojové učení proto probíhá bez explicitního programování – pravidla, podle kterých se systém rozhoduje, si vytváří samostatně na základě analyzovaných dat (7). Z toho důvodu se strojové učení uplatňuje zejména v oblastech s vysokou komplexitou úkolů, kde je manuální vytvoření algoritmu člověkem příliš komplikované (např. rozpoznávání mluvené řeči) (8).
Když se model strojového učení natrénuje tak, aby svůj úkol prováděl dostatečně rychle a přesně na to, aby byl užitečný a spolehlivý, znamená to, že dosáhl omezené AI.
Hluboké učení je pokročilým typem strojového učení. Základním stavebním kamenem hlubokého učení je hluboká neuronová síť – struktura, která mezi vstupní a výstupní vrstvou obsahuje nejméně jednu skrytou vrstvu.
Hluboké učení zpravidla vyžaduje rozsáhlou datovou sadu, na které se může učit – trénovací sady pro hluboké učení se dnes běžně skládají i z milionů datových bodů. Hluboká neuronová síť po natrénování na těchto rozsáhlých sadách dat dokáže lépe generalizovat než mělká síť. Díky tomu je užitečná pro aplikace rozpoznávající obraz nebo k trénování AI, která překonává lidské dovednosti ve složitých hrách, jako jsou šachy nebo go.
Rychlý progres v oblasti informatiky a výpočetní techniky způsobil, že umělá inteligence se stává nedílnou součástí moderní zdravotní péče. Algoritmy a další aplikace založené na AI se používají k podpoře lékařských odborníků v klinickém prostředí a při probíhajícím výzkumu.
V současné době se AI nejčastěji využívá jako podpora při klinickém rozhodování a analýze zobrazovacích metod. V oblasti lékařského monitorování se nástroje umělé inteligence používají k analýze snímků z výpočetní tomografie, magnetické rezonance nebo rentgenu a dalších vyšetřovacích zařízení s cílem najít léze nebo jiné nálezy, které by radiolog mohl přehlédnout.
Mezinárodní výzkum se zaměřením na detekci rakoviny prsu (9) ukázal, že AI využívající umělé neuronové sítě může být při odhalování příznaků karcinomu i dalších onemocnění stejně účinná jako radiologové.
UMĚLÁ INTELIGENCE A NÁDORY PRSU
Mezinárodní agentura pro výzkum maligních nádorů (IARC) odhaduje, že celosvětově se u 1 z 5 lidí vyvine během života maligní nádor, 1 z 8 mužů a 1 z 11 žen se stane i příčinou jejich úmrtí (11, 12).
Global Cancer Observatory (GCO) je webová platforma, on-line databáze poskytující odhady incidence a mortality pro 36 typů maligních nádorů ve 185 zemích světa. Světová incidence nově diagnostikovaných nádorů prsu u žen byla pro rok 2018 odhadnuta na 2 088 849 (25 % z celkového počtu diagnostikovaných malignit). V Evropě ve stejném roce byla incidence odhadnuta na 522 513 nádorů prsu (28 % z celkového počtu diagnostikovaných malignit). Ve stejném roce byl ve světě odhadovaný počet úmrtí na karcinom prsu 626 679 žen (15 % z celkového počtu úmrtí na zhoubné nádory). Z tohoto počtu v Evropě byl odhadovaný počet úmrtí 137 707 žen (16,2 % z celkového počtu úmrtí na maligní nádor). Celosvětově kumulativní riziko vzniku maligních nádorů prsu u žen do 75 let věku dosáhlo 5 %, v Evropě 8 % (13).
GCO pro rok 2020 odhaduje, že zhoubným nádorem prsu onemocní nově 2,3 milionu žen, což představuje 11,7 % ze všech nových případů různých typů maligních nádorů. Zhoubný nádor prsu je z hlediska úmrtnosti celosvětově na 5. místě (685 tisíc ročně). Maligní nádor prsu u žen představuje 1 ze 4 všech diagnostikovaných zhoubných nádorů a 1 ze 6 všech úmrtí na maligní nádor. Pro rok 2020 představoval nádor prsu první místo v incidenci ve velké většině zemí (159 ze 185 sledovaných zemí) a v mortalitě ve 110 zemích (14, 15).
Předpokládá se, že více než 50 % maligních nádorů prsu vzniká bez zjištění jednoznačné příčiny. Literatura uvádí, že 10–11 % zhoubných nádorů prsu vzniká na podkladě genetické predispozice (16), zejména v důsledku vrozené mutace tumor supresorových genů BRCA1 a BRCA2. Průměrné kumulativní riziko karcinomu prsu u nosiček mutace BRCA1 je 65 % do 70 let věku, u nosiček mutace BRCA2 je to 45 % (17).
Jedním z účinných preventivních onkologických programů je mamografický screening (18). Jedná se o pravidelné preventivní vyšetření prsní žlázy s kontrolou kvality diagnostického procesu. Toto preventivní vyšetření bylo zavedeno ve vyspělých zemích od 90. let 20. století (19). Mamografické vyšetření umožňuje zjistit v rámci screeningu vyšší podíl minimálních karcinomů (neinvazivních karcinomů a invazivních karcinomů do maximální velikosti 10 mm).
V současnosti používané zobrazovací metody v mamodiagnostice pravděpodobně již dosahují nebo dosáhly svého maxima tím, že jsou schopné detekovat ložiska o minimální velikosti 3–5 mm. Dnešní diagnostika nádorů prsu vychází více z morfologického obrazu nádorových změn než z etiologie a více z fenotypu než genotypu zjištěného maligního ložiska. U nehmatných ložisek s nulovým nebo minimálním maligním potenciálem se předpokládá, že dlouhodobě neprogredují do invazivních lézí. Při diagnostice minimálních nádorů prsu by ženy nemusely být vystaveny standardní onkologické a radioterapeutické léčbě a mohly by absolvovat personalizovanou onkologickou léčbu se zachováním plné kvality života (20).
V roce 2014 byla publikována odborná studie EUROCARE-5, která na základě onkologických registrů 29 zemí Evropy analyzovala 10 typů onkologických onemocnění (21). Jejím cílem bylo srovnání parametrů 5letého relativního přežití, tedy kolik pacientů s konkrétním onemocněním se dožije 5 let od data stanovení diagnózy, přičemž je brána v úvahu úmrtnost v běžné populaci. Výsledky studie potvrdily celoevropský trend v prodloužení 5letého přežití onkologických pacientů a zároveň i rozdíly v 5letém přežití mezi jednotlivými státy. Nejlepších výsledků dosahují státy severní a střední Evropy, státy východní Evropy se pohybují pod celoevropským průměrem. Výjimku tvoří Česko u nádorů prsu, kde je dosahováno 5letého přežití v 78 % případů (v celé Evropě je to 81,8 % případů).
Karcinom prsu má multifaktoriální etiologii a jedinou spolehlivou možností je jeho včasná diagnostika s následnou úspěšnou léčbou (22, 23). Snížení míry úmrtí na maligní nádor prsu můžeme dosáhnout dvojí strategií. Strategie včasné diagnostiky, která se uplatňuje v zemích s málo nebo méně rozvinutou zdravotní péčí, spočívá v posílení edukace žen a snížení překážek k přístupu k diagnostickým vyšetřením. Screeningová mamografie je pro tyto země nákladově neefektivní, protože do programu vstupují ženy s již vyvinutými příznaky onemocnění. Včasnou diagnostiku je proto potřeba nejdříve zaměřit na snížení záchytu pokročilých stadií nádorového onemocnění u žen s již vyvinutými příznaky onemocnění. V zemích s dobře rozvinutou zdravotní péčí spočívá strategie screeningu v populačním, kontrolovaném a organizovaném preventivním vyšetření asymptomatických žen (24, 25). Celoplošně organizovaný, kontrolovaný a celostátně vyhodnocovaný screening karcinomu prsu může splnit cíl sekundární prevence, jako je snížení mortality na toto onemocnění (26).
Mamografie je radiodiagnostická metoda, která je po klinickém vyšetření prsu nejstarší a klinicky nejvyužívanější vyšetřovací metodou. Mamograf je rentgenový přístroj využívající nízkou energie a měkké záření. Digitální mamografie zajišťuje optimalizaci celého vyšetřovacího řetězce. Digitalizace umožňuje mamografické snímky v postprocesingu dodatečně upravovat, zvětšovat a zdůrazňovat hledané struktury. Velkoplošná digitální mamografie (FFDM – full-field digital mammography) zároveň poskytuje snížení dávkových veličin a zdokonalení kontrastních poměrů, mamografické senzitivity a specificity. Při odhadu radiačního rizika stochastických účinků lékařského ozáření se vychází ze znalosti efektivních dávek a absorbovaných dávek v orgánech těla, s korekcí na věk pacienta v době vyšetření. Při modelové situaci, kdy žena starší 45 let absolvuje během života přibližně 13 preventivních mamografických vyšetření, se počet případů radiačně indukovaného nádoru prsu pohybuje přibližně okolo 55 na 100 tisíc žen, tedy 0,055 %. Toto riziko ve srovnání k výskytu nádoru prsu v populaci lze považovat za velmi nízké (27).
V Česku probíhá od září 2002 celoplošný, organizovaný a auditovaný mamografický screening. Rutinní screening všech českých žen ve věku nad 45 let zajišťuje současná síť 72 mamografických center akreditovaných ministerstvem zdravotnictví. Screeningový program centrálně řídí na celostátní úrovni Komise pro screening nádorů prsu MZ ČR. Na jeho organizaci a kontrole se odborně podílí Asociace mamodiagnostiků ČR (28).
Do září 2002 existoval v naší zemi oportunní screening, který byl nahrazen celoplošným mamografickým screeningem s kontrolovanou kvalitou procesu. Zpočátku byl screeningový interval nastavený pro skupinu žen ve věku od 45 do 69 let. Tento limit byl zrušen a došlo k rozšíření věkového intervalu nad 69 let.
Hodnocení screeningové mamografie v Česku nezávisle dvěma radiology zahrnuje určení typologie prsní žlázy podle Tabára (29), která informuje o poměru fibroglandulárních struktur k tukové tkáni v prsu. Podle tohoto hodnocení určujeme 5 typů žlázy. Základní rozdělení je na redukující a neredukující typ žlázy. Redukující typy žlázy mají vysokou mamografickou senzitivitu se zastoupením fibroglandulární tkáně v 50 % a méně. Mezi ně patří typy žlázy označované Tabár I, II, III. Neredukující nebo minimálně redukující typy žlázy mají pro svoji vysokou denzitu na mamografických snímcích sníženou mamografickou senzitivitu. Obsahují více než 75 % fibroglandulární tkáně. Tyto typy žlázy označujeme Tabár IV, V. V případě diagnostické nejistoty je u nich k vyloučení falešně pozitivních nálezů častěji indikované doplňující vyšetření. Dalším problémem neredukujících typů žlázy jsou menší přehlédnuté či intervalové nádory nebo diskrétní změny architektoniky žlázy, u kterých může být konečný nález vyšetření podhodnocen. Interpretace mamografických snímků je ovlivněna určitou mírou falešně pozitivních a falešně negativních výsledků.
K minimalizaci počtu podhodnocených a nadhodnocených nálezů a zároveň zvýšení senzitivity mamografického vyšetření se ve světě testují modely s využitím druhého čtení mamografických snímků umělou inteligencí. Autoři v minulém roce publikované studie sestavili reprezentativní soubor mamografických vyšetření z Velké Británie a z USA (30). Při použití AI zjistili absolutní snížení falešně pozitivních výsledků o 5,7 a 1,2 % (USA a Velká Británie) a snížení falešně negativních výsledků o 9,4 a 2,7 %. V této nezávislé studii překonala AI všechny lékaře hodnotící mamografické snímky o 11,5 %. Při simulaci, ve které se systém AI podílel na procesu dvojitého čtení, dosahovala senzitivita čtení mamografických snímků 88 %. Integrace AI do standardních postupů při hodnocení mamografických snímků by pomohla snížit počet zbytečných biopsií indikovaných k ověření nejistých mamografických nálezů a zároveň lze očekávat zvýšení počtu diagnostikovaných minimálních neinvazivních nádorů.
V retrospektivní studii, ve které byl validován algoritmus použití AI na 170 230 mamografických vyšetření získaných z 5 zdravotnických zařízení v Jižní Koreji, USA a Velké Británii (31), bylo potvrzeno, že diagnostika nádorových změn při kombinaci čtení mamografických snímků radiologem a AI byla vyšší, než když mamografické snímky hodnotí dva radiologové nezávisle na sobě. AI byla lepší při hodnocení nádorových změn zejména ve stadiu T1 (nádory do velikosti 10 mm) a nádorových změn bez postižení lymfatických uzlin. Významné zlepšení výkonu radiologů při hodnocení mamografických snímků za pomoci umělé inteligence podporuje myšlenku aplikace umělé inteligence jako plnohodnotného nástroje do standardního diagnostického řetězce.
V další retrospektivní studii autoři srovnávali systém AI při hodnocení mamografických snímků s hodnocením snímků radiology a porovnávali přesnost a efektivitu jednotlivých hodnocení. Výsledky hodnocení mamografických snímků při detekci nádorových změn umělou inteligencí nebyly horší než hodnocení 101 snímků radiology (9). Je studiemi doložený předpoklad, že spojení člověka a umělé inteligence při hodnocení mamografických snímků reálně povede k většímu počtu diagnostikovaných nádorů v časném stadiu a zároveň dojde ke snížení falešně negativních a falešně pozitivních mamografických nálezů, čímž se sníží počty doplňujících vyšetření po screeningové mamografii. Redukce doplňujících vyšetření povede k efektivnímu snížení nákladů celého screeningového procesu.
ZE SYSTÉMU CAD AŽ KE KONVOLUČNÍM NEURONOVÝM SÍTÍM
Technologická revoluce v oblasti analýzy lékařských snímků s využitím hlubokého učení a neuronových sítí mění celé odvětví zdravotní péče, které je na zobrazovací technice závislé (9).
Jak již bylo nastíněno, studie o využití umělé inteligence odhalily perspektivní a zajímavé výsledky – AI v kombinaci s lékařem vykázala výrazné snížení pracovní zátěže včetně větší specifičnosti i citlivosti vyšetření. Toto zjištění může významným způsobem ovlivnit celkový proces vyhodnocování mamografických snímků. Využití AI jako „třetího oka“ pomůže lékařům diagnostikovat s větší přesností a zachytávat nálezy, na které lidské oko nestačí (obr. 2).
Rychlý rozvoj strojového, zejména hlubokého učení podporuje zájem radiologie o jeho využití ke zlepšení přesnosti screeningu rakoviny. Rakovina prsu je v rámci onkologických diagnóz po rakovině tlustého střeva a konečníku druhou nejčastější příčinou úmrtí u ženské populace v Česku (32). Včasná diagnostika screeningovou mamografií snižuje úmrtnost pacientek až o 40 % (33). Navzdory těmto přínosům je screeningová mamografie spojena s vysokým rizikem falešně pozitivních i negativních výsledků.
S cílem pomoci zlepšit prediktivní přesnost screeningové mamografie byl vyvinut software pro počítačem podporovanou detekci a diagnostiku (CAD4 podle anglického computer aided design neboli počítačem podporované projektování), který se v klinické praxi používá od 90. let 20. století. Multicentrická studie z roku 2014 poukázala na skutečnost, že první konvenční systémy CAD nevedly k významnému zlepšení výkonnosti a jejich pokrok stagnoval po více než deset let od jejich zavedení (34).
Pozoruhodné úspěchy hlubokého učení v oblasti vizuálního rozpoznávání, detekce objektů i v mnoha dalších oblastech (35) vzbudily velký zájem o vývoj nástrojů hlubokého učení, které by pomohly radiologům a zlepšily přesnost screeningové mamografie. Nedávné studie ukázaly, že systém CAD založený na hlubokém učení si vedl stejně dobře jako radiologové v samostatném režimu a zlepšil výkon mamodiagnostiků v režimu podpory (9).
Hluboké učení představuje skupinu metod strojového učení zaměřenou na vývoj vícevrstvých neuronových sítí (36). Tato nová generace algoritmů je z velké části založena na konvolučních neuronových sítích (ConvNet neboli CNN). Jsou složeny z řady jednoduchých matematických operací seskupených do vrstev, které analyzovaný obraz postupně rozkládají na stále menší komponenty. V závislosti na síti může následovat opětovné složení těchto složek do obrazu stejné nebo podobné velikosti jako původní vstup, přičemž se učí prostorově související charakteristiky, které určují předem definovanou základní pravdu na každé úrovni.
V závislosti na povaze a záměru algoritmu může být výstupem jedno binární pozitivní/negativní rozhodnutí nebo skóre pravděpodobnosti malignity pro každou zjištěnou lézi. Druhá možnost může zahrnovat tepelnou mapu se zvýrazněním oblasti, které obsahuje charakteristiky použité ke konečné klasifikaci. U mamogramů s výskytem karcinomu to obvykle znamená samotnou rakovinu, ale stejně jako v případě lidské interpretace může být konečná klasifikace ovlivněna také vzory retrakcí nebo charakteristikami kůže.
Architektura konvoluční neuronové sítě je velmi podobná struktuře běžných neuronových sítí. Je konstruována stohováním konvolučních vrstev na vstup, následovaným jednou nebo více plně propojenými vrstvami, jež se spojí s výstupem klasifikace.
ConvNet dokáže zachytit vstupní obraz a na základě natrénovaných číselných parametrů (vah), kterým je přirazena konkrétní hodnota, definuje vlastnosti, které se ve snímcích hledají, což ovlivňuje konečný výsledek mamografického vyšetření. Tyto hodnoty určuje během procesu trénování sám software.
Trénink sítě probíhá opakovaným zobrazováním různorodých snímků s nálezy včetně správných výstupů. Hodnoty vah se pokaždé upravují tak, aby síť dospěla k co možná nepřesnějšímu výstupu. Počítač se tedy naučí rozlišovat maligní útvary od normální tkáně a benigních nálezů sám, bez učení programátorem. To je hlavní rozdíl mezi algoritmy CAD a algoritmy založenými na umělé inteligenci (37). Úkolem ConvNet je redukce obrazů do snadno zpracovatelné podoby bez ztráty vlastností, které jsou rozhodující k získání správné diagnostiky. Výsledkem je rychlejší a přesnější detekce nálezů.
Umělou inteligenci s výkonem srovnatelným s mamodiagnostiky lze tedy aplikovat různými způsoby. K nejvýznamnějším patří aplikace předběžného výběru nebo využití AI jako kontrolního oka při analýze screeningu konkrétního pacienta a jeho porovnání s miliony souborů dat, na nichž byla technologie vytrénována. To, co se člověk učí dlouhá léta, umělá inteligence zvládne během několika dnů se srovnatelnými výsledky.
Motto radiologů zní: „Čím více mamografických snímků zhodnotíte, tím máte větší zkušenost a jistotu v diagnostice minimálních maligních nálezů v prsu.“ Stejné pravidlo platí i pro strojové učení a neuronové sítě s tím, že počítač se může vše naučit za podstatně kratší dobu než radiolog. Pokud radiolog věnuje příliš mnoho času analýze snímků, čas na interpretaci klinických souvislostí se zkracuje a stává se z něj pouhý analytik obrazu. Proto by umělá inteligence neměla být vnímána jako hrozba pro radiologii. Ve skutečnosti představuje obrovskou příležitost pro její zlepšení. Radiologové nebudou nahrazeni stroji, protože radiologická praxe by měla být mnohem více než pouhá interpretace snímků (38).
ZÁVĚR
Mamodiagnostické oddělení Fakultní nemocnice Na Bulovce ve spolupráci s týmem expertů z oddělení Data Science společnosti Trask ověřovalo spolehlivost umělé inteligence, která byla vytrénovaná na sadě milionu anonymizovaných mamografických snímků. Poté byl tento vytrénovaný model ověřen na vybraných snímcích v nemocničním prostředí. Velká část z nich záměrně obsahovala histologicky ověřené benigní nálezy, nálezy s přítomností přednádorových změn či nálezy s nenápadnými nádory, které jsou pro lidské oko téměř neviditelné. Testování ukázalo, že umělá inteligence dokáže vyhodnotit změny, o které v preventivním programu jde. Tedy změny, které nejsou hmatné a které se často projevují jenom diskrétní změnou architektury žlázy nebo okrskem polymorfních shluklých mikrokalcifikací. Umělá inteligence tak může ve spolupráci s lékaři plnit funkci supervizora.
Čestné prohlášení
Autorky práce prohlašují, že v souvislosti s tématem, vznikem a publikací tohoto článku nejsou ve střetu zájmu a vznik ani publikace článku nebyly podpořeny žádnou farmaceutickou firmou.
Seznam zkratek
AI umělá inteligence
CAD počítačem podporované projektování (computer aided design)
ConvNet konvoluční neuronová síť (convolutional neural network)
GCO Global Cancer Observatory
Adresa pro korespondenci:
MUDr. Lívia Večeřová, Ph.D., MBA
Radiodiagnostické oddělení FN Na Bulovce
Budínova 67/2, 181 00 Praha 8
Tel.: 739 561 437
e-mail: livia.vecerova@bulovka.cz
Zdroje
- MZ ČR. Doporučený standard pro poskytování screeningu karcinomu prsu a provádění diagnostické mamografie v ČR. Věstník MZ ČR 2010; 4: 4–34.
- Eluyode OS, Akomolafe DT. Comparative study of biological and artificial neural networks. Euro J Appl Eng Sci Res 2013; 2: 36–46.
- Mayor A. Gods and Robots. Princeton University Press, Princeton, 2020.
- Turan RI. Medieval robots: How al-Jazari's mechanical marvels have been resurrected in Istanbul. Middle East Eye 2019 Mar 1. Dostupné na: www.middleeasteye.net/discover/medieval-robots-turkey-how-science-genius-al-jazari-brought-mechanical-marvels-istanbul
- Turing A. Computing machinery and intelligence. Mind 1950; 59: 433–460.
- Müller VC, Bostrom N. Future progress in artificial intelligence: a survey of expert opinion. Springer, Berlin, 2016.
- Mitchell TM. The Discipline of Machine Learning. Carnegie Mellon University, Pittsburgh, 2006.
- Rodriguez-Ruiz A, Lång K, Gubern-Merida A et al. Stand-alone artificial intelligence for breast cancer detection in mammography: comparison with 101 radiologists. J Natl Cancer Inst 2019; 111: 916–922.
- Grønning T. History of Cancer. In: Colditz GA (ed.). The SAGE Encyclopedia of Cancer and Society. SAGE Publications, California, 2015.
- The Global Cancer Observatory. In: Cancer Today. International Agency For Research On Cancer, Lyon, 2019. Dostupné na: https://gco.iarc.fr/today/data/factsheets/cancers/20-Breast-fact-sheet.pdf
- Breast Cancer Screening. In: IARC Handbooks of Cancer Prevention, vol. 15. International Agency for Research on Cancer, Lyon, 2016.
- Ferlay J, Colombet M, Soerjomataram I et al. Estimating the global cancer incidence and mortality in 2018: GLOBOCAN sources and methods. Int J Cancer 2019; 144: 1941–1953.
- Sung H, Ferlay J, Siegel RL et al. Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin 2021; 71: 209–249.
- Breast cancer statistics: Breast cancer is the most common cancer in women worldwide. World Cancer Research Fund International. Dostupné na: www.wcrf.org/dietandcancer/cancer-trends/breast-cancer-statistics
- Hoda SA, Brogi E, Koerner FC, Rosen PP. Rosen’s Breast Pathology. Lippincott Williams & Wilkins, Philadelphia, 2014.
- Antoniou A, Pharoah PDP, Narod SA et al. Average risks of breast and ovarian cancer associated with BRCA1 or BRCA2 mutations detected in case series unselected for family history: a combined analysis of 22 studies. Am J Hum Genet 2003; 72 (5): 1117–1130.
- New European recommendations for breast cancer. In: EU Science Hub: The European Commission's science and knowledge service. European Commision, Bruxelles, 2019. Dostupné na: https://ec.europa.eu/jrc/en/news/new-european-recommendations-breast-cancer
- Deandrea S, Uluturk A, Neamtiu L et al. Presence, characteristics and equity of access to breast cancer screening programmes in 27 European countries in 2010 and 2014. Results from an international survey. Prev Med 2016; 91: 250–263.
- Narod SA. Personalised medicine and population health: breast and ovarian cancer. Hum Genet 2018; 137: 769–778.
- De Angelis R, Sant M, Coleman MP et al. Cancer survival in Europe 1999–2007 by country and age: results of EUROCARE-5 – a population-based study. Lancet Oncol 2014; 15: 23–34.
- Byrne C, Schairer C, Wolfe J et al. Mammographic features and breast cancer risk: effects with time, age, and menopause status. J Natl Cancer Inst 1995; 87: 1622–1629.
- Dušek L, Žaloudík J, Abrahámová J a kol. Webový portál SVOD: epidemiologie zhoubných nádorů v České republice v on-line dostupných analýzách a zpravodajství. In: Abrahámová J (ed.). Vybrané otázky onkologie IX. Galén, Praha, 2005: 140–142.
- Májek O, Daneš J, Skovajsová M et al. Breast cancer screening in the Czech Republic: time trends in performance indicators during the first seven years of the organised programme. BMC Public Health 2011; 11: 288.
- Oberaigner W, Geiger-Gritsch S, Edlinger M et al. Reduction in advanced breast cancer after introduction of a mammography screening program in Tyrol/Austria. Breast 2017; 33: 178–182.
- Dušek L, Mužík J, Malúšková D a kol. Incidence a mortalita nádorových onemocnění v České republice. Klinická onkologie 2014; 27: 406–423.
- Kodl O, Jursíková E, Daneš J, Tomášek L. Přínos a radiační riziko při mamografickém screeningu za období 2003–2007. Česká radiologie 2009; 63: 342–347.
- Asociace mamodiagnostiků České republiky. AMA-CZ. Dostupné na: www.mamo.cz/?pg=asociace-mamodiagnostiku
- Gram IT, Funkhouser E, Tabár L. The Tabár classification of mammographic parenchymal patterns. Eur J Radiol 1997; 24: 131–136.
- McKinney SM, Sieniek M, Godbole V et al. International evaluation of an AI system for breast cancer screening. Nature 2020; 577: 89–94.
- Kim H, Kim HH, Han BK et al. Changes in cancer detection and false-positive recall in mammography using artificial intelligence: a retrospective, multireader study. Lancet Digit Health 2020; 2: 138–148.
- ÚZIS. Celková zátěž zhoubnými novotvary v ČR. Ústav zdravotnických informací a statistiky, Praha, 2021.
- Oeffinger KC, Fontham ETH, Etzioni R et al. Breast cancer screening for women at average risk: Guideline update from the American Cancer Society. JAMA 2015; 314: 1599–1614
- Cole EB, Zhang Z, Marques HS et al. Impact of computer-aided detection systems on radiologist accuracy with digital mammography. Am J Roentgenol 2014; 203: 909–916.
- LeCun Y, Bengio Y, Hinton G. Deep learning. Nature 2015; 521: 436–444.
- Ribli D, Horváth A, Unger Z et al. Detecting and classifying lesions in mammograms with deep learning. Sci Rep 2018; 8: 4165.
- Kooi T, Litjens G, van Ginneken B et al. Large scale deep learning for computer aided detection of mammographic lesions. Med Image Anal 2017; 35: 303–312.
- Pesapane F, Codari M, Sardanelli F. Artificial intelligence in medical imaging: threat or opportunity? Radiologists again at the forefront of innovation in medicine. Eur Radiol Exp 2018; 2: 35.
Štítky
Adiktologie Alergologie a imunologie Angiologie Audiologie a foniatrie Biochemie Dermatologie Dětská gastroenterologie Dětská chirurgie Dětská kardiologie Dětská neurologie Dětská otorinolaryngologie Dětská psychiatrie Dětská revmatologie Diabetologie Farmacie Chirurgie cévní Algeziologie Dentální hygienistkaČlánek vyšel v časopise
Časopis lékařů českých
2021 Číslo 7–8
- Metamizol jako analgetikum první volby: kdy, pro koho, jak a proč?
- Jak a kdy u celiakie začíná reakce na lepek? Možnou odpověď poodkryla čerstvá kanadská studie
- Horní limit denní dávky vitaminu D: Jaké množství je ještě bezpečné?
- Testování hladin NT-proBNP v časné diagnostice srdečního selhání – guidelines ESC
Nejčtenější v tomto čísle
- COVID-19, postkovidový syndrom a postvakcinační komplikace v neurologické ambulanci
- Manuál k elektronickému zdravotnictví
- Mitochondrie – od vzniku po dnešní terapeutické možnosti
- Právní rámec telemedicíny jako způsobu poskytování zdravotní péče