Umělá inteligence v medicíně a zdravotnictví: Příležitost a/nebo hrozba?
Artificial intelligence in medicine and healthcare: Opportunity and/or threat
The aim of the article to present the development of artificial intelligence (AI) methods and their applications in medicine and health care. Current technological development contributes to generation of large volumes of data that cannot be evaluated only manually. We describe the process of patient care and its individual parts that can be supported by technology and data analysis methods. There are many successful applications that help in the decision support process, in processing complex multidimensional heterogeneous and/or long-term data. On the other side, failures appear in AI methods applications. In recent years, deep learning became very popular and to a certain extend it delivered promising results. However, it has certain flaws that might lead to misclassification.
The correct methodological steps in design and implementation of selected methods to data processing are briefly presented.
Keywords:
artificial intelligence, health care, medical informatics, mobile technologies
Autoři:
Lenka Lhotská
Působiště autorů:
Fakulta biomedicínského inženýrství a Český institut informatiky, robotiky a kybernetiky ČVUT v Praze
Vyšlo v časopise:
Čas. Lék. čes. 2023; 162: 275-278
Kategorie:
Přehledový článek
Souhrn
Současný technologický vývoj přispívá ke generování velkých objemů dat, která nelze vyhodnocovat pouze manuálně. Vývoj metod umělé inteligence a jejich aplikace v medicíně a zdravotnictví umožňuje podporu procesu péče o pacienta technologiemi a metodami analýzy dat. Existuje mnoho úspěšných aplikací, které pomáhají v procesu podpory rozhodování, zejména při zpracování komplexních vícerozměrných heterogenních a/nebo dlouhodobých dat. Na druhé straně se v aplikacích metod umělé inteligence objevují neúspěchy. V posledních letech se stalo velmi populární hluboké učení, které do jisté míry přináší slibné výsledky. Má však určité nedostatky, které mohou vést k chybné klasifikaci.
V článku jsou stručně představeny správné metodické kroky při návrhu a implementaci vybraných metod pro zpracování dat.
Klíčová slova:
umělá inteligence, zdravotnictví, lékařská informatika, mobilní technologie.
ÚVOD
Informační a komunikační technologie se staly nevyhnutelnou a téměř neoddělitelnou součástí našeho života. Byly úspěšně zavedeny do všech průmyslových odvětví i do odvětví služeb, včetně zdravotnictví a lékařství. A termín eHealth se začal používat pro činnosti ve zdravotnické praxi, které jsou podporovány elektronickými procesy a komunikací. Tento termín zahrnuje různé typy systémů, jako jsou elektronické zdravotní záznamy, telemedicína, zdravotnická informatika pro spotřebitele, správa zdravotnických znalostí, systémy pro podporu lékařského rozhodování či mHealth (využití mobilních zařízení pro různé aplikace ve zdravotnictví).
Moderní zdravotnictví je vysoce specializované. Komplexní vyšetření jednoho pacienta zahrnuje mnoho odborných konzultací a laboratorních vyšetření. Lékařské znalosti, vyšetření a léčba jsou zpravidla rozloženy funkčně, geograficky a také časově. Pro splnění všech požadavků a zajištění odpovídající podpory rozhodování je žádoucí využití flexibilní inteligentní softwarové podpory. Postupně se objevují aplikace metod umělé inteligence (AI), která představuje vhodný přístup k analýze velkých heterogenních vícerozměrných a multimodálních dat.
V dalším textu se budeme alespoň stručně věnovat umělé inteligenci, možnostem využití ve zdravotnictví a medicíně a také problematice dat, která jsou klíčová zejména pro naučení metod hlubokého učení nebo velkých jazykových modelů.
ZROD A VÝVOJ UMĚLÉ INTELIGENCE
Počátky mechaniky a „formálního“ uvažování se datují do starověku, kdy o těchto tématech začali diskutovat filozofové a matematici. Poté přišli autoři beletrie s umělými tvory a roboty (Mary Shelleyová: „Frankenstein“ a Karel Čapek: „R.U.R.“). Jádro umělé inteligence se objevilo ve 40. a na počátku 50. let 20. století s formulací Turingova testu a Turingovými argumenty pro existenci inteligentních strojů, po nichž následovalo prohlášení Johna von Neumanna, že počítače v krátké době dosáhnou, nebo dokonce překonají intelektuální schopnosti člověka. V roce 1953 Claude Shannon a Alan Turing vytvořili první šachové programy pro von Neumannův počítač.
Oficiálním datem zrodu umělé inteligence jako výzkumné disciplíny je workshop na Dartmouth College v roce 1956 (1, 2), kde pojem „umělá inteligence“ definoval John McCarthy. Allen Newell, Herbert Simon (oba z Carnegie Mellon University), John McCarthy, Marvin Minsky (oba z Massachusetts Institute of Technology) a Arthur Samuel, kteří se tohoto workshopu zúčastnili, se stali zakladateli a vedoucími představiteli výzkumu umělé inteligence. Poté se objevilo mnoho nápadů a implementací: General Problem Solver (1957), Lisp (1958), Perceptron (1962), Adaline (1962), Eliza (1965), rezoluce (dokazování tvrzení v predikátové logice; 1960).
Konec 60. a první polovina 70. let přinesly určité rozčarování a konec velkých předpovědí. Toto období lze nazvat „návratem do reality“. Problémy byly řešeny na triviální úrovni. Předpokládalo se, že mnohé problémy lze řešit pomocí výkonnějšího hardwaru. Byl to také konec univerzálních metod, protože snaha vyvinout obecné systémy řešení problémů selhala a ukázala, že obecné znalosti jsou „slabé“, zatímco specializace přináší „silné znalosti“. 70. léta přinesla mnoho aplikací znalostních a expertních systémů. Známými příklady jsou Dendral (konstrukce molekulární struktury na základě spektrometrických měření), MYCIN (diagnostika krevních infekčních chorob, využití práce s nejistotami, dosažení expertní úrovně), Prospector (pravděpodobnostní expertní systém, doporučení perspektivních ložisek molybdenu). V roce 1977 Goldstein formuloval důležité tvrzení, že základním problémem umělé inteligence není nalezení několika obecných metod, ale spíše otázka jak reprezentovat velký objem znalostí ve formě umožňující jejich efektivní využití a interakci.
V 80. letech 20. století se umělá inteligence stala průmyslovým odvětvím. Vyšší výkon počítačů umožnil koncem 80. let úspěšný návrat neuronových sítí. Internet a distribuované výpočty urychlily vývoj nových metod a jejich aplikací v širokém spektru oblastí. A tento trend pokračuje dodnes.
Které oblasti dnes patří do umělé inteligence? Tradičními oblastmi jsou automatizované uvažování, dokazování teorémů a hraní her, expertní a znalostní systémy, zpracování přirozeného jazyka a sémantické modelování, robotika, plánování a rozvrhování, rozpoznávání (strojové vidění, rozpoznávání řeči), strojové učení, evoluční techniky, neuronové sítě a paralelní distribuované zpracování, distribuovaná umělá inteligence a multiagentové systémy a v neposlední řadě filozofie umělé inteligence.
Přístupy zahrnují statistické metody, výpočetní inteligenci a tradiční symbolickou umělou inteligenci. V rámci AI se používá mnoho nástrojů, včetně různých algoritmů vyhledávání a matematické optimalizace, umělých neuronových sítí a metod založených na statistice či pravděpodobnosti. AI čerpá inspiraci z informatiky, matematiky, psychologie, lingvistiky, filozofie a mnoha dalších oborů. Vynikajícím průvodcem historií a hlavními oblastmi AI je kniha Nilse Nilssona (3) a v českém prostředí série knih „Umělá inteligence“ (4).
AI V MEDICÍNĚ A ZDRAVOTNICTVÍ
Rychlý technologický rozvoj v posledních dvou desetiletích 20. století a v obou desetiletích 21. století změnil charakter zdravotní péče a mnoha druhů lékařských vyšetření. Do diagnostiky a terapie byly zavedeny pokročilé technologie, které kromě jiného znamenaly generování velkých objemů dat. Nutným prvkem se tak stalo přímé propojení přístrojů s počítači. Celý tento vývoj zvýšil význam lékařské informatiky a následně umělé inteligence jako oboru, který umožňuje vytvářet systémy pro podporu rozhodování, klasifikační či prediktivní systémy s využitím metod strojového učení a další typy aplikací. Obecně lze říci, že algoritmy umělé inteligence je možné s výhodou použít tam, kde je potřeba zpracovávat velké objemy dat a kde je lze využít pro rutinní úlohy. Nicméně musíme mít vždy na paměti, že finální rozhodnutí musí učinit lékař. Tudíž systémy s AI jsou v roli systémů pro podporu rozhodování. Podívejme se nyní na několik příkladů použití metod AI ve vybraných oblastech medicíny.
Přímo průkopnickou oblastí pro aplikace metod umělé inteligence v medicíně jsou zobrazovací metody. Například v radiologii způsobily malou revoluci algoritmy, které jsou schopny analyzovat lékařské snímky s pozoruhodnou přesností. Navíc zvládnou v krátkém čase mnohonásobně větší počty snímků než člověk. V současnosti v této oblasti najdeme nejčastěji algoritmy hlubokého učení, zejména konvoluční neuronové sítě, které jsou využívány pro analýzu rentgenových snímků, CT a MRI. Například společnost DeepMind, patřící pod Google, vyvinula systém nazvaný DeepMind AI, který byl naučen na dostatečném objemu kvalitních medicínských dat a dokázal s vysokou přesností odhalovat ze snímků sítnice oční choroby, jako jsou diabetická retinopatie a makulární degenerace.
Další oblastí, ve které se využívají zejména metody strojového učení, včetně metod hlubokého učení, je analýza biologických signálů (např. EKG, EEG, PSG). Výhodné je toto zpracování hlavně u mnohakanálových a dlouhodobých záznamů, kdy i pouhé označení „podezřelých“ průběhů znamená velkou časovou úsporu pro lékaře při stanovování diagnózy. V dnešní době už někteří výrobci dodávají přístroje se softwarem, který má metody umělé inteligence integrované. Řada vyvinutých systémů umožňuje tzv. semiautomatickou analýzu, kdy lékař může vstupovat do interakce se systémem během tvorby řešení a korigovat navržená řešení na základě svých znalostí. Tento postup se ukazuje jako velmi výhodný zejména v případech, kdy je vysoká interpersonální variabilita v datech.
Velni zajímavou nastupující oblastí využití generativních metod AI je chemie, dokonce se daná část označuje přímo názvem „generativní chemie“. Pomocí generativních metod AI se navrhují nové molekuly a nové chemické struktury s požadovanými vlastnostmi. Tím je možné urychlit proces objevování nových léčiv. Příkladem firmy, která se na tuto cestu vydala, je Insilico Medicine, která pomocí generativních algoritmů objevila již více kandidátů na léčiva proti plicní fibróze a několika typům nádorů.
JAZYKOVÉ MODELY A PROBLEMATIKA KVALITY DAT, INFORMACÍ A ZNALOSTÍ
Velmi atraktivní jsou i pro zdravotnictví velké jazykové modely, jejichž možnosti nám v poslední době představily nástroje jako ChatGPT (OpenAI), Gemini (Google) či LLaMA (Meta). Asi většina z nás neodolala a zkusila některý z těchto nástrojů požádat o vygenerování nějakého textu. Na takových pokusech se dá dobře ilustrovat, jaké jsou možnosti těchto nástrojů. Čím bude totiž zadané téma obecnější, tím blíže realitě bude vygenerovaný text. U velmi specializovaného tématu se snadno může stát, že text bude povrchní, a někdy dokonce ani nebude pravdivý. Zjednodušeně řečeno, daný velký jazykový model je jen tak dobrý, jak dobrá jsou data, na kterých se naučí. To znamená, že když se bude učit na obecných informacích dohledatelných na přístupných stránkách na internetu, bude dobře popisovat odpovídající témata. Nedokáže ale vysvětlit úzce zaměřené téma, o němž na internetu není dostatek zdrojů.
Tím jsme se dostali přímo ke klíčovému problému všech rozhodovacích procesů, kterým je kvalita dat, informací a znalostí. Možná se ptáte, proč uvádím právě tyto 3 pojmy. Ony totiž spolu velmi úzce souvisejí, jak si hned ukážeme.
Data
Data představují obrazy reálného světa v abstraktních souborech. Pomocí symbolů převzatých z těchto množin data odrážejí různé aspekty skutečných objektů nebo procesů probíhajících v reálném světě. Většinou jsou data definována jako fakta nebo pozorování. Data jsou výsledkem procesu měření nebo pozorování. Často se získávají jako výstup ze zařízení převádějících fyzikální veličiny na abstraktní symboly. Taková data jsou dále zpracovávána lidmi nebo stroji. Lidské zpracování dat zahrnuje širokou škálu možností, od nejjednodušší instinktivní reakce až po aplikace nejsložitějších induktivních či deduktivních vědeckých metod. Stroje zpracovávající data představují rovněž širokou škálu možností, od jednoduchých děrnoštítkových nebo magnetických záznamových zařízení až po nejsložitější počítače či roboty.
Informace
Slovo „informace“ se často používá, aniž by se pečlivě rozlišovalo mezi různými významy, jichž během své historie nabylo. Obecně se jím označuje zjištění nebo poznatky týkající se faktů, událostí, věcí, lidí, myšlenek nebo pojmů, tedy určitý odraz reálných nebo abstraktních objektů či procesů. Obvykle se skládá ze složky syntaktické (struktura), sémantické (význam) a pragmatické (cíl).
Informace lze tedy definovat jako data, která byla transformována do smysluplné a užitečné podoby pro konkrétní osoby. Data, jejichž původ je nám zcela neznámý, mohou jen stěží přinést nějakou informaci. Takovým datům musíme „rozumět“. Představa o tom, kde a za jakých podmínek data vznikla, je důležitým kontextem každé zprávy a je třeba ji vzít v úvahu, když zjišťujeme informační obsah zprávy. Zdroje dat se tak stávají důležitými součástmi toho, co budeme dále nazývat informačními zdroji.
Znalosti
Pojem „znalosti“ souvisí s pojmem jazykové ontologie. V rámci tohoto modelu lze s pojmem znalosti zacházet ve specifičtějším smyslu. Vychází z předpokladu, že existuje univerzum (ontologie) sestávající z objektů, které mají určité vlastnosti a mezi nimiž probíhají určité vztahy. Dále předpokládáme, že existuje jazyk, v němž lze ontologii popsat. Pojem znalosti se používá především intuitivně. V rámci modelu „jazyk – ontologie“ lze jeho význam vymezit konkrétněji. Znalost budeme chápat jako pravdivou větu týkající se ontologie formulovanou v základním jazyce.
To, jaká máme k dispozici data, tedy velmi významně ovlivňuje kvalitu rozhodování systému, který jsme na daných datech naučili. Příprava vstupních dat není snadná disciplína a z hlediska časové náročnosti představuje nejdelší etapu ve vývoji systému. Platí dlouholetou praxí ověřená poučka, že ze špatných dat nelze nikdy získat kvalitně naučený systém. Stejně tak je nutné dávat pozor na to, abychom měli data správně vyvážená, abychom nevytvořili systém, který nebude nestranný k určité kategorii dat, jež se mohou na vstupu systému objevit. (Pozn.: Více k tomto tématu např. v periodicích Artificial Intelligence in Medicine, International Journal of Medical Informatics, Computer Methods nebo Programs in Biomedicine.)
PŘÍLEŽITOSTI A HROZBY SPOJENÉ S AI
Příležitosti
Umělá inteligence nabízí mnoho metod pro zpracování velkého množství dat, pro jejich analýzu (klasifikaci, predikci, plánování atd.). Metody AI se často používají pro zpracování vícerozměrných a multimodálních dat včetně signálů a obrazů. Pomáhají při rychlejším a efektivnějším vyhledávání ve velkých zdrojích. Je zřejmé, že mají potenciál pro medicínu založenou na důkazech a pro zdravotní péči „5P“ (participativní, prediktivní, preventivní, personalizovaná, precizní).
Mezi nejčastěji používané metody patří strojové učení, obvykle v úlohách predikce, klasifikace a rozpoznávání vzorů. V současné době existují dvě velké skupiny algoritmů, které se liší přístupem k analýze dat. „Tradičnější“ přístup uplatňuje jako první krok extrakci popisných rysů ze surových dat a poté se používají metody buď s učitelem, nebo bez něj, jako je např. rozhodovací strom, support vector machine (algoritmus s podpůrnými vektory), náhodný les nebo shluková analýza. Druhý přístup používá jako vstup do algoritmu přímo surová data. V takovém případě se používají neuronové sítě různého druhu. Každý z těchto přístupů má své výhody a nevýhody. Hlavní výhodou „tradičního“ přístupu je, že výsledky jsou vysvětlitelné a interpretovatelné, což není případ neuronových sítí. Na druhé straně však existují úlohy/data, u nichž neuronové sítě dosahují mnohem lepších výsledků.
Může se objevit otázka: Jak bychom měli rozhodnout o výběru nejlepší metody? Prvním krokem je pochopení původních dat a problémové oblasti. Poté se musíme ptát, zda je nutné vysvětlení a interpretace výsledků, nebo zda je výsledek jako takový uspokojivý. V neposlední řadě si můžeme ve spolehlivých zdrojích ověřit, jaký přístup byl na podobná data použit dříve.
Hrozby
Metody umělé inteligence jsou poměrně výkonné a úspěšné při řešení mnoha predikčních a klasifikačních úloh. Musíme si však uvědomit některé hrozby, které souvisejí s nesprávným použitím dat, metod apod. Uveďme si nejčastěji identifikované v aplikacích a recenzovaných článcích.
Nesprávné použití dat při vývoji klasifikačních nebo predikčních systémů může vést k nesprávnému rozdělení dat na trénovací, testovací a validační množinu. Tyto 3 množiny musejí být nezávislé. Data od jednoho pacienta nesmějí být použita ve všech, ale pouze v jedné z nich. Jinak není natrénovaný model dostatečně robustní a není schopen dobře klasifikovat nová data. Jedinou výjimkou je situace, kdy se snažíme vyvinout personalizovaný model pro jednoho konkrétního pacienta, trénujeme ho na jedné podmnožině jeho dat a testujeme na jiné podmnožině.
Výše jsme se zmínili o nutnosti porozumět problémové doméně a původu dat. Tento aspekt je velmi důležitý, protože nepochopení problémové domény a původu dat může vést k volbě nevhodných metod jejich zpracování, včetně filtrování šumu, zpracování chybějících dat, identifikace artefaktů, rozhodování o odlehlých hodnotách atd. Stejně tak by nepochopení mohlo vést k nesprávné interpretaci výsledků nebo nesprávně provedenému ověření navržených řešení.
Fascinace „módními“ metodami je někdy zavádějící. Představa, že taková metoda může vyřešit všechny nové problémy, je zavádějící. Proto je důležité dobře znát možnosti a meze jednotlivých metod a dokázat kriticky zhodnotit jejich nasazení a získané výsledky (1).
ZÁVĚR
Zdravotnictví jako aplikační oblast AI má velký potenciál pro implementaci mnoha systémů umělé inteligence do různých fází cyklu péče, populačních a epidemiologických studií a dalších souvisejících oblastí. Ve všech případech představují data, informace a znalosti jádro rozhodovacích procesů. Systémy pro podporu rozhodování byly původně zamýšleny jako aplikace pro úzké skupiny specialistů, v posledních letech ovšem můžeme pozorovat přechod k širšímu využití.
Všechny aplikace zpracovávají data a informace. Konečný výsledek v podobě doporučení, nebo dokonce rozhodnutí je velmi závislý na kvalitě dat a informací, nejen na jejich množství. To znamená, že kvalitu je třeba správně chápat a data a informace odpovídajícím způsobem ověřovat. Hlavními vlastnostmi, které by se měly kontrolovat, jsou úplnost, konzistence, platnost, přesnost, redundance, čitelnost, přístupnost, důvěryhodnost a užitečnost.
Výměna dat, informací a znalostí je žádoucí, klade však požadavky na komunikační protokoly a datové struktury vysoké úrovně, aby si odesílatel a příjemce vzájemně rozuměli. V této souvislosti hovoříme o interoperabilitě na úrovni dat, informací, znalostí a procesů. S tím souvisejí otázky, které nebylo možné z důvodu rozsahu v tomto článku diskutovat, a to ochrana osobních údajů, etika a právní předpisy. Vývoj nových aplikací však vždy vyžaduje zvážit všechny tyto otázky.
Adresa pro korespondenci:
doc. Ing. Lenka Lhotská, CSc.
Fakulta biomedicínského inženýrství a Český institut informatiky, robotiky a kybernetiky ČVUT
Jugoslávských partyzánů 1580/3, 160 00 Praha 6
e-mail: lenka.lhotska@cvut.cz
Zdroje
- Heaven D. Why deep-learning AIs are so easy to fool. Nature 2019; 574 (7777): 163–166.
- The Dartmouth AI Archives. Dostupné na: https://raysolomonoff.com/dartmouth
- Nilsson N. The Quest for Artificial Intelligence: A History of Ideas and Achievements. Cambridge University Press, New York, 2009.
- Mařík V, Štěpánková O, Lažanský J a kol. Umělá inteligence 1–6. Akademie věd ČR. Academia, Praha, 1993–2013.
Štítky
Adiktologie Alergologie a imunologie Angiologie Audiologie a foniatrie Biochemie Dermatologie Dětská gastroenterologie Dětská chirurgie Dětská kardiologie Dětská neurologie Dětská otorinolaryngologie Dětská psychiatrie Dětská revmatologie Diabetologie Farmacie Chirurgie cévní Algeziologie Dentální hygienistkaČlánek vyšel v časopise
Časopis lékařů českých
- Metamizol jako analgetikum první volby: kdy, pro koho, jak a proč?
- Testování hladin NT-proBNP v časné diagnostice srdečního selhání – guidelines ESC
- Horní limit denní dávky vitaminu D: Jaké množství je ještě bezpečné?
- Nejčastější nežádoucí účinky venlafaxinu během terapie odeznívají
Nejčtenější v tomto čísle
- Umělá inteligence v medicíně a zdravotnictví: Příležitost a/nebo hrozba?
- Využití umělé inteligence v zobrazovacích metodách
- Otazníky a dotazníky kolem akutního klimakterického syndromu
- Trendy plodnosti a potratovosti v Česku