Měření simulace – Test mince v ruce
Authors:
M. Preiss 1,2; T. Příhodová 1,3; M. Raisová 1,3; J. Maliňáková 1; N. Minarčíková 4; J. Marková 5; D. Krámský 5
Authors‘ workplace:
Národní ústav duševního zdraví
Klecany
1; University of New York in Prague
2; 3. LF UK v Praze
3; Pedagogická fakulta LF UK v Praze
4; Policejní akademie ČR, Praha
5
Published in:
Cesk Slov Neurol N 2017; 80/113(3): 307-315
Category:
Original Paper
doi:
https://doi.org/10.14735/amcsnn2017307
Tato studie je výsledkem badatelské činnosti podporované Grantovou agenturou České republiky, reg. č. 15-03615S, dále je studie výsledkem badatelské činnosti podporované projektem číslo LO1611 za finanční podpory MŠMT v rámci programu NPU I.
Overview
Účelem této studie je představit a zavést do klinické praxe nový skríningový nástroj Test mince v ruce (Coin in the Hand Test) pro detekci předstírání zdravotních potíží.
Cíl:
Cílem této práce je zjistit maximální výkon v Testu mince v ruce a dále zjistit, v jaké míře jsou pokusné osoby schopny předstírat oslabený výkon tak, aby jejich snaha o záměrné zkreslení výsledků nebyla poznána.
Soubor a metodika:
Test mince v ruce byl administrován v první studii (N = 153) zdravým dobrovolníkům ke zjištění schopnosti adaptace na tři scénáře s manipulací výkonu, přičemž 1 = snaha o maximální výkon, 2 = snaha o závažnou simulaci, 3 = snaha o mírnou simulaci. V druhé studii jsme test administrovali v individualizovaném vyšetření u hospitalizovaných psychiatrických pacientů.
Výsledky:
Při standardní instrukci k maximálnímu výkonu byl průměrný výkon blízký maximu 10 bodů (M = 9,59; SD = 1,41; 1– 10), při závažné simulaci nejnižší (M = 4,63; SD = 2,39; 0– 10) a při mírné simulaci se nacházel mezi předchozími hodnotami (M = 6,78; SD = 1,74; 1– 10). Porovnáním odlišného pořadí jednotlivých scénářů jsme zjistili významný vliv pořadí na výsledky v testu.
Závěr:
Poměrně dobrá schopnost Testu mince v ruce odlišit osoby se snahou podávat záměrně horší výkon od osob, které nejsou motivovány k vyšetření a nedostatečně se snaží podat dobrý výkon, je povzbuzením pro zařazení testu do klinické praxe.
Klíčová slova:
Test mince v ruce – simulace – nedostatečné úsilí
Úvod
V rámci běžné klinicko-diagnostické praxe, ale i v oblasti forenzní praxe musí někdy odborníci řešit případy, kdy mají u pacienta podezření na záměrné zkreslování výsledků v diagnostických testech a předstírání potíží nebo onemocnění. K podezření na záměrnou snahu předstírat určité potíže nebo zhoršovat výsledky v testových metodách vedou lékaře nejčastěji anamnestické údaje (např. dlouhodobá nezaměstnanost, soudní spor po úrazu atd.). Lékaři řeší případy, kdy pacientem uváděná symptomatika obtíží neodpovídá komplexnímu klinickému vyšetření a není doplněna ani objektivním nálezem z dalších vyšetření. V psychodiagnostické praxi se psychologové v rámci vyšetření setkávají u pacienta s rozporuplnými výsledky v jednotlivých testech a s nezvládáním obecně snadných úloh oproti náročnějším. V rámci psychodiagnostického vyšetření je při podezření na záměrné zhoršování výsledků důležité rozlišit mezi nedostatečnou snahou podávat dobré výkony nejčastěji z důvodu nedostatečného zájmu o vyšetření a skutečnou snahou předstírat deficit v oblasti kognice, chování nebo osobnosti.
Složitou problematiku diagnostiky předstírání příznaků nemoci nebo onemocnění (tzv. simulace) ukazuje výstižně Román o Ivanu Blatném, významném českém básníkovi (1919– 1990) [1]. Blatný strávil na psychiatii naprostou většinu času během let 1948– 1990. Poprvé zhruba na 2 roky v roce 1941 s cílem ukrýt se před gestapem. Později sám básník v Anglii uvádí, že předstíral duševní chorobu, aby se vyhnul totálnímu nasazení. Od roku 1948 byla hospitalizace vzhledem k zestátnění zdravotnictví zdarma a tehdy byl Blatný hospitalizován na psychiatrii podruhé, a to na mnoho let. V roce 1982 Blatný v rozhovoru uvedl, že by nechtěl přijít o pohodlí, které na psychiatrii má, že „je hezké být na různých místech velké nemocnice“ [1]. Lékaři měli opakovaně pochybnosti, zda je jeho pobyt v nemocničním zařízení potřebný. Když mu bylo toto sdělováno, argumentoval Blatný tím, že by nebyl schopen mimo nemocnici fungovat. Přestože Blatného situace byla výjimečná válečným obdobím, tíží emigrace, snad i duševním onemocněním, podobně se mohou cítit i lidé v současnosti, pokud jsou přesvědčeni o správnosti svého neetického chování či vnímají ohrožení svého postavení, rodiny, příjmů aj.
V rámci problematiky tzv. simulace se v klinické praxi používá řada termínů, které vyjadřují a opisují anglické slovo malingering. Například předstíraní obtíží, záměrné zkreslení výkonu, přehánění příznaků, účelové chování, agravace, neadekvátní výkon v testu, neoptimální úsilí nebo simulace. Často používané české slovo simulace je na rozdíl od anglického ekvivalentu zatíženo negativními konotacemi, proto jej doporučujeme používat zřídka a s opatrností.
Záměrná snaha podávat neadekvátní výkon (tzv. simulace) se podle 10. revize Mezinárodní klasifikace nemocí (MKN 10) řadí do diagnostické skupiny předstíraných poruch (F68 Jiné poruchy osobnosti a chování u dospělých), kde se příznaky nacházejí ve spektru od nevědomých a mimovolních až po výlučně vědomé a volní. U předstírané (faktitivní) poruchy i u simulace pacient své příznaky z různých důvodu předstírá a dělá to vědomě. U faktitivních poruch je cílem získání zdravotní péče a zájmu zdravotníků. U simulací pacient příznaky nemoci předstírá z vědomě zištných důvodů, jako jsou ekonomické výhody (finanční náhrada, invalidní důchod) nebo vyhýbání se něčemu nepříjemnému (odpovědnosti, práci, trestu apod.). Při simulaci dochází k zvýrazňování symptomů (symptom exaggeration) a ke zveličování symptomů (symptom magnification). Simulovat je možné příznaky tělesné či psychické nemoci, traumatické zážitky z minulosti, dopad či důsledky nemoci a podobně. Nejde o formu psychické poruchy nebo psychopatologie, ačkoli se může v kontextu psychické poruchy objevit. Simulace se může projevit v různých formách – od čisté simulace, při které jedinec falšuje všechny příznaky, k parciální simulaci – agravaci – kdy jsou příznaky zveličovány nebo jejich vliv na denní fungování je prezentován nadměrně [2].
Předstírané poruchy se řadí mezi nejsložitější fenomény klinické praxe, z čehož vyplývá i obtížnost provázející diagnostiku i léčbu. Je velmi důležité včasné a spolehlivé rozpoznání tohoto jevu, aby se předešlo dalším nepotřebným vyšetřením, nákladné terapii či iatrogenním komplikacím [2].
Zkoumání snahy předstírat příznaky poškození nebo nemoci bývá označováno jako vyšetření symptomové validity (Symptom Validity Assessment; SVA), což je dlouhodobě profesní součástí činnosti psychologů v USA. Kromě předstírání či simulace (malingering) je nutné ještě rozlišit pojem nedostatečné úsilí (effort), který vyjadřuje nízkou snahu osoby podávat odpovídající výkony v testech. Testové metody, které měří úsilí během vyšetření a předstírání, klasifikujeme do skupiny tzv. testů validity výkonu.
V poslední dekádě se tyto testy rozšiřují i do Evropy [3]. Metodám a testům zaměřeným na nedostatečné úsilí nebo předstírání nemoci je v USA věnována velká pozornost např. ve studii Iversona [4]. Mezi často užívané testy patří např. Reyův 15položkový test (15-Item Memory Test, RMT; 1964), Test simulace paměti (Test of Memory Malingering; TOMM; Tombaugh 1996), Test znovupoznání slov (Word Recognition Test; WRT; Rey 1941) a další. Testy zaměřené na simulaci obsahují většinou rekogniční zkoušky, kde se u osob, které předstírají určitý deficit nebo onemocnění, očekává výkon horší, než odpovídá náhodnému stylu odpovídání. Často používán bývá např. subtest rekognice z testu Reyovy komplexní figury (Rey Osterrieth Complex Figure Test; RCFT 1995).
Do skupiny těchto nástrojů patří mimo jiné i Test mince v ruce (Coin in the Hand Test; TMR), na který se zaměřujeme v tomto článku. V této práci navazujeme na naše dřívější studie týkající se problematiky měření úsilí [5,6].
TMR je krátký, snadno proveditelný a lehce vyhodnotitelný. Kapur se zmiňuje, že jediný test při vyšetření nemůže být pro diagnostiku simulace dostatečný [7]. Podobného názoru je i řada dalších autorů [8]. Zároveň Kapur zdůrazňuje potřebu jednoduchých, snadno administrovatelných technik, které mají relativně vysokou tzv. zjevnou validitu („face“ validity). První zkušenost s metodou ukázala na maximální výkon pacientů s amnézií oproti osobám podezřelým ze zkreslování výsledků, které demonstrovaly výkon v rámci náhodného „hádání”, jež pro 10 položek testu představuje 50% úspěšnost, tj. 5 bodů z 10 („oba pacienti podezřelí ze snahy podvádět měli výkon okolo náhodného výběru, zatímco skupina pacientů s amnézií měla vynikající výkon a získala maximální skór 10”). Kapur zjistil, že ti, co záměrně zkreslují výsledky, prezentují deficit pod výkon skutečně oslabených osob. Toto zjištění potvrdily i další studie, např. studie Bakera, Hanleyho a Cochraneho [9– 11].
Kapurův výsledek potvrdili také Hanley, Baker a Ledson, kteří porovnávali skupinu 20 osob s amnézií, 20 zdravých osob a 20 osob instruovaných k záměrné snaze podat slabý výkon. Osoby se snahou zkreslit výsledek v testu měly výrazně horší výkon oproti pacientům s poruchami paměti a pouze jedna osoba z 20 měla skór v rozsahu výkonů amnestických pacientů. Autoři popisují diferenciační schopnost testu jako „velmi přesnou”, i když ne ve všech případech [10]. K podobným výsledkům došli také Kelly et al [12].
Na toto téma se zaměřili také Cochrane, Baker and Meudell, kteří porovnávali 15 metod detekujících osoby, které se snaží záměrně podávat deficitní výkony [11]. Mimo jiné se zaměřili na RMT, distraction/ no distraction task, fragment completition, word association aj. TMR je z nich hodnocen nejlépe při porovnávání se zdravými osobami, které měly v rámci výzkumu záměrně zkreslovat výsledky v testu, s kontrolním vzorkem a s pacienty po poškození mozku a poruchami paměti, odeslanými neurologem k neuropsychologickému vyšetření. Zdravé osoby, které v rámci experimentu zkreslovaly své výsledky, měly průměrný skór 6,1 (SD = 1,62, rozsah 3– 9), zatímco pacienti s poškozením paměti 9,9 (SD = 0,31, rozsah 9– 10) a kontroly 9,95 (SD = 0,22, rozsah 9– 10). Osoby zkreslující své výsledky v testu se významně lišily od pacientů i kontrolních osob motivovaných k dobrému výkonu. Test správně detekoval 80 % osob záměrně zkreslujících výkon [11]. Autoři doporučují provádět test spolu s anamnestickým rozhovorem, jehož cílem je prostřednictvím otázek určit, zda proband paměťový deficit předstírá [13].
Významnou otázkou, kterou se zabývala např. studie autorů Rudmana et al, bývá provádění testů na detekci záměrného zkreslování výsledků u osob s prokázaným závažným poškozením kognitivních funkcí [14]. Autoři se zaměřili na pacienty s potvrzenou diagnózou demence různé etiologie před 65. rokem života, podpořenou nálezy na CT a/ nebo magnetickou rezonancí, kteří nebyli schopni pro své kognitivní deficity pracovat, potřebovali podporu rodiny nebo dokonce pobývali v instituci. Soubor byl rozdělen osoby s mírnou demencí (průměrný skór v Cambridge Cognition Examination (CAMCOG) 88,6, SD = 5,03, rozsah 80– 95) a střední demencí (průměrný skór v CAMCOG 62,45, SD = 16,21, rozsah 26– 79). Autoři použili šest testů k detekci záměrného zkreslování výsledků v testu. Průměrný výkon TMR byl pro skupinu osob s mírnou demencí 9,95 (SD = 0,22, rozsah 9– 10) a pro skupinu osob se střední demencí 8,82 (SD = 1,62, rozsah 5– 10). Autoři uzavírají, že pouze Reyův test počítání teček (Rey Dot Counting Test; DCT) není senzitivní vůči kognitivnímu oslabení (specificita 100 %). Z výsledků autorů je zároveň patrné, že i osoby s mírnou demencí dosahují v TMR nejhoršího skóru 9. K podobným výsledkům dospěli také Schroeder et al [15]. Ani u dementních pacientů (N = 45, hospitalizovaní, věk 65 a vyšší, průměrný skór v Mini-Mental State Examination 21 bodů; MMSE) nekoreloval výsledek v testu s věkem, vzděláním a úrovní neurokognitivních funkcí.
Autoři Schroeder et al navrhují na základě vlastní studie s pacienty s diagnózou demence dělení na čtyři pásma podle počtu chyb [15]:
- a) 0– 1 chyba – vyskytuje se u naprosté většiny pacientů, kteří se prokazatelně snaží podat dobrý výkon.
- b) 2 chyby – vyskytují se u pouze 10 % pacientů s těžkým neurokognitivním deficitem (ale bez deliria).
- c) 3– 4 chyby – vyskytují se u pacientů, kteří neurokognitivní výkon nepodávají adekvátně (misrepresenting their impairment).
- d) 5– 8 chyb – výsledek by se měl posuzovat s extrémním podezřením, ani jeden pacient ve studii takového skóru nedosáhl.
- e) 9– 10 chyb – výsledek lze interpretovat tak, že pacient správnou odpověď zná, ale přesto odpovídá nesprávně.
Souhrn výsledků jednotlivých studií s testem ukazuje tab. 1.
TMR je jediný test tohoto druhu vyvinutý ve Velké Británii a je považován za „extenzivně validizovaný” [3,16]. Je pokládán za „tak úspěšný v identifikaci osob záměrně zkreslujících výsledky, že diskuze o jeho zařazení do baterie testů k detekci tohoto jevu je opravdu nadbytečná”. Doporučuje se, aby byl efektivním doplňkem „často používaných neurokognitivních testů, jako je MMSE a dalších.“
Studie 1
Cíl práce
Cílem této práce je zjistit maximální výkon u souboru běžné populace a dále zjistit, v jaké míře jsou pokusné osoby schopny předstírat oslabený výkon tak, aby jejich snaha o záměrné zkreslování výsledků nebyla poznána. Prostředkem k tomu je experiment s manipulací testové instrukce se třemi scénáři administrace:
- snaha o maximální výkon,
- snaha o „výraznou” simulaci,
- snaha o „lehkou” simulaci.
Chceme navázat na naše předchozí studie týkající se měření úsilí [5,6] a podpořit TMR do klinické praxe.
Metodika
Pro splnění našeho cíle jsme si zvolili experimentální design, kdy jsme manipulovali s testovou instrukcí TMR u jednoho souboru osob. Podle typu zadání testu jsme se pokusili zjistit schopnost osob výzkumného souboru adaptovat se na tři různé instrukce/ scénáře, tj. měnit podle cíle zadání výsledky v testu. Tendenci k záměrnému zkreslování výsledků (tzv. simulaci) v testu u každého jednotlivého scénáře jsme si vymezili jako závisle proměnnou, nezávisle proměnnou byla instrukce testu s jasným cílem, jak v testu odpovídat. Test jsme zadávali dvěma různými způsoby pořadí. Pořadí prvního způsobu zadávání bylo následující: scénář č. 1 – nejlepší výkon + č. 2 – získání invalidního důchodu + č. 3 – prodloužení pracovní neschopnosti. Pořadí druhého způsobu: scénář č. 2 – získání invalidního důchodu + č. 3 – prodloužení pracovní neschopnosti + č. 1 – nejlepší výkon.
Instrukce a skórování
Instrukci jsme podávali ve shodě s původním zadáním podle Kapura [7]. Po pacientovi chceme, aby si dobře všímal, do které ruky examinátor vezme (drobnou) minci, kterou nechá 2 s ležet v otevřené dlani. Poté je pacient požádán, aby zavřel oči a počítal nahlas po jedné od 10 do 1. Během této doby examinátor sevře obě ruce v pěst tak, aby pacient minci již neviděl. Když pacient dokončí počítání, požádáme jej o otevření očí a dotknutí se dlaně, ve které je mince. Pacient je upozorněn, že nejde o trik a mince bude vždy v té dlani, ve které ji před chvílí viděl. Konkrétně používáme v klinické praxi tuto instrukci v souladu s instrukcí Kapura [7]: „Zde je mince (ukážeme). Dám minci vždy do levé nebo pravé ruky (předvedeme), vy se dobře podíváte, kam jsem minci dal a zapamatujete si to. Vždy vám ukáži, kde je mince. Pak zavřete oči a budete počítat nahlas od 10 do 1. Pak oči otevřete a ukážete mi, v jaké ruce mince byla. Je to srozumitelné? (Pokud ne, opakujeme instrukci znovu, poté dáme minci do pravé ruky, ujistíme se, že se proband dívá a na dvě sekundy necháme dlaň otevřenou). Prosím zavřete oči. A nyní počítejte nahlas od 10 do 1(pacient počítá, během této doby sevřeme obě ruce v pěst a tím minci odstraníme z pohledu pacienta). Po počítání pacientem a vyslovení „jedna” řeknete: ukažte mi, v které ruce mám minci. Zapíšeme si výsledek (správně–špatně).”
Při skupinové administraci examinátor počítal místo pokusných osob nahlas sám. Po otevření očí pokusné osoby samy zaznamenaly výsledek do záznamového archu, kde kroužkovaly levou (L) nebo pravou (P) ruku z jejich pohledu (příloha 1, 2).
Pokus se 10× opakuje. Za každou správnou odpověď získá proband v souladu s jinými studiemi 1 bod.
Test byl admininistrován skupinově spolu s dalšími testy zaměřenými na snahu (RMT), způsob odpovídání (Dotazník žádoucího stylu odpovídání; BIDR), sebeposouzení znalostí (Overclaiming Test; OCQ) a dotazníky zaměřenými na podvádění v pracovní oblasti. Vzhledem k tomu, že jde v českém prostředí o nově používané metody, uvedeme jejich výsledky v samostatných příspěvcích.
Test byl administrován respondentům v učebně v rámci přednášky, kterou examinátor navštívil, a s přednášejícím experiment předem domluvil. Pro účely skupinové administrace byla pro dostatečnou velikost použita 20korunová mince.
Během administrace stál examinátor před pokusnými osobami, ukazoval dlaně a minci tak, aby všechny pokusné osoby mohly sledovat celý postup. S pokusnými osobami jsme krátce po sobě provedli všechny tři scénáře v pořadí:
- maximální výkon,
- výrazná simulace,
- mírná simulace s těmito instrukcemi:
- a) Zkuste se prosím dobře soustředit a podat co nejlepší výkon (v textu dále jen nejlepší výkon).
- b) Zkuste si představit, že je pro vás důležité simulovat poškození mozku tak, aby to nikdo nepoznal a dostal/ a jste invalidní důchod. To pro vás znamená pravidelný měsíční příjem několika tisíc korun po dobu několika let (v textu dále jen získání invalidního důchodu).
- c) Zkuste si prosím představit, že potřebujete předstírat, že váš výkon je o trochu horší než opravdový, ale jen trochu, aby to určitě lékař nepoznal a abyste mohl/a pro nemoc (pád z kola) zůstat několik dní doma (v textu dále jen prodloužení pracovní neschopnosti).
Každá instrukce byla pokusným osobám opakována několikrát k zajištění, že při skupinové administraci všichni pochopili instrukci správně. Případné otázky pokusných osob byly bezprostředně zodpovězeny. Examinátor zdůrazňoval potřebu vžít se do scénáře a přizpůsobit chování danému scénáři.
V naší experimentální studii hodnotíme TMR jednoduchým způsobem, a to součtem počtu správně zapamatovaných položek. Ve shodě s většinou zahraničních studií považujeme výsledek < 9 (tj. 8 a méně bodů) za cut-off, který může detekovat simulaci.
Výzkumný soubor
V rámci tohoto experimentu byla celkově nasbírána data od 153 respondentů. Metoda byla administrována studentům distančního studia na Policejní akademii ČR, studentům distančního studia na ČVUT, studentům denního studia na Pedagogické fakultě UK a také osmi osobám z běžné populace individuálně. Pokusné osoby byly ve věku 19– 68 let (M = 31, SD = 43, medián 28). Ženy (51 %) mírně převažovaly nad muži (49 %). Informaci o nejvyšším dosaženém vzdělání jsme získali u 102 osob (51 osob tento dotaz nezodpovědělo). V souboru (N = 102) měla většina respondentů středoškolské vzdělání s maturitou (92 %), sedm osob bylo VŠ vzdělání (7 %), jedna osoba měla SOU bez maturity (1 %), základní vzdělání neměl nikdo.
Scénář manipulace s instrukcí v pořadí 1, 2, 3 (maximální výkon – výrazná simulace – mírná simulace) byla provedena u souboru 106 osob, v odlišném pořadí 2, 3, 1 (výrazná simulace – mírná simulace – maximální výkon) byla provedena u souboru 26 osob.
Pokusné osoby nebyly odměňovány za účast na experimentu a spolupracovaly na dobrovolné bázi. Pro pokusné osoby nebyla definována žádná inkluzivní ani exkluzivní kritéria. Už samotná skutečnost, že většina výzkumných osob je studujících na SŠ a VŠ, je latentním výběrovým kritériem výzkumného vzorku, který soubor výrazně specifikuje. Definováním dalších výběrových kritérií bychom ho ještě více zúžili, což jsme nepovažovali za přínosné pro částečnou zobecnitelnost našich výsledků.
Výsledky
Výkony podle jednotlivých scénářů shrnuje tab. 2 .
Porovnání scénářů pomocí neparametrických testů (srovnání závislých souborů/ proměnných, Friedmanova ANOVA a Kendallův koeficient konkordance) ukázaly na statisticky významné rozdíly mezi scénáři χ2(2, n = 153) = 238,7; p < 0,001; Kendallův koeficient, Τ(2, n = 153) = 0,78; p < 0,001. Zjistili jsme, že mezi skupinou mírně simulující a výrazně simulující je statisticky významný rozdíl (N = 153; z = – 8,073; p < 0,001) prostřednictvím Wilcoxnova testu pro dva závislé výběry v rámci jednoho výzkumného souboru.
Výsledky vzhledem ke třem scénářům administrace testu jsou následující:
- Nejlepší výkon – Výkon podle scénáře Nejlepší výkon je blízký maximu 10 bodů, (M = 9,59, SD = 1,41, min. 1, max. 10), modus byl 10 bodů. Celkem 125 osob dosáhlo v testu 10 bodů (82 %), 20 osob skóre 9 bodů (13 %), čtyři osoby 8 bodů, jedna osoba 3 body a tři osoby dosáhly skóre 1 bod.
- Získání invalidního důchodu – Výkon podle scénáře Získání invalidního důchodu je ze všech scénářů nejnižší. Průměrný výkon byl 4,63 (SD = 2,39, min. 0, max. 10). Modus byl 5 bodů. Z celkového počtu dosáhly maximálního výkon (tj. 10 bodů) čtyři osoby (3 %). Skóre 9 bodů dosáhly dvě osoby (1 %), skóre v rozmezí 8– 0 bodů dosáhlo ostatních 147 osob.
- Prodloužení pracovní neschopnosti – Výkon podle scénáře Prodloužení pracovní neschopnosti se pohyboval mezi výkonem v prvním a druhém scénáři. Průměrný výkon byl 6,78 (SD = 1,74, min. 1, max. 10). Modus byl 7 bodů. Z celkového počtu dosáhly maximálního výkonu (tj. 10 bodů) dvě osoby (1 %). Skóre 9 bodů dosáhlo 15 osob (10 %), skóre v rozmezí 8– 0 bodů dosáhlo ostatních 136 osob.
Přehledně jsou výkony pro jednotlivé scénáře uvedeny v tab. 3 a 4.
Rozdělení pokusných osob na osoby se snahou podat horší výkon v testu a na osoby se snahou podat maximální výkon pro všechny tři scénáře ukazuje tab. 4. Při cut-off hodnotě < 9 (tj. skór 8 a nižší představuje simulaci, 9 a 10 bodů představuje výkon bez simulace) bylo ve scénáři 1 (nejlepší výkon) osm osob, které dosáhly hodnot pod stanovený cut-off 8 bodů. Ve scénáři 2 (získání invalidního důchodu) mělo výsledky svědčící pro záměrné zkreslování výsledků v testu 147 osob a šest osob výsledky nad stanovený cut-off 8 bodů, tj. takové, které nejsou důkazem záměrného zhoršování svého výkonu. Ve scénáři 3 (prodloužení pracovní neschopnosti) mělo výsledky odpovídající snaze záměrně zhoršit výsledek v testu 136 osob a u 17 osob se objevily hodnoty nad stanovený cut-off 8 bodů. Z celkového počtu 153 osob mělo tedy 17 osob u scénáře na mírné zkreslení výsledků výsledky odpovídající normě.
Senzitivita a specificita testu
Abychom mohli orientačně, z důvodu menšího výzkumného souboru a specifity experimentu, posoudit senzitivitu a specifitu testu, celý soubor jsme si hypoteticky rozdělili na dvě skupiny:
- osoby s nižší snahou podat dobrý výkon,
- osoby se snahou podat maximální výkon.
Porovnáním první skupiny (tj. zkoumaných osob, které dostaly instrukci výrazně zkreslit výsledky v testu s cílem dosáhnout invalidního důchodu) a druhé skupiny (tj. zkoumaných osob, které dostaly instrukci podat co nejlepší výkon) jsme zjistili, že test je senzitivní při jakémkoli skóre pod stanovený cut-off < 9 bodů. Nejvyšší specificity test dosáhl při skóru 8 (0,964).
Pořadí scénářů
Zjišťovali jsme, zda existují rozdíly ve skórech výsledku testu vztahujících se k pořadí scénářů. Porovnávali jsme výsledky dvou souborů osob:
- soubor 106 osob se scénářem manipulace s instrukcí v pořadí 1, 2, 3 (maximální výkon – výrazná simulace – mírná simulace),
- soubor 26 osob se scénářem v odlišném pořadí 2, 3, 1 (výrazná simulace – mírná simulace – maximální výkon).
Obě skupiny se výrazněji liší vzhledem k početnímu zastoupení osob pro obě varianty pořadí scénářů, z toho důvodu můžeme výsledky považovat pouze za orientační. Statisticky signifikantní rozdíl ve skóre byl prokázán Mannovým-Whitneyho U testem u scénáře 1 – nejlepší výkon (N = 153; U = 145; r = 0,90; p < 0,001) a u scénáře 2 – získání invalidního důchodu (N = 153; U = 1 214; r = 0,21; p < 0,05). Existuje tedy statisticky signifikantní rozdíl mezi podáním nejlepšího výkonu (1 – nejlepší výkon) na začátku a jeho podáním na konci testování. Také v případě instrukce mírné simulace (3 – prodloužení pracovní neschopnosti) je rozdíl, zda je zadávaná jako druhá, nebo jako poslední. V budoucích výzkumech, kde bude použit TMR je tedy nutné počítat s vlivem pořadí na výsledky, v jakém je test zadáván.
Ověřili jsme si statisticky předpokládaný vztah mezi scénáři 2 a 3 (výrazná a mírná snaha podat horší výkon v testu). Spearmanův korelační koeficient poukazuje na střední až podstatnou korelaci rs(125) = 0,336; p < 0,05 scénáře 2 a 3, v pořadí zadávaní 1, 2, 3 a podstatnou až velmi silnou korelaci rs(28) = 0,521; p < 0,05 scénářů 2 a 3 v pořadí zadávaní 2, 3, 1.
Zjistili jsme, že se obě skupiny v závislosti od pořadí zadávaných instrukcí od sebe statisticky významně liší v rámci proměnné pohlaví (n = 129; χ2 = 22,15; V = 0,414; p < 0,001) i v rámci věku (n = 128; U = 427; r = 0,47; p < 0,001). Vzhledem k tomuto zjištění a také zejména vzhledem k velkému početnímu rozdílu mezi oběma skupinami jsme prostřednictvím Friedmanova testu obě skupiny, vždy podle dvojího typu pořadí scénářů, detailněji analyzovali. Výsledky uvádíme v tab. 5 a 6.
Můžeme vidět, že i když jsou skupiny vzhledem k pořadí zadávaní scénářů rozdílné, pokud jde o adaptaci na požadavek týkající se záměrného předstírání slabších výsledků v testu, výsledek je stejný u mužů i u žen. To znamená, že jak muži, tak i ženy se byli schopni adaptovat na požadovaný scénář zkreslování výsledků v testu. Jedná se jak o pořadí scénářů 1, 2, 3, tak i pořadí 2, 3, 1. Rozdíl v závislosti na pohlaví pozorujeme pouze u vztahu mezi scénářem 2 a 3 (výrazná a mírná simulace), který byl statisticky prokázán jen u pořadí zadávání scénářů 1, 2, 3.
Studie 2
Pro možný vliv skupinové administrace na výsledky testu jsme se rozhodli administrovat test individuálně a u populace, kde by bylo možné očekávat, že výsledky nebudou ovlivněny předpokládaným nadprůměrným intelektem vysokoškolských studentů a budou odpovídat podmínkám klinické praxe. Předpokládali jsme také, že depresivní či úzkostná symptomatika může negativně ovlivňovat výsledek testu a že zařazením osob, které mají invalidní důchod (a v budoucnosti mohou opět o invalidní důchod žádat), vytváří podmínky pro nižší výkon než u předchozího souboru.
Soubor
Soubor pacientů (37 mužů, 43 žen) s diagnózou afektivní nebo úzkostná porucha a hospitalizovaných na odděleních Národního ústavu duševní zdraví (NÚDZ). Průměrný věk byl 36 let (SD = 12, min. 18, max. 66). Základní vzdělání mělo 26 % souboru, střední 51 % a vysokoškolské 21 %.
Metodika
Individuálně jsme vyšetřili všechny pokusné osoby (N = 80) pouze se standardní instrukcí pro test (tj. bez scénářů jako ve Studii 1). Vyšetření proběhlo pouze s examinátorem, jiná osoba nebyla během vyšetření přítomna. Test byl administrován jako součást širšího vyšetření zaměřeného na integritu osobnosti. Pacienti nevěděli, jaký je účel testu. Pacienti byli vyšetřeni také strukturovaným rozhovorem MINI (k diagnostice aktuální poruchy nálady – depresivní poruchy).
Výsledky
Maximální hodnotu v testu (10 bodů) mělo 76 z 80 pacientů, čtyři pacienti získali 9 bodů, dva pacienti 7 bodů a jeden pacient 5 bodů. Průměrný skór souboru byl 9,88 (SD = 0,66, min. 5, max. 10). Aktuální diagnózu depresivní poruchy podle MINI naplňovalo 48 pacientů, 32 ji nenaplňovalo. Výsledky v testu se podle aktuální diagnózy nelišily (Mannův-Whitneyho U test, U = 704; Z =– 0,624; p = 0,530). V současné době pobíralo 19 osob invalidní důchod, 61 jej nepobíralo. Výsledky v testu se podle přítomnosti či absence invalidní důchodu nelišily (Mannův-Whitneyho U test, U = 579; Z = – 0,006; p = 0,991).
Porovnáním se scénářem ze Studie 1, nejlepší výkon, nezjišťujeme odlišnosti (p = 0,08), výkon pacientů byl v průměru vyšší než výkon v souboru z běžné populace. Porovnáním se scénářem ze Studie 1, získání invalidního důchodu, zjišťujeme rozdíl mezi skupinami (p < 0,001), podobně jako se scénářem prodloužení pracovní neschopnosti (p < 0,001). Výkon pacientů byl vyšší než výkon ve všech třech scénářích.
Diskuze
Problematika detekce a diagnostiky předstíraných poruch se stále častěji objevuje jako výzkumné téma řady studií. V posledních 20 letech došlo v této oblasti k podstatnému pokroku. Zejména v zahraničí byla vypracována řada kvalitních metod k tomuto účelu. V našich podmínkách prozatím validní nástroje odborníkům chybí. Naším cílem bylo touto studií představit odborné veřejnosti nový skríningový nástroj – TMR – a umožnit jeho zavedení do běžné klinické a psychodiagnostické praxe.
Ve výzkumu se pro zjišťování míry snahy používají tři typy projektů [17]. Prvními typy projektů jsou projekty s názvem „design simulace“. Určitá skupina osob z neklinické populace (např. studenti) je instruována k simulaci v určitém testu a jejich výsledky se pak porovnávají s klinickým souborem s prokázaným kognitivním oslabením. Druhým typem projektů jsou tzv. „známé soubory“ (known groups), kdy se vybere skupina osob z účastníků soudních procesů s nízkým výkonem v rekogniční úloze a jejich výsledky v testu se porovnávají s výsledky souboru klinického. Posledním typem jsou projekty tzv. odlišné prevalence (differential prevalence design), které předpokládají simulaci variabilitou výkonu podle kontextu a odměny. Experti se shodují, že design simulace a design „známého souboru“ představují vhodné a následováníhodné postupy, třetí typ designu může být obohacením v počátečních fázích validizace klinických zkoušek. Inspirováni těmito projekty jsme se rozhodli pro vlastní experiment s TMR.
Zvolili jsme si typ experimentu, který je poměrně novým přístupem k této problematice, protože neodpovídá výše uvedeným, již používaným, designům výzkumu. Manipulovali jsme s testovou instrukcí TMR u jednoho souboru osob a použili jsme tři scénáře administrace testu: 1. snaha o maximální výkon, 2. snaha o „výraznou“ simulaci a 3. snaha o „lehkou“ simulaci. Podle typu zadání testu jsme se pokusili zjistit schopnost osob výzkumného souboru adaptovat se na tři různé instrukce/ scénáře a posuzovali jsme rozdíly a variabilitu jejich výkonů v tomto testu. Zároveň jsme ověřovali, zda má na výsledky v testu vliv pořadí scénářů.
Zjistili jsme, že pokusné osoby jsou schopny se pružně adaptovat danému scénáři a přizpůsobit výkon požadavkům, snížit výkon v případě vysoké pobídky (získání invalidního důchodu) a opět ho zlepšit v případě méně významné pobídky (prodloužení pracovní neschopnosti). Ověřili jsme, že test lze administrovat i skupinově, aniž se dosáhne odlišných výsledků oproti individuální administraci při srovnání s ostatními studiemi [10,18]. Ve srovnání s některými studiemi citovanými v této práci se náš projekt liší designem vzhledem k tomu, že jsme nepoužili různé soubory, ale jednomu souboru jsme administrovali tři různé scénáře. Zvolili jsme experiment, který má svá pozitiva i negativa. Výhodu designu naší studie jsme spatřovali ve výrazné časové úspoře při práci s jednou skupinou osob, kdy jsme v jednom čase získali řadu srovnávacích dat. Nevýhodou studie by mohla být skutečnost, že jedné skupině byl test administrován celkově třikrát za sebou bez delší časové prodlevy, což by hypoteticky mohlo mít nepříznivý vliv na výsledky. Tuto okolnost jsme zvažovali a dospěli jsme ke společnému názoru a předpokladu, že vliv opakované administrace testu s cílem záměrně zkreslovat výsledky bude u výzkumné skupiny zanedbatelný. Předpokládali jsme, že pro výzkumné osoby nebude obtížné adaptovat se na odlišné scénáře manipulace s instrukcí, protože jde o velmi snadný test s velmi jednoduchou administrací nevyžadující od výzkumných osob žádné specifické znalosti nebo schopnosti.
Pro tři scénáře manipulace s instrukcí se podle našich předpokladů významně lišil výkon v testu, což ukazuje na schopnost pokusných osob se velmi dobře přizpůsobit instrukci scénáře a zkreslovat výkon v testu libovolně podle stanoveného cíle (invalidní důchod nebo prodloužení pracovní neschopnosti). Zjistili jsme, že test je senzitivní při jakémkoli skóre pod stanovený cut-off < 9 bodů. Dále jsme zjistili, že nejvyšší specificity test dosáhl při skóre 8 (0,964). Přesto se i u našeho početně nevelkého výzkumného souboru objevilo několik osob, které z určitých důvodů (např. neporozumění instrukci testu, nedostatečný zájem o studii aj.) skórovalo mimo očekávané hranice hodnot, což nás může upozornit na nutnost určité opatrnosti při práci s tímto snadným skríningovým nástrojem.
Senzitivita a specificita testu je podle našich zjištění velmi podobná výsledkům studie autorů Kelly et al, kteří porovnávali pacienty s poškozením mozku a zdravé osoby předstírající simulaci – senzitivita byla v této studii 87,5 %, specificita 92,5 % (při cut-off < 8,5, tj. skór menší než 8,5 představoval simulaci) [12]. Optimální prediktor by obecně dosahoval 100% senzitivitu i specificitu. Získané hodnoty v naší studii se tomu blíží.
Abychom orientačně posoudili vliv pořadí zadávání jednotlivých scénářů na výsledky v testu, zadávali jsme test dvěma různými způsoby pořadí. Zjistili jsme, že existuje významný rozdíl mezi podáním nejlepšího výkonu na začátku a jeho podáním na konci testování. Také v případě instrukce mírné simulace je rozdíl, zda je zadávaná jako druhá nebo jako poslední. Na tomto místě je nutné upozornit, že obě skupiny se výrazněji lišily vzhledem k početnímu zastoupení osob pro obě varianty pořadí scénářů, z toho důvodu můžeme výsledky považovat pouze za orientační. V budoucích výzkumech, kde bude použit TMR, je však nutné s touto proměnnou počítat.
Při volbě designu našeho experimentu jsme vycházeli z předpokladu, že chování pacientů je podobné jako chování našich pokusných osob. Tento předpoklad nemusí být platný; ve skutečnosti nemáme údaje, které by takové soubory porovnávaly. Snažili jsme se zajistit vžití se do scénáře opakováním instrukce a snahou ovlivnit pokusné osoby, aby se maximálně snažily danému scénáři dostát. V našem experimentu byli pokusnými osobami dobrovolníci. Tento postup byl v předchozí studii provedené autory Kelly et al kritizován. Bylo argumentováno tím, že zdravé pokusné osoby, které předstírají slabý výkon v rámci experimentu, toho nejsou schopny tak dobře jako ve skutečné situaci, protože finanční pobídka je pouze slovní, ne faktická, jako je to u skutečně klamajících osob [12]. Oproti tomu Haines a Norris nezjistili ve své studii rozdíly mezi lidmi, kteří jsou v rámci experimentu motivováni finančně a kteří participují dobrovolně [19]. Naše studie zjistila u většiny osob téměř maximálně možný výkon v případě, že se pokusné osoby snaží o co nejlepší výkon, podobně jako je tomu v ostatních studiích [10– 12]. Lze odvodit, že u nesimulujících osob z neklinického prostředí se dá většinou očekávat v TMR výkon 9 nebo 10 bodů. Jakýkoli jiný výkon vzbuzuje podezření na nedostatečnou snahu nebo záměrné zkreslování výsledků.
V souvislosti s používáním testů k detekci záměrné snahy předstírat jakýkoli deficit by se mohla objevit námitka, že pacienti s poškozením mozku mohou mít s podobnými testy potíže vzhledem ke kognitivnímu deficitu. Jak jsme uvedli v úvodu tohoto článku, minimálně v případě mírné demence se tyto obavy zdají být liché [14,15].
Naše vlastní výsledky individuální administrace u klinického souboru (N = 80) ukazují na podobný výkon, jako u scénáře nejlepší výkon a významně vyšší než u dalších dvou scénářů. Můžeme dedukovat, že v běžné v situaci vyšetření lze u hospitalizovaných pacientů s psychiatrickými poruchami (depresivní a úzkostná porucha) očekávat podobný výkon jako u zdravých a motivovaných pokusných osob v produktivním věku.
Závěr
Pokud bychom se vrátili k Ivanu Blatnému, zmíněnému v úvodu tohoto článku, je na základě našich výsledků velmi pravděpodobné, že by TMR poměrně spolehlivě prokázal či vyvrátil jeho pravděpodobnou snahu předstírat duševní onemocnění. Klinická doporučení ale radí nezůstat u jedné zkoušky. Blatnému by tedy měly být administrovány další metody, např. RMT (Rey, 1945), WRT (Rey, 1941), Opakování čísel (Wechsler, 1955) či jiné metody. Pozitivní nebo negativní výsledek by zpřesnil uvažování o prezenci a míře jeho nedostatečné snahy či předstírání určitých příznaků. Tyto metody však nic neříkají o faktorech ovlivňujících motivaci, nakolik jde o situační faktor či dlouhodobý vzorec ovlivňování výkonu.
Metoda, kterou jsme v této práci představili, je rychlá, jednoznačně vyhodnotitelná. Navíc díky přímému kontaktu s pacientem můžeme bezprostředně sledovat reakce a získat další informace o způsobu chování v testové situaci. Díky manipulaci s mincí se také odlišuje od často používaných dotazníkových metod zaměřených na způsob odpovídání, a je tak pro examinátora oživením.
I přes určitá sporná zjištění uvedená v této studii si myslíme, že TMR má celkově poměrně dobrý diferenciační potenciál ve schopnosti odlišit osoby se snahou podávat záměrně slabý výkon od osob, které se nedostatečně snaží v testové situaci, a doporučujeme ho zařadit do klinické praxe. V příloze 1 navrhujeme záznamový arch pro jeho klinické využití.
Autoři deklarují, že v souvislosti s předmětem studie nemají žádné komerční zájmy.
Redakční rada potvrzuje, že rukopis práce splnil ICMJE kritéria pro publikace zasílané do biomedicínských časopisů.
doc. PhDr. Marek Preiss, Ph.D.
Národní ústav duševního zdraví
Topolová 748
250 67 Klecany
e-mail: marek.preiss@nudz.cz
Přijato k recenzi: 21. 7. 2015
Přijato do tisku: 11. 4. 2017
Sources
1. Reiner M. Román o Ivanu Blatném. Praha: Torst 2014.
2. Praško J, Seifertová D. Předstírané poruchy a simulace. Med Praxi 2008;5(3):128– 32.
3. Merten T, Dandachi-FitzGerald B, Hall V, et al. Symptom validity assessment in European countries: development and state of the art. Clínica Y Salud 2013;24(3):129– 38.
4. Iverson GI. Ethical issues associated with the assessment of exaggeration, poor effort, and malingering. Appl Neuropsychol 2006;13(2):77– 90.
5. Preiss M, Preiss J, Krámská L, et al. Nedostatečná snaha podat dobrý výkon. Psychiatrie 2012;16(4):202– 9.
6. Preiss M, Mačudová G. Dotazník žádoucího stylu odpovídání (BIDR-CZ). Psychiatrie 2013;17(2):59– 64.
7. Kapur N. The Coin in the Hand Test: a new bedside test for the detection of malingering in patients with suspected memory disorder. J Neurol Neurosurg Psychiatry 1994;57(3):385– 6.
8. Slick DJ, Sherman EM, Iverson GL. Diagnostic criteria for malingered neurocognitive dysfunction: proposed standards for clinical practice and research. Clin Neuropsychol 1999;13(4):545– 61.
9. Baker GA, Hanley JR, Jackson HF, et al. Detecting the faking of amnesia: performance differences between simulators and patients with memory impairment. J Clin Exp Neuropsychol 1993;15(5):668– 84.
10. Hanley JR, Baker GA, Ledson S. Detecting the faking of amnesia: a comparison of the effectiveness of three different techniques for distinguishing simulators from patients with amnesia. J Clin Exp Neuropsychol 1999;21(1):59– 69.
11. Cochrane HJ, Baker GA, Meudell PR. Simulating a memory impairment: can amnesics implicitly outperform simulators? Br J Clin Psychol 1998;37(1):31– 48.
12. Kelly PJ, Baker GA, van den Broek MD, et al. The detection of malingering in memory performance: the sensitivity and specificity of four measures in a UK population. Br J Clin Psychol 2005;44(3):333– 41.
13. Wiggins EC, Brandt J. The detection of simulated amnesia. Law Hum Behav 1988;12(1):57– 78.
14. Rudman N, Oyebode JR, Jones CA, et al. An investigation into the validity of effort tests in a working age dementia population. Aging Ment Health 2011;15(1):47– 57. doi: 10.1080/ 13607863.2010.508770.
15. Schroeder RW, Peck CP, Buddin WH jr, et al. The Coin in the Hand Test and dementia: more evidence for a screening test for neurocognitive symptom exaggeration. Cogn Behav Neurol 2012;25(3):139– 43. doi: 10.1097/ WNN.0b013e31826b71c1.
16. McCarter RJ, Walton NH, Brooks DN, et al. Effort testing in contemporary UK neuropsychological practice. Clin Neuropsychol 2009;23(6):1050– 66. doi: 10.1080/ 13854040802665790.
17. Heilbronner RL, Sweet JJ, Morgan JE, et al. American Academy of Clinical Neuropsychology Consensus Conference Statement on the neuropsychological assessment of effort, repons bias, and malingering. Clin Neuropsychol 2009;23(7):1093– 129. doi: 10.1080/ 138 54040903155063.
18. Kemp S, Coughlan AK, Rowbottom C, et al. The base rate of effort test failure in patients with medically unexplained symptoms. J Psychosom Res 2008;65(4):319– 25. doi: 10.1016/ j.jpsychores.2008.02.010.
19. Haines ME, Norris MP. Detecting the malingering of cognitive deficits: an update. Neuropsychol Rev 1995;5(2):125– 48.
Labels
Paediatric neurology Neurosurgery NeurologyArticle was published in
Czech and Slovak Neurology and Neurosurgery
2017 Issue 3
Most read in this issue
- Myotonická dystrofie – jednota v různosti
- Riziko poškození plodu v důsledku rentgenových výkonů u gravidních žen
- Febrilní křeče – méně je někdy více
- Vertebrogenní algický syndrom – medicína založená na důkazech a běžná klinická praxe. Existuje důvod něco změnit?