Źródło: Gregorius A, Śpiewak R. Podstawy racjonalnego wyboru testów diagnostycznych w alergologii. Alergia Astma Immunologia 2013; 18 (4): 221-230.
Wyniki badań laboratoryjnych oraz testów wykonywanych u pacjenta w znacznym stopniu wpływają na późniejsze etapy diagnostyki i leczenia pacjenta. Dlatego niezwykle ważne jest prawidłowe dobranie testu już na najwcześniejszych etapach diagnostyki oraz uświadomienie sobie, że każdy test - zarówno wykonany w laboratorium, jak i przez samego lekarza, może wiązać się z otrzymaniem wyników fałszywie dodatnich oraz fałszywie ujemnych. W wyborze najlepszego testu niezbędne jest zrozumienie pojęć opisujących skuteczność testu diagnostycznego, takich jak czułość, swoistość, dodatnia i ujemna wartość predykcyjna, wskaźnik wiarygodności dla testu dodatniego i ujemnego, powtarzalność oraz odtwarzalność. W niniejszym artykule przedstawiono definicje tych istotnych pojęć wraz z przykładami z praktyki alergologicznej. Słowa kluczowe: alergia, test diagnostyczny, skuteczność, czułość, swoistość, wartości predykcyjne. |
Linki: |
Fragmenty artykułu:
W codziennej praktyce alergolog może wybierać spośród ponad stu ekstraktów alergenowych do testów punktowych i śródskórnych oraz ponad 500 substancji (haptenów) do testów płatkowych, do tego dochodzą dziesiątki testów na swoiste IgE w ofertach laboratoriów analitycznych. Aby wybrać właściwy test oraz prawidłowo go zinterpretować, lekarz powinien być świadomy zalet i wad poszczególnych metod diagnostycznych, umieć wskazać oczekiwane korzyści z wykonania danego testu oraz prawidłowo zinterpretować wyniki w odniesieniu do stanu klinicznego konkretnego pacjenta. Przed zleceniem każdego badania alergolog powinien odpowiedzieć sobie na kilka istotnych pytań [1-3]:
POLECAMY: Kurs
Zapraszamy Państwa bardzo serdecznie do udziału w kolejnej edycji Kursu "Wyprysk: Spektrum kliniczne, diagnostyka, postępowanie". Kurs obejmuje 7 godzin intensywnego szkolenia w formie prezentacji multimedialnych i dyskusji. Udoskonalony program kursu czerpie z doświadczeń poprzednich edycji, a także z dorobku EAACI Allergy School "Dermatitis&Eczema", którą współorganizowaliśmy w Krakowie w sierpniu 2011 roku. Naszym celem jest przekazanie Państwu wiedzy nowoczesnej, opartej na rekomendacjach organizacji międzynarodowych oraz dowodach naukowych. Wiedzę, którą przekazujemy, sami stosujemy w praktyce i z radością podzielimy się z uczestnikami naszym doświadczeniem. W trakcie zajęć oddajemy się całkowicie do dyspozycji, uczestnicy mają prawo w każdej chwili wyjaśnić swoje wątpliwości. Kładziemy nacisk na umiejętności praktyczne i dostosowanie szkolenia do indywidualnych potrzeb uczestników, dlatego nasze kursy odbywają się w małych, maksymalnie dwudziestosobowych grupach. Do zobaczenia w Krakowie!
Zapisy: medukacja.biz |
W wyborze najlepszego w określonej sytuacji klinicznej testu diagnostycznego pomocne jest dobre zrozumienie podstawowych pojęć opisujących wiarygodność i skuteczność testu (tab. I) [1,2,4-9]. W dobrej praktyce klinicznej niezbędne jest uświadomienie sobie, że każdy test może być źródłem wyników fałszywie dodatnich i fałszywie ujemnych (tab. II). Ryzyko wystąpienia takich błędów opisuje się zazwyczaj za pomocą wskaźników czułości i swoistości testu.
Czułość to zdolność testu do identyfikacji osób rzeczywiście uczulonych. Testy o wysokiej czułości obarczone są wyższym ryzykiem wyników fałszywie dodatnich ("wykrywanie" nieistniejących alergii), natomiast wynik ujemny takiego testu z wysokim prawdopodobieństwem przemawia za rzeczywistym brakiem uczulenia u badanego. Test o wysokiej czułości jest szczególnie przydatny w wykluczeniu uczulenia na dany alergen [2,10-12].
Przykład 1: W badaniu z udziałem 71 piekarzy z objawami uczulenia na mąkę pszenną, za "złoty standard" przyjęto wynik testu prowokacji mąką (prowokacja oskrzelowa, donosowa lub ekspozycja w miejscu pracy). U wszystkich pacjentów przeprowadzono również punktowe testy skórne (SPT), których wynik został odniesiony do wyniku testu prowokacji. Uzyskane wyniki przedstawiały się następująco: prawdziwie dodatnie SPT u 25 badanych, prawdziwie ujemne u 25, fałszywie dodatnie u 9, oraz fałszywie ujemne u 12 badanych. Po podstawieniu tych wartości do wzoru {25/(25+12)} × 100% otrzymujemy wskaźnik czułości dla SPT wynoszący 67,6% [13].
Przykład 2: U 145 pacjentów pediatrycznych przeprowadzono badania przydatności testu Phadiatop Infant (określenie poziomu IgE swoistego wobec najczęstszych alergenów pediatrycznych) w wykrywaniu atopii. Każdy z pacjentów został uprzednio zdiagnozowany i zakwalifikowany do grupy obciążonych lub wolnych od atopii na podstawie wywiadu osobniczego i rodzinnego, badania fizykalnego oraz poziomu swoistego IgE (Pharmacia CAP System) na wybrane alergeny pokarmowe i wziewne. U 53 (36%) dzieci stwierdzono atopię, pozostałe 96 zostało uznane za wolne od atopii. Liczba wyników prawdziwie dodatnich testu Phadiatop wyniosła 49, prawdziwie ujemnych 90, fałszywie dodatnich 4, a fałszywie ujemnych 2. Po podstawieniu tych wartości do wzoru {49/(49+2)} × 100%, otrzymujemy wskaźnik czułości dla testu Phadiatop wynoszący 96,1% [14].
Swoistość to zdolność testu do identyfikacji osób rzeczywiście nieuczulonych. Ponieważ test o wysokiej swoistości z reguły obarczony jest wyższym ryzykiem uzyskania wyników fałszywie ujemnych, dodatni wynik takiego testu z wysokim prawdopodobieństwem przemawia za obecnością uczulenia. Dlatego test o wysokiej swoistości jest szczególnie przydatny w potwierdzaniu uczulenia na dany alergen (np. w orzecznictwie) [2,10,15-17].
Przykład 3: W badaniach określających skuteczność kilku testów diagnostycznych w alergii na lateks wzięło udział 135 pacjentów. Na potrzeby dalszych analiz za punkt odniesienia przyjęto dane z wywiadu (występowanie objawów po kontakcie z lateksem zadeklarowane w kwestionariuszu), na podstawie których nadwrażliwość na lateks stwierdzono u 29 badanych. Dla testu prowokacji rękawiczkami lateksowymi uzyskano wyniki prawdziwie dodatnie u 23 pacjentów, prawdziwie ujemne u 82, fałszywie dodatnie u 6, fałszywie ujemne u 24 badanych. Po podstawieniu tych wartości do wzoru na swoistość {82/(82+6)} × 100% otrzymujemy wskaźnik swoistości dla testu prowokacji rękawiczkami lateksowymi wynoszący 93,2% (wyliczenia własne na podstawie wyników podanych w pracy [18]).
Przykład 4: W badaniach przeprowadzonych w 2005 roku z udziałem 46 osób uczulonych na lateks oraz 33 osób nieuczulonych, za punkt odniesienia przyjęto połączenie wywiadu, wyników punktowych testów skórnych lub obecności specyficznego IgE. Wszyscy pacjenci zostali następnie przebadani za pomocą cytometrycznego testu aktywacji bazofilów (BAT). Liczba wyników prawdziwie dodatnich wyniosła 39, prawdziwie ujemnych 29, fałszywie dodatnich 4, a fałszywie ujemnych 7. Po podstawieniu wartości do wzoru na swoistość {29/(29+4)} × 100% otrzymujemy wskaźnik swoistości BAT wynoszący 87,9% [19].
Czułość i swoistość testu można oszacować na podstawie stosunkowo prostych badań klinicznych. "Idealny" test o 100% czułości i 100% swoistości kwalifikowałby prawidłowo wszystkich pacjentów, jednak zgodnie z teorią Bayesa żaden pojedynczy test nie osiąga takiej skuteczności. Dodatkowo Krieg zwrócił uwagę na notoryczny brak w publikacjach i ulotkach załączonych do odczynników szczegółowych informacji na temat populacji, w jakiej zebrano dane wykorzystane do wyliczenia swoistości i czułości. W przypadku zaawansowanej choroby test może prawidłowo kwalifikować pacjentów z blisko 100% czułością, jednak u pacjentów w początkowych stadiach choroby może on wykazywać zaledwie 20% czułość, co będzie skutkowało nieprawidłowym rozpoznaniem aż u 80% chorych [1]. Błędem jest zatem interpretacja wyników testu na podstawie samej czułości bądź swoistości przy braku informacji o kryteriach włączenia do grupy badanej. Dodatkowo opieranie się na czułości i swoistości testu skutkuje pominięciem istotnego czynnika, jakim jest częstość występowania badanej cechy w określonej populacji. Można to zilustrować przykładem hipotetycznej grupy 1000 osób, w której częstość uczulenia na alergen X wynosi 40%, a na alergen Y - 2%. Różnice skuteczności dwóch testów o identycznych wskaźnikach czułości i swoistości wynoszących w każdym przypadku po 95% ilustruje tabela III, która uzmysławia, że w przypadku częstego (40%) uczulenia na alergen X odsetek osób prawdziwie uczulonych wśród osób z dodatnim wynikiem testu wyniesie 92,7%, natomiast w przypadku rzadkiego (2%) uczulenia na alergen Y odsetek ten wyniesie zaledwie 27,9%. Sytuacja, w której 2 spośród 3 osób z dodatnim wynikiem testu w istocie nie są uczulone wydaje się częsta w codziennej praktyce, jednak trudna do zaakceptowania z punktu widzenia lekarza klinicysty. Dlatego w praktyce lekarskiej pożądana jest ocena testu na podstawie wartości predykcyjnych, które uwzględniają częstość występowania badanej cechy w wybranej populacji. Dodatnia i ujemna wartość predykcyjna opisują prawdopodobieństwo faktycznej obecności lub nieobecności uczulenia u pojedynczego pacjenta z danym wynikiem testu diagnostycznego. Powracając do przykładu z tabeli III, wartości predykcyjne dodatnie i ujemne wyniosłyby 92,7% i 96,6% przy częstości uczulenia 40% oraz odpowiednio 27,9% i 99,9% przy częstości 2%. Mimo bez wątpienia większej wartości klinicznej, oszacowanie wartości predykcyjnych wiąże się z koniecznością przeprowadzenia pracochłonnych i kosztownych przekrojowych badań populacyjnych osobno dla każdego testu, alergenu oraz populacji docelowej (rozpoznanie, grupa wiekowa, ekspozycja).
Wartość predykcyjna dodatnia (PPV) określa procent pacjentów, którzy rzeczywiście są uczuleni wśród wszystkich osób z dodatnim wynikiem testu. Wartość predykcyjna ujemna (NPV) określa procent pacjentów, którzy faktycznie nie są uczuleni wśród wszystkich osób z ujemnym wynikiem testu [1,2,10,20,21].
Przykład 5: Na bazie międzynarodowych badań nad występowaniem astmy i alergii w dzieciństwie (International Study of Asthma and Allergies in Childhood, ISAAC) w trzech hiszpańskich miastach przeprowadzono randomizowane analizy na grupie dzieci w wieku szkolnym (9-12 lat). Do rodziców rozesłano kwestionariusze, a na podstawie odpowiedzi oceniono obecność atopii u dziecka. U 621 dzieci wykonano punktowe testy skórne (SPT) z 8 najczęściej uczulającymi alergenami (D. pteronyssinus, D. farine, kot, Alternaria, mieszanka alergenów pyłków drzew, mieszanka alergenów pyłków traw, pyłek drzewa oliwnego, Parietaria). Za marker atopii przyjęto obecność reakcji dodatniej na minimum jeden alergen. Na podstawie odpowiedzi w kwestionariuszu, dzieci zakwalifikowano ponadto do grup z astmą (79), zapaleniem śluzówki nosa i spojówek (102) oraz bez objawów ze strony układu oddechowego (474). U wszystkich dzieci wykonano następnie test Phadiatop™ i wyliczono wskaźniki skuteczności dla całej grupy oraz dla grup z poszczególnymi objawami. Dodatnia oraz ujemna wartość predykcyjna tego testu wyniosły odpowiednio dla całej populacji 72,7% i 92,7%, dla dzieci z objawami astmy 87,5% i 95,6%, dla dzieci z objawami zapalenia śluzówki nosa i spojówek 84,0% i 93,9%, a dla dzieci bez objawów ze strony układu oddechowego odpowiednio 64,3% i 92,4%. Dodatkowo zarówno test Phadiatop™, jak i punktowe testy skórne nieprawidłowo sugerowały atopię u 10% dzieci faktycznie zdrowych (wyniki fałszywie dodatnie) [22,23].
Przykład 6: Do badań nad skutecznością testu Phadiatop™ w populacji dorosłych wylosowano 469 pacjentów (18-92 lata, mediana 54). Do badanych rozesłano kwestionariusze w celu zebrania danych demograficznych oraz informacji o narażeniach i obecności objawów ze strony górnych dróg oddechowych. Dodatkowo u wszystkich wykonano skórne testy punktowe z alergenami roztoczy kurzu domowego, pyłkami traw i drzew, pleśni, sierścią kota i psa. Test Phadiatop™ został wykonany u 465 spośród 469 osób, u 4 wykonanie testu nie było możliwe ze względów technicznych. Przyjmując za punkt odniesienia wynik punktowych testów skórnych, w teście Phadiatop™ uzyskano 85 wyników prawdziwie dodatnich, 32 fałszywie dodatnie, 313 prawdziwie ujemnych oraz 35 fałszywie ujemnych. Dla pacjentów deklarujących w kwestionariuszu objawy ze strony układu oddechowego (n=221) wyniki przedstawiały się następująco: prawdziwie dodatnie 61, fałszywie dodatnie 12, prawdziwie ujemne 132 oraz fałszywie ujemne u 16 pacjentów. Na podstawie tych wyników obliczono wartości predykcyjne dodatnie i ujemne, które wyniosły odpowiednio 72,6% i 89,9% dla całej badanej populacji dorosłych oraz 83,5% i 89,1% dla dorosłych z objawami ze strony układu oddechowego [24,25].
Skuteczność testu diagnostycznego to procent pacjentów prawidłowo zakwalifikowanych przez test diagnostyczny do grupy uczulonych bądź nieuczulonych [26].
Przykład 7: W badaniach nad skutecznością testu diagnostycznego do samodzielnego wykonania wykrywającego obecność alergii na nikiel (Nixema®, Mekos Laboratories) wzięło udział 191 badanych. Za "złoty standard" przyjęto wynik testów płatkowych jednocześnie wykonywanych w klinice dermatologicznej. Po odczycie samodzielnie wykonanego testu przez pacjentów i lekarzy oraz testu płatkowego przez lekarzy stwierdzono 33 wyniki prawdziwie dodatnie, 132 prawdziwie ujemne, 13 fałszywie dodatnich oraz 13 fałszywie ujemnych. Po podstawieniu wartości do wzoru na skuteczność testu diagnostycznego {33+132/(33+132+13+13)} × 100%, otrzymujemy wskaźnik skuteczności dla testu Nixema® wynoszący 86,4% (wyliczenia własne na podstawie wyników podanych w pracy [27]).
Przykład 8: W celu określenia skuteczności testu RAST w wykrywaniu alergii na tymotkę przeprowadzono badania z udziałem 69 pacjentów. Na podstawie przyjętego przez autorów "złotego standardu", jakim była prowokacja donosowa lub dospojówkowa, alergię na tymotkę stwierdzono u 36 badanych. W teście RAST uzyskano 34 wyniki prawdziwie dodatnie, 23 prawdziwie ujemne, 10 fałszywie dodatnich oraz 2 fałszywie ujemne. Po podstawieniu tych wartości do wzoru na skuteczność testu diagnostycznego {34+23/(34+23+10+2)} × 100%, otrzymujemy dla testu RAST wskaźnik skuteczności wynoszący 82,6% (wyliczenia własne na podstawie wyników podanych w pracy [28]).
Wskaźnik wiarygodności dla testu dodatniego (LR+) to prawdopodobieństwo otrzymania wyniku dodatniego u osoby uczulonej w stosunku do prawdopodobieństwa otrzymania wyniku dodatniego testu u osoby nieuczulonej. Wskaźnik LR+ może przyjmować wartości od 0 do nieskończoności, wyższe wartości przemawiają na korzyść wiarygodności testu dodatniego.
Wskaźnik wiarygodności dla testu ujemnego (LR-) to prawdopodobieństwo otrzymania wyniku ujemnego u osoby uczulonej w stosunku do prawdopodobieństwa otrzymania wyniku ujemnego u osoby nieuczulonej. Wartości LR- zbliżone do 0 sugerują wyższą wiarygodność testu ujemnego. Wskaźniki wiarygodności są rzadko stosowane ze względu na mało intuicyjną i trudną interpretację.
Przykład 9: W badaniach przeprowadzonych w celu określenia czułości i swoistości testów śródskórnych u 37 dorosłych z objawami sezonowego alergicznego nieżytu nosa w wywiadzie, za "złoty standard" autorzy przyjęli wynik prowokacji donosowej z alergenem pyłku tymotki. Wyliczone wskaźniki czułości i swoistości dla testów śródskórnych wyniosły odpowiednio 93,3% (0,933) oraz 86,4% (0,864). Po podstawieniu tych wartości do wzoru na wskaźnik wiarygodności testu dodatniego {0,933/(1-0,864)} otrzymujemy wskaźnik LR+ wynoszący 6,86. Po podstawieniu do wzoru na wskaźnik wiarygodności testu ujemnego {(1-0,933)/0,864} otrzymujemy wskaźnik LR- równy 0,08 (wyliczenia własne na podstawie wyników podanych w pracy [29]).
Przykład 10: W badaniach określających skuteczność testu Allergodip® (Allergopharma) w wykrywaniu IgE swoistych wobec lateksu wzięło udział 135 pacjentów. Za punkt odniesienia przyjęto wynik testu ImmunoCAP®, za pomocą którego u 69 badanych potwierdzono alergię na lateks. Na podstawie tych wyników wyliczono wskaźnik czułości i swoistości dla testu Allergodip®, który wyniósł odpowiednio 85,1% (0,851) oraz 75,0% (0,750). Po podstawieniu tych wartości do wzoru na wskaźnik wiarygodności testu dodatniego {0,851/(1-0,750)} otrzymujemy wskaźnik LR+ wynoszący 3,4. Po podstawieniu do wzoru na wskaźnik wiarygodności testu ujemnego {(1-0,851)/0,750} otrzymujemy wskaźnik LR- równy 0,20 (wyliczenia własne na podstawie wyników podanych w pracy [18]).
Zgodność testów opisuje się zwykle za pomocą dwóch terminów: powtarzalności i odtwarzalności. Powtarzalność to zgodność wyników niezależnych badań tego samego materiału przeprowadzonych przez tego samego badacza w identycznych warunkach za pomocą tej samej metody. W diagnostyce laboratoryjnej można ponadto spotkać się z terminem odtwarzalności, który odnosi się do możliwych rozbieżności wyników badania tego samego materiału w różnych laboratoriach. W publikacjach oba terminy nierzadko są traktowane jako synonimy [30-36].
Przykład 11: W 2008 roku Ronchetti i wsp. przeprowadzili badania z udziałem 227 dzieci w celu ustalenia powtarzalności wyników atopowych testów płatkowych (APT) z komercyjnymi i świeżymi alergenami pokarmowymi (mleko krowie, jaja kurze, pomidor, mąka pszenna) oraz komercyjnymi alergenami wziewnymi (Dermatophagoides pteronyssinus, mieszanka traw). Testy zostały wykonane w dwóch powtórzeniach na lewej i prawej stronie pleców tych samych pacjentów. Uzyskane wyniki sugerują niską powtarzalność atopowych testów płatkowych w przypadku alergenów pokarmowych zarówno komercyjnych, jak i świeżych. Odnotowana przez autorów powtarzalność APT z natywnymi pokarmami mieściła się w zakresie od 38% (pomidor) do maksymalnie 81% (mleko). Natomiast w przypadku aeroalergenów autorzy stwierdzili 100% powtarzalność [37].
POLECAMY: Praktyczny Kurs
Zapraszamy Państwa bardzo serdecznie do udziału w Praktycznym Kursie "Testy płatkowe: techniki wykonania i zasady interpretacji". Z naszego kursu skorzystało już ponad 400 lekarzy. Kurs obejmuje 8 godzin intensywnego szkolenia w formie prezentacji multimedialnych i ćwiczeń praktycznych. Naszym celem jest przekazanie Państwu wiedzy nowoczesnej, opartej na dowodach naukowych oraz rekomendacjach organizacji międzynarodowych. Kładziemy nacisk na umiejętności praktyczne i dostosowanie szkolenia do indywidualnych potrzeb uczestników, dlatego nasze kursy odbywają się w małych, maksymalnie dwudziestoosobowych grupach. Każdemu Uczestnikowi zapewniamy możliwość własnoręcznego założenia testów płatkowych na plecach żywych statystów. Praktyczny Kurs "Testy płatkowe: techniki wykonania i zasady interpretacji" odbywa się w luźnej, przyjaznej atmosferze. Kurs prowadzony jest przez ludzi, dla których testy płatkowe są zawodową pasją i tematem badań naukowych. Chętnie podzielimy się z Państwem naszą pasją i przekażemy wiedzę, która w codziennej praktyce przyniesie wymierne korzyści Państwu i pacjentom. Do zobaczenia w Krakowie!
Zapisy: medukacja.biz |
Przykład 12: W celu porównania odtwarzalności wyników testów płatkowych aplikowanych przy użyciu technik zaproponowanych przez dwóch producentów: testu T.R.U.E. (Mekos) oraz aplikacji haptenów za pomocą komór IQ (Chemotechnique), u 207 pacjentów przeprowadzono analizę wyników równoczesnego badania oboma systemami z 21 substancjami testowymi (hapteny lub mieszanki haptenów). Całkowita zgodność pomiędzy obiema metodami wyniosła 64,4%. W odniesieniu do testu z kobaltem autorzy stwierdzili pominięcie istotnych klinicznie odczynów u 78% pacjentów w przypadku zastosowania T.R.U.E. testu oraz 4% pacjentów w przypadku zastosowania komór IQ. Jednocześnie T.R.U.E. test wykrył wszystkie istotne klinicznie odczyny na Quaternium 15, w odróżnieniu od aplikacji haptenu w komorach IQ, za pomocą których nie wykryto 50% reakcji. Korelacja dodatnich wyników znacząco różniła się dla poszczególnych haptenów i była najwyższa (100%) dla kalafonii, mieszanki parabenów oraz mieszanki merkaptanów. Brak korelacji w wynikach dodatnich odnotowano dla kliochinolu i lanoliny (alkohole wełny). W przypadku użycia komór IQ uzyskano większą liczbę wyników fałszywie dodatnich, w przypadku testu T.R.U.E. większą liczbę wyników fałszywie ujemnych. Z punktu widzenia praktyka, uzyskanie wyników fałszywie ujemnych przy użyciu testu T.R.U.E. wiąże się z większym ryzykiem pominięcia istotnych klinicznie wyników dla haptenów takich jak chrom, substancje zapachowe, kobalt i balsam peruwiański, które zostałyby wykryte w przypadku zastosowania komór IQ [38].
Przykład 13: W celu porównania wyników pomiaru swoistego IgE trzema różnymi metodami laboratoryjnymi, surowicę od 50 pacjentów pediatrycznych przebadano w trzech różnych laboratoriach diagnostycznych z sześcioma wybranymi alergenami (jajko, mleko, orzech ziemny, sierść kota, brzoza oraz Dermatophagoides farinae) [39]. Wyniki uzyskane przy równoległym zastosowaniu metod Turbo-MP (Agilent Technologies Co) oraz Immulite 2000 (Siemens Medical Solutions Diagnostics) zostały odniesione do wyników uzyskanych z zastosowaniem metody ImmunoCAP (Phadia). Dla metody Turbo-MP badacze stwierdzili zgodność wyników tylko dla alergenu jaja, nieznaczne różnice dla alergenów mleka i orzecha ziemnego, natomiast znaczne zaniżenie wyników stwierdzono w przypadku brzozy i D. farinae. W metodzie Immulite wyniki pomiaru IgE swoistego dla wszystkich alergenów były zawyżone w porównaniu do wyników uzyskanych w metodzie ImmunoCAP. Autorzy zwrócili uwagę na możliwe różnice w budowie alergenów dystrybuowanych przez producentów poszczególnych metod pomiarowych. Dopiero po konsultacjach z firmami ustalono, że pod nazwą "alergen brzozy" kryły się ekstrakty pyłków pochodzące z różnych gatunków brzozy, jednak nie było o tym wzmianki w informacjach dołączanych do produktów.
W przypadku, gdy wyniki testów diagnostycznych mają charakter zmiennych ciągłych (np. poziom swoistych IgE lub średnica bąbla w teście punktowym) i mogą przybrać dowolną wartość w zakresie pomiarowym testu, lekarz staje przed dylematem, od jakiej wartości wynik może być uznany za dodatni. Narzędziem wyboru optymalnych punktów odcięcia wyników pozytywnych od negatywnych, a zatem optymalizacji czułości i swoistości testu jest wyprowadzanie krzywych ROC (Receiver-Operator Characteristics Curves). Najczęściej stosuje się krzywą ROC przedstawiającą zależność częstości występowania wartości prawdziwie dodatnich (czułość) od wartości fałszywie dodatnich (1-swoistość) [40-42]. Analiza krzywej ROC pozwala na ustalenie najbardziej akceptowalnego kompromisu pomiędzy czułością a swoistością testu, a tym samym osiągnięcie największej skuteczności w wykrywaniu uczulenia na konkretny alergen lub hapten. Zdolność testu do prawidłowego różnicowania osób uczulonych od nieuczulonych rośnie w miarę zbliżania się krzywej do lewego górnego rogu wykresu. Rycina 1 przedstawia krzywą ROC dla testu o niskiej skuteczności (krzywa oddalona od lewego górnego rogu wykresu), natomiast rycina 2 przedstawia krzywą ROC testu o wysokiej skuteczności (krzywa przylega do rogu).
Punkt odcięcia testu nie jest stałą cechą przypisaną do danej metody diagnostycznej, lecz zależy od szeregu czynników, takich jak rodzaj alergenu lub haptenu (naturalny czy rekombinowany, mieszanka alergenów czy pojedynczy epitop), populacja docelowa (wiek badanych, choroba główna i stany współistniejące) oraz przyjęty punkt odniesienia, czyli tzw. "złoty standard" [43-49].
Przykład 14: Plebani i wsp. w 1996 roku przeprowadzili szczegółowe analizy punktów odcięcia dla poziomu IgE (Immuno CAP) swoistego wobec 5 alergenów wziewnych u pacjentów z alergią oddechową. Przyjmując za punkt odniesienia kompilację historii choroby, danych klinicznych i wyników SPT autorzy stwierdzili, że optymalny punkt odcięcia powinien być ustalany dla każdego alergenu indywidualnie. Przykładowe wyniki oraz zależność czułości i swoistości od przyjętego punktu odcięcia ilustruje tabela IV. Jak widać czułość i swoistość są cechami odwrotnie proporcjonalnymi, co oznacza, że zmieniając parametry testu tak, by zwiększyć jeden wskaźnik, musimy liczyć się z obniżeniem drugiego [50].
W ocenie skuteczności testu niezmiernie ważne jest dobranie odpowiedniego punktu odniesienia, do którego będziemy porównywać wyniki ocenianej metody. W alergologii rzadko mamy do czynienia z pojedynczym testem, który jednoznacznie kwalifikowałby pacjentów jako uczulonych lub nieuczulonych. Najbliższe takiemu ideałowi wydają się prowokacje alergenowe, co czyni z nich preferowany "złoty standard" przy ocenie innych metod diagnostycznych. Nie zawsze jednak prowokacja jest wykonalna lub akceptowalna ze względów etycznych. W ostatnich latach zwrócono ponadto uwagę na problem lokalnego alergicznego nieżytu nosa, charakteryzującego się miejscową produkcją swoistych IgE przy ich nieobecności w krwi krążącej, co się objawia dodatnim wynikiem w teście prowokacji donosowej przy ujemnych wynikach oznaczeń IgE swoistych w surowicy i punktowych testach skórnych [51-53]. Dlatego niekiedy wybiera się inne "złote standardy", w tym uprzednio poddane walidacji metody diagnostyczne lub ich kombinacje. Należy przy tym pamiętać, że żaden z wybranych "złotych standardów" nie stanowi prawdy absolutnej i wyniki oceny skuteczności testu zależeć będą od wybranej metody referencyjnej [54]. Najbardziej racjonalnym podejściem jest krytyczne spojrzenie na wyniki badań dodatkowych oraz indywidualne podejście do diagnozy stawianej u każdego pacjenta, której podstawą niezmiennie pozostaje dobrze zebrany wywiad lekarski.
Przykład 15: W celu porównania skuteczności trzech dostępnych testów diagnostycznych do oznaczania IgE swoistego wobec lateksu w surowicy (ImmunoCAP®, AlaSTAT®, HY-TEC®), ich czułość i swoistość oraz wartości predykcyjne oceniono na podstawie dwóch różnych "złotych standardów": historii choroby oraz wyników punktowych testów skórnych. Uzyskane wyniki pokazują znaczące różnice w ocenie skuteczności poszczególnych testów w zależności od wybranego "złotego standardu" (tab. V) [55].
Przykład 16: W roku 1986 w Szwecji zbadano różnice pomiędzy skutecznością różnych technik diagnostycznych (wywiad, punktowe testy skórne, RAST) oraz ich kombinacji w wykrywaniu alergii na brzozę u 69 pacjentów z nieżytem nosa i/lub spojówek. Za punkt odniesienia przyjęto wynik prowokacji spojówkowej i nosowej. Autorzy doszli do wniosku, że w praktyce klinicznej najlepiej oprzeć się na wyniku testów punktowych oraz poziomie swoistego IgE (tab. VI) [28].
W punktowych testach skórnych, atopowych testach płatkowych oraz testach in vitro wykrywających swoiste IgE wykorzystuje się naturalne ekstrakty alergenów lub rzadziej antygeny rekombinowane. Różnice w zawartości poszczególnych alergenów w wyrobach różnych producentów, brak standaryzacji testów oraz powszechnie uznanych rekomendacji dotyczących rodzaju stosowanych alergenów mogą skutkować rozbieżnością wyników w przypadku wykonania testów u tego samego pacjenta w różnych laboratoriach diagnostycznych lub przez różnych lekarzy. W badaniach przeprowadzonych w Danii wykazano, że spośród dziewięciu komercyjnie dostępnych ekstraktów alergenowych orzecha laskowego do testów skórnych lub oznaczania swoistego IgE, trzy nie zawierały epitopu odpowiedzialnego za występowanie reakcji anafilaktycznych. Na skutek tego u sześciu spośród trzydziestu przebadanych pacjentów (20%) nie wykryto klinicznie istotnej nadwrażliwości na ten alergen [56].
Objawy obecne u pacjentów zgłaszających się do poradni alergologicznych rzadko są charakterystyczne na tyle, by lekarz był w stanie zidentyfikować odpowiedzialny alergen lub hapten bez dodatkowych badań. Niggemann i wsp. wykazali, że znajomość poziomów swoistych IgE w surowicy pacjentów zmniejsza odsetek wątpliwych rozpoznań z 86% do 22%, co znacząco poprawia skuteczność diagnostyki już w trakcie pierwszej wizyty pacjenta oraz skraca czas oczekiwania na ostateczne rozpoznanie [57]. Podobnie Rajagopalan i wsp. zaobserwowali, że wykonanie testów płatkowych zwiększa szansę ostatecznego rozpoznania i ponad 20-krotnie skraca czas oczekiwania na ostateczne rozpoznanie [58,59]. Z drugiej strony dodatni wynik testu diagnostycznego nie implikuje, że dany alergen lub hapten jest faktyczną przyczyną bieżących dolegliwości pacjenta m.in. w związku z możliwością alergii krzyżowej lub odczynem na alergen istotny w przeszłości, z którym aktualnie pacjent nie ma już styczności. Dlatego w przypadku każdego dodatniego wyniku lekarz powinien poszukiwać odpowiedzi na pytanie czy wykryte uczulenie faktycznie jest przyczyną obecnej choroby [60]. Na skuteczność testów wpływa ponadto dobór i liczba testowanych alergenów lub haptenów [61,62].
W procesie diagnostycznym rolą laboratorium jest rzetelne wykonanie zleconych badań, przy czym stosowane testy powinny być "dopasowane" do populacji, która zgłasza się do danego lekarza. To samo odnosi się do testów diagnostycznych in vivo wykonywanych przez lekarza. Laboratoria stosują przeważnie zestawy diagnostyczne zagranicznych producentów, a normy podane w ulotkach produktów zwykle odnoszą się do populacji w krajach pochodzenia, gdzie między innymi częstość występowania uczulenia na dany alergen może zasadniczo różnić się od populacji polskiej. Również wiek i choroba podstawowa mogą znacząco wpływać na dobór punktów odcięcia dla danego testu diagnostycznego. W odniesieniu do testów in vivo, kwestia wiarygodności testów jest tematem zaledwie pojedynczych prac badawczych. Ponieważ wynik testu może rzutować nawet na 70% podejmowanej decyzji medycznej, zrozumienie znaczenia wskaźników określających skuteczność każdej procedury diagnostycznej – zarówno tej stosowanej w laboratorium, jak i testu wykonywanego przez samego lekarza – jest fundamentem prawidłowej oceny stanu pacjenta [2]. W szczególności potrzebne jest opracowanie norm dla populacji, z którą alergolog ma do czynienia w swojej praktyce. Pozwoli to zminimalizować ryzyko zaniechania niezbędnej terapii u osób potrzebujących lub narażenia na niepotrzebne leczenie błędnie zdiagnozowanych pacjentów.
Piśmiennictwo
Ta strona jest częścią serwisu www.RadoslawSpiewak.net.
© Radoslaw Spiewak (kontakt).
Document created: 18 February 2014, last updated: 6 March 2014.