11 ROC around the clock

Von Medicus58

11 ROC around the clock

Gehen Sie von einem sehr guten klinischen Bluttest (z.B. auf Grippeviren) aus, der eine 90%-ige Sensitivität und 90%-ige Spezifität hat, aus und schätzen Sie, wie groß die Wahrscheinlichkeit ist, dass ein Patient, der einen positiven Test hat, auch wirklich erkrankt ist.

Wir befinden uns vor einer Grippewelle und die Krankheitsprävalenz beträgt aktuell 1:1000, d.h. ein Mensch von 1000 ist schon angesteckt .....

so endete das letzte Kapitel und es wird Zeit für die Auflösung:

Der positive Vorhersagewert, so nennt man das, wonauch gefragt wurde, beträgt 0,9%!
Wären wir aber schon am Höhepunkt der Grippewelle und nicht 1:1000 sondern bereits 1 : 100 Personen haben sich angesteckt, dann wäre der positive prädiktive Wert schon 8,3%.

Was lernen wir daraus?

Sens und Spec eines Testes sagen für sich genommen über den erreichbaren klinischen Erkenntnisgewinn wenig aus, wenn das gesuchte Merkmal sehr selten ist.
komplizierter wird die Sache nun durch die schon angesprochenen Normalwerte
Diese gelten natürlich nicht nur für Blutteste, sondern jedes Testverfahren. 
Ein Radiologe kann im CT zB. einen Lymphknoten schon mit einem Durchmesser von 5 mm als pathologisch diagnostizieren und hat dadurch die Sensitivität seines Testes deutlich angehoben, d.h. er wird weniger Lymphknotenmetastasen übersehen, nur fällt seine Spezifität in den Keller, d.h. viele der von ihm als pathologisch beschriebenen Lymphknoten sind dann gar keine Metastasen sondern normal große oder gering entzündlich veränderte Lymphknoten.
Um dieses Phänomen zu veranschaulichen und um zwei Testverfahren unabhängig von den jeweils festgelegten Normalweten vergleichen zu können, wurde die ROC Analyse (http://de.wikipedia.org/wiki/Receiver_Operating_Characteristic) entwickelt:

In Folie 1 sehen wir die erzielbaren Sensitivität und Spezifität eines Testes in Abhängigkeit von den gewählten Normal- bzw. Schwellenwerten.
Bei einen laxen Schwellenwert (Punkt rechts oben) ist Sensitivität hoch (in diesem Beispiel 0,94), die Spezifität aber mit 0,44 aber im Keller. Anders ausgefrückt: Wir übersehen wieder keinen Kranken, machen aber mehr als die Hälfte der Gesunden mit einem pathologischen testergebnis fälschlich krank. Mit einem Strikten Schwellenwert (Punkt links unten) sind die Verhältnisse umgekehrt (Sensitivität nur mehr 0,46, Spezifität aber 0,92).

Folie 2 zweigt uns nun eine vergleichbare Darstellung, in der nun die Testcharakteristik in ein Quadrat eingetragen wird, dessen Seiten nun Vortestwahrscheinlichkeit und Nachtestwahrscheinlichkeit entsprechen.
Ein völlig sinnloser Test, oder der Verzicht auf irgendeien Test (kein Test) ergibt eine Diagonale, d.h. die 
Vortestwahrscheinlichkeit = 
Nachtestwahrscheinlichkeit.=
kein Informationszugewinn
Normale Teste haben eine den gelben Linien entsprechende Charakteristik, wobei je eine der Kurven dem positiven (abnormen) und dem negativen (gesunden) Ergebnis entspricht.
Grafisch wird schnell kalr, dass der Informationszugewinn immer größer wird, je weiter ein positives oder negatives Ergebnis von der roten Linie auslenkt.
Die grüne Linie repräsentiert einen nahezu utopischen Informationszugewinn.

An dieser grafischen Darstellung (Folie 3) wird auch ein anderes Gesetz der klinischen Diagnostik klar: In der Regel hat man den größten diagnostischen Zugewinn zu erwarten, wenn man einen Test bei mittlerer Vortestwahrscheinlichkeit anfordert.

Bei mittlerer Vortestwahrscheinlichkeit, also in der mitte der linken Seite unseres Quadrats ist der Informationszugewinn, also die Distanz zwischen roter Linie und Textcharakteristik am größten.

Wir haben heute einiges für die Praxis gelernt, auch wenn die Darstellugnen sehr theoretisch wirkten:

Die gewählten Normalwerte beeinflussen Sensitivität und  Spezifität eines testes, ohne, dass sich am testverfahren selbst (Labortest, CT-Bild, ...) etwas ändert.

Wir verstehen nun. die 2-stufige Testung beim Screening auf HIV.
Ist die gesuchte Krankheit im untersuchten Kollektiv sehr selten, dann muss ich einen sehr, sehr sensitiven Test anwenden, um die wenigen Kranken nicht zu übersehen, handle mir aber damit viele falsch positiven (Gesunde mit einem abnormen Testergebnis) ein. Diese filtere ich mit einem auf hohe Spezifität getrimmten zweiten Test heraus. Die hohe Spezifität des zweiten Tests hätte uns zwar viele falsch positive Teste (und unnötig aufgeregte Patienten) bei der ersten Runde erspart, es liefen aber viele HIV-Positive mit einem falsch negativen Testergebnis herum.