Logo - www.supervision-hamburg-gesundheitswesen.de
 Startseite STARTSEITE
 
 Supervision - Allgemeines / Grundbedingungen / Zielsetzungen / Grenzen SUPERVISION
 
 Teamberatung TEAMBERATUNG
 
 Krisenintervention KRISENINTERVENTION
 
 Fortbildungen FORTBILDUNGEN
 
 Informationen zur Organspende: www.transplantation-information.de TRANSPLANTATION
 
 Termine TERMINE
 
 Über mich ÜBER MICH
 
 Kontakt KONTAKT
 
 Impressum IMPRESSUM
Roberto Rotondo - Dipl.-Psychologe & Krankenpfleger

Vorträge

Patienteneinschätzung - Score-Systeme

Überwindung der Subjektivität des Arztes durch objektive Entscheidungen eines Computerprogramms?

Inhaltsverzeichnis

  1. Was sind Score-Systeme?
  2. Wie soll sichergestellt werden, daß das Programm mißt, was es vorgibt zu messen?
  3. Zweifel und Kritik
  4. Vorhandene Anwendungsbereiche von Schweregradklassifikationssystemen
  5. Anwendung auch im Individualfall?
  6. Zukünftige Entwicklungen
  7. Schlußfolgerungen
  8. Literatur

Was sind Score-Systeme?

Die Entwicklung von Score-Systemen begann in den USA. (2, S. 477) Score-Systeme sind sogenannte Schweregradklassifikationssysteme oder Punktsummensysteme, die vorgeben, ei­ne quantitative Aus­sage über den Schweregrad einer Erkrankung, ihrer Pro­gnose und deren Verlauf treffen zu können. Mittlerweile gibt es bereits diverse Softwarepro­gramme, die jeweils unterschiedlich aufgebaut sind und auch unterschied­lich verwendet wer­den.

APACHE: Acute Physiology and Chronic Health Evaluation Score; SAPS: Simplified Acute Physiology Score; TISS: Therapeutic Intervention Scoring System; RIP: Riyadh Intensiv Care Unit Program; HIS: Hannover Intensiv Score; KISS: Kombiniertes Intensiv Scoring System; TS: Trauma Score; TI: Trauma Index; HTI: Hospital Trauma Index; ISS: Injury Severity Score; AIS: Abbreviated Injury System; MOFS: Multi-Organ-Failure-Score; MPI: Mannheimer Perito­nitis Index; GCS: Glasgow Coma Scale.

Ich möchte mich an dieser Stelle dem vermeintlich besten Programmen zuwenden - dem APACHE-II bzw. APACHE-III Pro­gramm. Als hauptsächliches Kriterium wird in ihnen die Letalität berechnet. Das bedeutet, daß die Computerprogramme ausrechnen, mit welcher Wahr­scheinlichkeit ein Patient versterben wird und sie können sogar ausrechnen, welche Ko­sten wahrscheinlich entstehen werden, wenn weiter therapiert wird. (6) Je höher also die Le­talitätswahrscheinlichkeit ausgerechnet wird, desto schwerer wird die Erkrankung einge­schätzt. Ziel der Entwicklung dieser Programme war es, die subjek­tive Entscheidung eines Arztes durch die „objektive“ Entscheidung eines Computers zu ersetzen.

Wie soll sichergestellt werden, daß das Programm mißt, was es vorgibt zu messen?

Es wird üblicherweise so verfahren, daß einzelnen Parametern (z.B. Tempe­ratur, Herzfre­quenz, art. Blutdruck, best. Blutwerten, dem neurologischen Status usw.) Punktwerte zuge­wiesen werden, die dann zu einem Gesamtpunkt­wert des Scores addiert werden. Im APACHE-II Score werden Punkte (max. 70) für akut physiologische Parameter, für das Alter, zur Bewertung chronischer Vorerkrankungen und zur Bewertung der Bewußtseinslage (Glas­gow Coma Scale) verteilt. Es wird angenommen, daß eine steigende Punktzahl einen höheren Schweregrad der Erkrankung markiert und somit eine schlechtere Prognose für die Patienten gegeben ist (11, S. 1).

Das APACHE-II Programm vergleicht die Punktwerte der Patienten mit den Daten von „17440 Patienten, die auf den Intensivstationen amerikanischer Kliniken gelegen hatten und deren Krankheitsverlauf, bis zum Tod oder der Entlassung, akri­bisch dokumentiert worden war“ (5, S. 158) und errechnet die Letalitätswahr­scheinlichkeit. Das APACHE-II Programm wurde an ca. 6000 Intensivpatienten prospektiv (vorausschauend) validiert (gültig er­klärt). (3, S. 37).

Als „Reaktion auf neue wis­senschaftliche Erkenntnisse“ (3, S. 37) wurde 1991 das APACHE-III-Programm eingeführt. Diese Version enthält mehr Parameter als die APACHE-II-Version und die Glasgow Coma Scale wurde erweitert und modifiziert. Die Gesamtpunktzahl beträgt > 300 Punkte. Auch diese Ver­sion wurde in einer prospektiven Studie an einem großen Patien­tenkollektiv (ca. 17000 Patienten) validiert.

Um keine Fehler zu begehen, muß natürlich die Qualität des Scores geklärt werden. Die vor­hergesagte Qualität eines Scores soll um so besser sein, je größer die Übereinstimmung zwi­schen geschätzter und eingetretener Letali­tät ist. Dies wird mittels eines statistischen Verfah­rens, der „receiver-operating charakteristics analysis (ROC)“, versucht. Die sogenannte „Sensitivi­tät (= die Eignung, das Versterben während des Krankenhausaufenthalts richtig vorherzusa­gen)“ und die sogenannte „Spezifität (= Eignung, bei denen, die versterben, nicht das Überleben vorherzusagen)“ werden statistisch berechnet und können dann graphisch dargestellt werden. Die ROC-Ana­lysen werden sogar „zum 'golden standard' der Beschreibung von Scoresystemen“ erklärt. (3, S. 37)

Zweifel und Kritik

Die Hersteller des Softwareprogramms haben scheinbar keine Mühen gescheut, um ihre Pro­gramme sicher zu machen. Dennoch sind aus vielerlei Gründen Zweifel angebracht. Zwar suggeriert die große Anzahl von Patientendaten, mit denen das APACHE-Programm die aktu­ellen Daten eines Patientenkollektivs oder einzelner Patienten abgleicht, daß hier große Ob­jektivität vorhanden zu sein scheint. Aber es gibt Forschungsergebnisse, die an der verbesser­ten Objektivität des Computerprogramms gegenüber der subjektiven Entscheidung eines Menschen - dem Arzt, Bedenken zulassen.

Beispielsweise haben Patienten überlebt, bei denen ein 100%iges Sterberisiko - nach entspre­chend hohem Scorewert - prognostiziert wurde. (2, S. 482) Außerdem müssen bestimmte Werte im APACHE-Programm von Menschen erhoben werden, was mit Fehlern behaftet sein kann. Beispielsweise müssen die Pflegekräfte eine Pflegedokumentation durchführen, die oft nur eine „Negativstatistik“ darstellt. Es werden eher die „schlechten“ Blutdrücke, Herzfrequenzen oder Zu­stände in die Kurve eingetragen und seltener die „Guten“. Natürlich sollte nach erfolgter In­tervention, z.B. mit einem Medikament, auch dokumentiert werden, ob diese auch eine Besse­rung nach sich zog. Wenn jedoch eine Aufnahme kam oder aus anderen Gründen - Reanima­tion bei einem anderen Patienten - keine Zeit blieb, um eine Kontrolle durchzuführen, hat man über längere Zeit nur „schlechte“ Werte dokumentiert. Die Computerprognose für den Patienten kann jedoch nur besser werden, wenn oft „gute“ Werte gemessen und auch einge­tragen werden.

Ein wesentlich gravierenderes Problem des APACHE-Scores stellt meiner Ansicht nach die Glasgow Coma Skala dar. Problematisch ist die neurologische Beurteilung von Patienten, die aufgrund ihrer Grunderkrankung (z.B. kranielle Verletzung) dauernd sediert werden müssen. „Wir schätzten den Grad der Bewußtseinsstörung, wie er ohne sedierende Maßnahmen zu vermuten wäre, anhand aller anamnestischen, klinischen und bildgebenden Befunde ein [...]. In ähnlicher Weise verfuhren wir bei der Berechnung von APACHE-III.“ (3, S. 38) Auch diese Aussage verdeutlicht meiner Ansicht nach, die Unsicherheit des Programms, weil hier der Mensch die entscheiden­de Rolle bei der Beurteilung spielt. Und, ob wirklich immer erfahrene Ärzte im Dienst sind, um eine Beurteilung abzugeben, ist aus meiner Erfahrung heraus sehr fraglich. Wie hoch die Fehlerwerte sind, wenn Ärzte, die mit der GCS vertraut sind, eine Prognose abgeben, belegt eine Studie.

In einer Vergleichsstudie von WEIKENMEIER (13) zur prognostischen Wertigkeit von Koma-Skalen bei Schädel-Hirn-Verletzten, werden die Glasgow Coma Skala und die Brüssler Coma Skala mit anderen neuen Skalen verglichen. Die höchste Korrektheit bezogen auf die Progno­se, richtig vorausgesagter Tod, betrug bei der Glasgow Coma Skala nur 86% (13, S. 98). Die höchste Korrektheit bezogen auf die Prognose, richtig vorausgesagtes Überleben, betrug bei der Glasgow Coma Skala etwa 72% (13, S. 100). Diese doch sehr hohen Fehlerquoten gehen natürlich auch in den APACHE-II bzw. -III mit ein.

Ein weiteres Beispiel, daß meiner Ansicht nach sehr gut herausstellt, daß das APACHE-Pro­gramm unsicher ist, ist in der Dissertation von SCHRÖTER (11, S. 21) dokumentiert. „Am 2. Tag zeigte der - eigentlich für die ersten 24 Stunden konzipierte - APACHE-II seine größte Aussagekraft und Trennschärfe, vom 4. Tag an fällt die Aussagekraft bis unter die Zufallswahrscheinlichkeit, der APACHE-II liefert folglich von diesem Zeitpunkt an keine prognostisch verwertbaren Informationen mehr.“

Und auch SCHUSTER (12, S. 1238) stellt heraus, daß „Aussagen zur Letalität, die sich auf Punkt­werte aus Schweregradscores beziehen, [...] eher verwirrend und weitgehend manipulierbar [sind].“

Vorhandene Anwendungsbereiche von Schweregradklassifikationssystemen

Trotz der oben erwähnten Mängel des APACHE-Programms werden seine Vorzüge hervorge­hoben und in verschiedenen Kliniken, z.b. im Klinikum der Universität Regensburg, im Städ­tischen Krankenhaus München-Neuperlach, in der Universitätsklinik Würzburg oder der Universitätsklinik für Anästhesiologie der Universität Ulm genutzt. Im Ausland werden sie schon sehr häufig verwendet. In den USA wurde schon 1994 in 400 Kliniken das APACHE-Programm zum Softwarestückpreis von damals 650 000 Dollar verwendet. (5, S. 158) Und auch in über 20 britischen Kliniken vertrauen die Mediziner der Computersoftware. (6)

Auf Patientengruppen bezogen, soll das APACHE-Programm eine sehr hohe Prognosequalität - bezogen auf die Letalitäts- bzw. die Überlebenswahrscheinlichkeit - haben.(2, 3, 3, 4, 5, 7, 11, 12) Aber nicht nur die Subjektivität des Arztes soll durch das APACHE-Programm ersetzt und objektiviert werden. Es gibt bereits diverse Anwendungsschwerpunkte des APACHE-Programms und anderer Klassifikationssysteme:

  1. Die individuellen Berechnung des Letalitätsrisikos,

  2. Der Vergleich von Patientengruppen,

  3. Die Einschätzung der Erkrankungsschwere von Intensivpatienten,

  4. Die Beurteilung von polytraumatisierten Patienten vor Hubschraubertransporten,

  5. Die Identifikation von besonders gefährdeten Patienten,

  6. Die Doku­mentation des Leistungsaufwands,

  7. Die Bewertung der Therapiemaßnahmen,

  8. Das Erstellen von Effektivitäts- und Qualitätskontrollen,

  9. Das Er­stellen von Risikoprofilen,

  10. Rationalisierung,

  11. Wissenschaftliche Untersuchungen, Beispiel: Multicenterstudien,

  12. Das Erstellen von Kosten--/Nutzenanalysen,

  13. In den USA: zur Triage von Patienten - bezogen auf die Wahl des Transportmittels oder des Versorgungszentrums (1, Trauma Score, S. 223 + 226),

  14. Auch in den USA: zur Triage bei Massenunfällen (USA), um die Reihenfolge der Primärver­sorgung festzulegen (1, Trauma Score, S. 226).

Anwendung auch im Individualfall?

Die obige Liste verdeutlicht, daß ein Hauptanwendungsfeld, die Anwendung im Individual­fall darstellt und auch nahelegt. Es werden definitiv Daten von einzelnen Patienten eingege­ben, die jederzeit auf ihn zurückzuführen sind. Es kann nicht bestritten werden, daß das APACHE-II und auch das APACHE-III Programm - wie auch andere - für den Individualfall verwendet werden oder zukünftig Anwendung finden sollen. (2, S. 477)

Eine Entscheidung auf Therapieabruch oder Nichteinsatz von Intensivmedizin im Individual­fall auf der Basis eines Computerprogramms, ist jedoch - aus vielerlei Gründen - sehr frag­würdig. Aber selbst in den Reihen der Anwender besteht darüber „Übereinstimmung“, [...] „daß eine Patientenbeurteilung abzulehnen ist, die sich ausschließlich [Hervorhebung im Original !] auf einen Score als Entscheidungskriterium für grundlegende therapeutische Entscheidungen stützt.“ (2, S. 482)

„Nach überwiegender Auffassung sind die Scores für den Einzelfall mit einer so hohen Unsicherheit be­haftet, daß sie als Entscheidungsgrundlage für den individuellen Patienten nicht einsetzbar sind.“(12, S. 1238)

„Weder APACHE II, noch MPI oder die Kombination aus beiden sind aber in ihrer individuellen Vor­hersage zuverlässig genug, um beim einzelnen Patienten gravierende Entscheidungen, z.B. einen Thera­pieabbruch, zu begründen.“ (4, S. 352; vgl. auch 1, S. 222; vgl. 3, S. 41; vgl. 10, S. 135; vgl. 11, S. 2 )

Es ist interessant, daß die Anwender des Programms einer individuellen Prognose selbst sehr skeptisch oder ablehnend gegenüberstehen, womit das Hauptanwendungsfeld dieser Pro­gramme wegfallen müßte und gleichzeitig die Frage auftaucht, welchen Sinn Gruppenverglei­che zwischen Patientenkollektiven (hohe prognostische „Sicherheit“, siehe oben) machen. Therapieabruch für ganze Patientengruppen (z.B. HIV), obwohl dies im Einzelfall bedeuten kann, daß Patienten versterben, die eine reelle Chance auf ein Überleben hatten. Die oben zi­tierten Anwender haben trotz ihrer Zweifel, keine Bedenken, die Einführung dieser Compu­tersoftware als Routinediagnostik zu fordern.

Zukünftige Entwicklungen

Der Einsatz der Score-Systeme wird als Routinediagnostik für Intensivstationen empfohlen. (2, S. 482; 4, S. 352; 7, S. 84; 12, S. 1237) Daß Computer in Krankenhäusern „bald über Leben und Tod“ entscheiden ist für Prof. Haverich „vorstellbar“. (6) Nun frage ich mich, ob dies in der Hauptsache zum Wohl der Patienten geschehen soll. Angesichts der Entwicklungen in unserem Gesundheits­wesen (z.B. Budgetierung der Krankenhäuser) muß sich meiner Einschätzung nach jeder An­wender der Score-Systeme, der heute noch der Meinung ist, daß hier nur im Sinne des Patien­ten gehandelt wird, fragen lassen, ob Naivität, Eigeninteresse, Verdrängung oder Absicht hin­ter dieser „Selbst-Täuschung“ steht. Möglicherweise werden ärztliche Entscheidungen schnel­ler als manchem lieb sein werden, nicht mehr nach dem Stand der medizinischen Möglichkei­ten oder moralischen und ethischen Werten bzw. Normen getroffen. Finanzielle Aspekte wer­den dazu führen, daß die Beurteilung der Prognose einzelner Patienten und auch von Patien­tenkollektiven durch Score-Systeme getroffen werden und auch die Entscheidung über den Beginn oder den Abbruch einer Behandlung, der Computer übernehmen wird. Dies verdeutli­chen folgende Aussagen:

Noch scheint es nach BEIN & TAEGER (1) „in Mitteleuropa nicht vorstellbar [im Gegensatz zur USA, Anmerkung des Autors!], daß das Ergebnis einer Punktewertung die Wahl des Transportmit­tels oder Versorgungszentrums entscheidet.“(1, S. 226) Nach meiner Einschätzung wird das Vor­handensein von Score-Systemen, die die schon am Einsatzort Anwendung finden können, auch den Einsatz bei uns nach sich ziehen, wenn finanzielle Gründe dafürsprechen./p>

E. Neugebauer & B. Bouillon sehen die „Gefahr“, daß „ökonomische Zwänge auch in Deutsch­land relevant werden“ könnten. T. Bein & K. Unertl meinen, daß „[b]egrenzte Ressourcen im personellen, räumlichen, apparativen und finanziellen Bereich zwingen uns, die vorhandenen Möglichkeiten sinnvoll zu nutzen.“ (2, S. 476 + vgl. S. 482; vgl. 3, S. 40)

„Aber der Kostendruck nimmt von Jahr zu Jahr zu - und irgendwann könnten Verwaltung und Krankenkassen solche Systeme vorsehen. Das kann man dann nur so machen, daß per Datenübertragung die Computerprognose für einen Patienten direkt an die Krankenkasse weitergeleitet und dort bestimmt wird.“ (6)

Wenn es um den Einsatz von knappen Ressourcen geht, wird die „Lebensqualität“ zu einem entscheidenden Kriterium für eine sinnvolle Nutzung werden, obwohl dieses Kriterium aus meiner Sicht ein sehr fragwürdiges, wenn nicht gar gefährliches Kriterium darstellt:

„Neben der Prognosestellung „Überleben/Nicht-Überleben“ kommt der Qualität[Hervorhebung im Original !]des Überlebens (Restitutio ad integrum, geringgradige Einschränkung, schwere Einschrän­kung, persistierender vegetativer Status) eine zentrale Bedeutung zu, da von ihr die spätere Lebensbe­wältigung (Bewältigung des Alltags, Störungen des kognitiven Denkens, psychosoziale Rehabilitation) abhängt.“ (1, S. 225; vgl. 2, S. 482 und 10, S. 135 f)

Bleibt die Frage, wer über den Sinn einer Therapie oder die zukünftige „Lebensqualität“ ent­scheiden wird. Der Mensch oder der Computer?

Schlußfolgerungen

RÖSE hat auf diese Frage eine Antwort: „Intensivmedizin - Hilfe zum Leben um jeden Preis? [...]: nein! Wer aber stellt den Maßstab, bildet das Preisgericht? Ohne Zweifel ist das in allererster Linie der Patient selbst, auch wenn er nicht danach befragt werden kann.“ (10, S. 137)

Möglicherweise wird diese Prognose auf einige wenige Patienten zutreffen, auch wenn sie nicht mehr befragt werden können. Wenn dann die Angehörigen und die Mediziner eine Weiterbehandlung befürworten, die Budgetierung des behandelnden Krankenhauses oder der Patient sich dies auch leisten können, bleibt möglicherweise der Patient der Maßstab.

Wenn diese Bedingungen jedoch nicht gegeben sind, werden in den Krankenhäusern, die mit einem APACHE-Programm oder einem anderen Score-System ausgerüstet sind, die Compu­ter den Maßstab und das „Preis-Gericht“ bilden.

Für manchen Patienten wird das „Urteil“ des Computers tödlich enden, obwohl eine Überlebenschance gegeben war,weil diese Program­me eine individuelle Prognose der Letalität nicht zulassen. „Wenn das Überleben eines Menschen von wirtschaftlichen Gründen abhängig gemacht wird, dann sind wir ethisch da, wo die Nazis aufgehört haben.“ (6) So wurde Dr. Montgomery in einem Interview zitiert. Prof. Haverich bestätigte, daß der „Vergleich [...] seine Berechtigung [hat], weil wirtschaftliche Gründe - ebensowenig wie rassische - kein Kriterium für die Weiterbehandlung vom Patienten sein dürfen.“ (6)

Ein Link zum Artikel "Score-Systeme für die Intensivmedizin. - Überwindung der Subjektivität des Arztes durch objektive Entscheidungen eines Computerprogramms?"

Literatur

  1. Bein, T. & Taeger, K. Score-Systeme in der Notfallmedizin. In: Anästhesiologie, Intensiv­medizin, Notfallmedizin, Schmerztherapie 28 (1993) 222-227. Georg Thieme Verlag 1993.

  2. Bein, T. & Unertl, K. Möglichkeiten und Grenzen von Score-Systemen in der Intensivmedi­zin. In: Anästhesiologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 476-483. Georg Thieme Verlag 1993.

  3. Bein, T. u.a. Vergleich von APACHE-II und APACHE-III zur Einschätzung der Erkran­kungsschwere von Intensivpatienten. In: Anaesthesist (1995) 44: 37-42. Springer-Verlag 1995.

  4. Demmel, N. u.a. Prognosescores bei Peritonitis: Mannheimer Peritonitis-Index oder APACHE-II? In: Langenbecks Archiv für Chirurgie (1994) 379: 347-352. Springer-Verlag 1994.

  5. Der Spiegel. Noten in 20 Fächern. 2/1994. S. 158 f.

  6. Haverich, A. Computer entscheiden, wer sterben muß ... In: Hörzu S.26.

  7. Heinz, L. (Regie). Geld oder Leben. ARD 02.12.96. 21:00-22:30. BR & MDR Gemeinschafts­produktion 1996.

  8. Möllmann, M. & Lawin, P. Schweregradklassifikationssysteme in der Intensivmedizin. In: Lawin, P. (Hrsg.) Praxis der Intensivbehandlung. Georg Thieme Verlag 1994. S. 78-84.

  9. Nikolaus, T. u.a. Beurteilung des Risikos von Hilfs- und Pflegebedürftigkeit sowie des Mor­talitätsrisikos älterer Menschen. In: Deutsche medizinische Wochenschrift 120 (1995), 1457-1462. Georg Thieme Verlag 1995.

  10. Neugebauer, E. & B. Bouillon. Was können Scoresysteme leisten? In: Der Unfallchirurg (1994) 97: 172-176

  11. Riedel, A. Schweregrad-Indices, ihre Praktikabilität und ihre Aussagekraft für die trauma­tologische Intensivmedizin. Eine Untersuchung an polytraumatisierten Patienten unter be­sonderer Berücksichtigung der Extrembereiche des Injury Score (ISS). Inaugural-Dissertati­on zur Erlangung der Doktorwürde der Medizinischen Fakultät der Technischen Universi­tät zu München. Promoviert am 09. November 1988.

  12. Röse, W. Intensivmedizin - Hilfe zum Leben um jeden Preis? In: Intensiv 4 (1996) 134 - 137. Georg Thieme Verlag 1996.

  13. Schröter, H. Score-Systeme in der Intensivmedizin. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fakultät der Bayrischen Julius-Maximilians-Universi­tät zu Würzburg. Promoviert im Juli 1993.

  14. Schuster, H.-P. Die Bedeutung von Score-Systemen für die Voraussage von Behandlungs­ergebnissen in der Intensivmedizin. In: Internist (1996) 37: 1237-1243. Springer-Verlag 1996.

  15. Weikenmeier, A. Die prognostische Wertigkeit von Koma-Skalen bei Schädel-Hirn-Ver­letzten. Glasgow Coma-Score und Brüsseler Koma-Skala im Vergleich zu zwei neu erstell­ten Skalen. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fa­kultät der Universität zu Köln. Promoviert am 11. Mai 1995.

zurück zum Anfang

© Design 2004, R. Rotondo Supervision in Hamburg