Lexikon

Entscheidungsunterstützungssyteme, medizinische

Die semantische Suchmaschine Watson von IBM besiegte 2011 in einer amerikanischen Quizshow Jeopardy mit natürlichsprachlichen Fragen die besten menschlichen Gegner. Danach kündigten die Entwickler an, dass sie mit den Techniken von Watson zu linguistischer Verarbeitung, Information Retrieval sowie auf vielfältigen Datenquellen operierenden, spezialisierten wissensbasierten Agenten die medizinische Entscheidungsunterstützung (MEU; medical decision support) revolutionieren wollen (http://www.zdnet.de/41556297/ibm-supercomputer-watson-erstelltmedizinische-diagnosen [2011]), zunächst im Bereich der Onkologie (http://www-05.ibm.com/de/watson/gesundheitswesen.html [2011].) Allerdings hat sich das als wesentlich schwieriger herausgestellt als gedacht (http://www.wsj.de/article/SB10001424052702303848104579308081350435274.html [2014]).

Watson ist ein Indikator für einen MEU-Paradigmenwechsel: Während die meisten Programme auf codierten Patientendaten und formalisiertem medizinischen Wissen aufbauen, werden derzeit auf linguistische Ansätze große Hoffnungen gesetzt, die medizinische Lehrbücher und die medizinische Fachliteratur (verfügbar über die medizinische Datenbank Medline, die Artikel aus über 5000 medizinischen Zeitschriften indiziert und mit der Suchmaschine Pubmed [http://www.ncbi.nlm.nih.gov/pubmed] abgefragt werden kann) aufarbeiten. Ein solches System ist ISABEL (http://www.isabelhealthcare.com), dessen Wissen auf dem Inhalt medizinischer Lehrbücher beruht und das als Input eine Freitext-Eingabe der Leitsymptome eines Patienten erwartet. Aus den Lehrbüchern werden für alle Diagnosen die Beschreibungen zusammengefasst und mit Techniken der probabilistischen Sprachverarbeitung bearbeitet. Diese Aufgabe ist leichter als in Alltagstexten, da die medizinische Fachterminologie weniger Mehrdeutigkeiten enthält. Insbesondere sind Techniken wichtig, die Wörter auf ihre Grundformen zurückführen, Synonyme verarbeiten, Negationen erkennen und Relationen z. B. auf der Basis von Präpositionalphrasen finden. Der Inferenzalgorithmus besteht darin, die eingegebenen Symptome in einer normalisierten Form mit den Beschreibungen der Diagnosen zu vergleichen und die Diagnosen mit den besten Übereinstimmungen als Ergebnis anzuzeigen. Eine Übersicht über Informationsextraktion aus Texten findet sich in [5]. 

Traditionelle wissensbasierte Systeme arbeiten Dagegen mit einer vorgegebenen Terminologie von Symptomen und Diagnosen (controlled vocabulary). Die Symptome werden aus Menüs oder aus Textvorschlägen zu eingegebenen Anfangsbuchstaben ausgewählt. Mit jedem neu eingegebenen Symptom wird die Liste der vorgeschlagenen Diagnosen aktualisiert. Eines der besten Systeme für die Allgemeinmedizin ist DXPlain (http://www.lcs.mgh.harvard.edu/projects/dxplain.html), in dem das relationale Wissen zwischen Symptomen und Diagnosen in zwei qualitativen Bewertungsarten auf einer sieben bzw. neunstufigen Skala ausgedrückt wird: Wie stark das Symptom für die Diagnose spricht sowie wie häufig das Symptom bei der Diagnose vorkommt. Zusätzlich sind die Symptome und Diagnosen Fachgebieten zugeordnet, nach Ihrer absoluten Bedeutung gewichtet und hierarchisch strukturiert, sodass spezielle Symptome allgemeinere Symptome einschließen (z. B. Bauchschmerzen im linken oberen Quadranten ist eine Spezialisierung von Bauchschmerzen). Damit kann das Programm auch die Abwesenheit von Symptomen diagnostisch auswerten (dass z. B. keine Bauchschmerzen Evidenz gegen eine Blinddarmentzündung darstellt), was bei linguistischen MEU-Programmen wesentlich schwieriger ist und bisher kaum genutzt wird. Außerdem kann mit dem Wissen ein grobes Ranking der Diagnosen von ,,wahrscheinlichen“ zu ,,weniger wahrscheinlichen“ erstellt werden. 

Aktuelle Forschungsthemen umfassen u. a. die differenzierte Erfassung und Repräsentation zeitlicher Verläufe [10] und die Umsetzung klinischer Pfade in Krankenhausinformationssystemen.

 

Evaluationsstudien

In einer kürzlich publizierten Evaluationsstudie [2] wurden vier MEU-Systeme verglichen, die aus einer Liste von 23 Systemen nach Kriterien wie Verfügbarkeit für Ärzte, Breite der Wissensbasis für Allgemeinmedizin, Eingabe von beliebig vielen Symptomen und Rückgabe einer Liste von Differenzialdiagnosen ausgewählt wurden. Zur Evaluation dienten 20 zufällig ausgewählte, schwierige Patientenfälle aus medizinischen Zeitschriften. Das Evaluationsmaß bestand darin, ob die richtige Diagnose in der Liste der besten 20 Vorschläge der Systeme enthalten war. Für die richtige Diagnose gab es 5 Punkte, für ähnliche Diagnosen 0–4 Punkte, je nach Ähnlichkeit. Dabei schnitten die oben erwähnten Systeme ISABEL und DXPlain mit einem durchschnittlichen Score von 3,45 von 5 möglichen Punkten gleich gut ab, wobei ungefähr bei der Hälfte der Fälle die Maximalzahl von 5 Punkten erreicht wurde. Die anderen beiden getesteten Programme DiagnosisPro (http://www.diagnosispro.com), das frei verfügbar ist und derzeit vier Sprachen unterstützt (Englisch, Französisch, Spanisch, Chinesisch), und die Wissensdatenbank PEPID (http://www.pepid.com) erzielten 2,65 bzw. 1,7 Punkte.

Die besten Programme haben dabei besser abgeschnitten als bei früheren Studien (z.B. [1]). Ein zentrales Thema ist die Einbindung in die elektronische Krankenakte: Im Idealfall würde ein MEU-System im Hintergrund alle Krankenakten von Patienten auswerten und Diagnosevorschläge machen, die Ärzte mit ihren eigenen Differenzialdiagnosen abgleichen können. Dann würde die zusätzliche Dateneingabe für den Arzt entfallen. In einer Studie wurde verglichen, wie gut ISABEL abschneidet, wenn die vollständige textuelle Beschreibung einer Patientenakte statt einer Auswahl von Hauptsymptomen eines Falles eingegeben wurde [3]. Auch hier wurden zur Evaluation 50 aufbereitete, schwierige Patientenfälle aus der medizinischen Literatur gewählt. Als Evaluationsmaß diente lediglich, ob die richtige Diagnose unter den ersten 30 Diagnosen von ISABEL enthalten war, ohne Differenzierung nach Ähnlichkeit. Während bei zusätzlich eingegebenen Hauptsymptomen die richtige Diagnose in 96%der Fälle in der Diagnoseliste enthalten war, sank diese Quote auf 76%, wenn in das Eingabefeld die komplette textuelle Beschreibung kopiert wurde. Sie sank weiter auf 51%, wenn geprüft wurde, ob die Diagnose in den besten 10 statt 30 Diagnosen enthalten ist. Obwohl das ein vielversprechender Anfang ist, muss er aus praktischer Sicht noch verbessert werden. Es bleibt abzuwarten, ob WATSON deutlich bessere Ergebnisse erzielen wird. 

Auch muss überprüft werden, ob lange Listen von Differenzialdiagnosen Ärzten wirklich helfen, alle relevanten Diagnosen abzuwägen oder eventuell auch zu unnötigen weiteren Untersuchungen zur Abklärung irrelevanter Diagnosen führen. Dafür ist eine Erklärungskomponente notwendig, die begründet, warum bestimmte Diagnosen vom System vorgeschlagen wurden. Text-basierte MEU-Systeme zeigen als Begründung z. B. Lehrbuchtexte an, in denen eine Beschreibung der Diagnose steht sowie die Übereinstimmungen mit der Anfrage. MEU-Systeme mit kodiertem Wissen zeigen eine Wahrscheinlichkeit oder einen Score mit den relevanten Herleitungsregeln an. Dagegen sind maschinelle Lernverfahren, deren Ergebnisse nicht gut erklärbar sind, weniger verbreitet.

 

 

 

Spezialisierte Entscheidungsunterstützungssysteme

Weiter vorangeschritten ist die Entwicklung von spezialisierten MEU-Systemen (s. [7]). Dazu gehören u. a.: 

  • Überprüfung der Medikamentenverschreibung: Medikamente werden zur Therapie von Krankheiten verschrieben. Die erforderlichen Daten für eine automatische Überprüfung sind häufig in Krankenakten bereits vorhanden: die Krankheiten, die Verabreichung anderer Medikamente (zur Prüfung von unerwünschten Wechselwirkungen), Allergien (für Kontraindikation), Kreatinin-Werte (zur Überprüfung der korrekten Dosierung bei Medikamenten, die durch die Niere ausgeschieden werden), besondere Umstände (z. B. Kinder, Schwangere). Ein Beispielsystem ist AID-Klinik (www.aidklinik.de).
  • Unterstützung der künstlichen Beatmung: Da künstliche Beatmung per se schädlich ist, ist das Ziel die möglichst schnelle Entwöhnung. Die hängt von dem Zustand des Patienten ab. Dazu werden einige Parameter wie die Sauerstoff- und die Kohlendioxidkonzentration des Blutes bzw. der ausgeatmeten Luft u. a. kontinuierlich gemessen und daraus die beste Strategie hergeleitet. Für Teilbereiche wie der Entwöhnung gibt es schon Closed-Loop-Systeme im klinischen Alltag, die nur durch allgemeine Vorgaben gesteuert werden und selbstständig Einstellungen am Beatmungsgerät vornehmen [6]; weitere Teilbereiche sind in Entwicklung. 
  • Antibiotika-Therapie: Die Verschreibung von Antibiotika hängt entscheidend von den Bakterien sowie den möglichen Resistenzen und Verträglichkeiten des Patienten ab. Auch hier ist es möglich, mit relativ wenigen Eingabedaten eine Empfehlung zu bekommen, insbesondere auch für tropische Infektionskrankheiten, die Touristen aus dem Urlaub mitbringen können. Ein erfolgreiches MEU-System ist GIDEON (www.gideononline.com). Die Antibiotika-Therapie war auch der Gegenstand eines der ersten und bekanntesten wissensbasierten MEU-Systeme, MYCIN [9].

Sehr viele diagnostische Inferenzen beruhen auf der Auswertung von bildhaften Daten, z. B. Radiologie, Pathologie, Sonographie usw. Zuverlässige Algorithmen, die eine automatische diagnostische Auswertung der Bilder oder Bildsequenzen ermöglichen, würden die medizinische Entscheidungsunterstützung daher revolutionieren. Trotz intensiver Forschungsbemühungen und vielversprechender Ansätze in spezialisierten Teilgebieten müssen derzeit noch Ärzte die Bilder auswerten und in Befundberichten dokumentieren. 

Medizinische Entscheidungsunterstützung für Patienten

Während die bisherigen MEU-Systeme sich an den Arzt wenden, gibt es auch Ansätze, den Patienten bei der Auswertung von medizinischen Daten zu unterstützen. Das große Interesse daran zeigt die Tatsache, dass sowohl Gesunde als auch Kranke das Internet häufig nutzen, um medizinische Informationen zu erhalten. Einer Studie der Stiftung Warentest aus dem Jahr 2009 zufolge sind das ein Drittel der deutschen Bevölkerung, d. h. pro Jahr weit über 20 Millionen Personen (www.test.de/Gesundheitsportale-Die-besten-Infos-im-Netz-1780855-0). Mit dem Aufkommen von einfach handhabbaren, preisgünstigen medizinischen Messgeräten wie Puls- und Blutdruckmessgeräte, Brustgurte für EKGs, Messgeräte für Blutzucker und Sauerstoffsättigung des Blutes, Schrittzähler, Gewichtsmessung, Spirometer, die häufig ihre Messwerte auch zur elektronischen Weiterverarbeitung bereitstellen, haben sich medizinische Apps zu deren Auswertung weit verbreitet (Konferenzen und Zeitschriften zu medizinischen Apps finden sich u. a. in medicalappjournal.com und www.apps-medical.de).

Eine Herausforderung ist die Verknüpfung privat erhobener Gesundheitsdaten mit der medizinischen Patientenakte in Krankenhäusern und bei niedergelassenen Ärzten. Mit der elektronischen Gesundheitskarte (www.bmg.bund.de/krankenversicherung/elektronischegesundheitskarte. html), die ab 2014 eingeführt wird, können Patienten Daten über ihren Gesundheitszustand speichern, die aber aus Datenschutzgründen nur bei beidseitiger Zustimmung von einem Arzt oder einer Person mit anderem Heilberuf und dem Patienten gelesen und verändert werden können.

 

Zusammenfassung

 Während Spezialsysteme beachtliche Erfolge aufweisen, gibt es zwei Hauptschwierigkeiten bei der Entwicklung von leistungsfähigen Entscheidungsunterstützungssystemen in der allgemeinen Medizin [4]: die Entwicklung adäquater Wissensbasen und die Eingabe detaillierter Patientendaten zu dem Fall. Trotz beachtlicher Erfolge ist der große Durchbruch noch nicht gelungen. Die Fortschritte bei der automatischen Textverarbeitung eröffnen neue Wege, insbesondere bei der Integration von MEU-Systemen mit Patientendaten, die routinemäßig in Arztbriefen und Befundberichten dokumentiert werden. Das abschließende übersetzte Zitat aus einem viel beachteten Artikel [8] von 1987 zeigt aber, dass auch professionelle Prognosen mit Vorsicht betrachtet werden sollten: 

,,1970 prophezeite ein Artikel im New England Journal of Medicine, dass Computer im Jahre 2000 eine völlig neue Rolle in der Medizin spielen und die intellektuellen Möglichkeiten des Arztes beträchtlich erweitern können. Wie realistisch erscheint diese Vorhersage zur Halbzeit? Es ist klar, dass das Verständnis der Entscheidungsfindung und die Implementierung experimenteller Programme, die zumindest Teile menschlichen Expertenwissens enthalten, weit vorangeschritten sind. Auf der anderen Seite ist es zunehmend offensichtlich geworden, dass größere wissenschaftliche und technische Probleme gelöst werden müssen, bevor wirklich zuverlässige Beratungsprogramme entwickelt werden können. Trotzdem ist es unter der Annahme kontinuierlicher Forschung immer noch möglich, dass im Jahr 2000 eine Fülle von Programmen verfügbar ist, die den Arzt wesentlich unterstützen.“ 

 

Literatur

1. Berner E, Webster G, Shugermann A et al (1994) Performance of four Computer-Based Diagnostic Systems, New Engl J Med 330:1792–1796

2. Bond W, Schwartz L, Weaver K et al (2012) Differential Diagnosis Generators: An Evaluation of Currently Available Computer Programs. J Gen Intern Med 27: 213–219

3. Graber M, Mathew A (2008) Performance of a Web-Based Clinical Diagnosis Support System for Internists, J Gen Intern Med 23:37–40

4. El-Kareh R, Hasan O, Schiff G (2013) Use of Health Information Technology to Reduce Diagnostic Errors. BMJ Qual Saf 22:40–51

5. Klügl P, Toepfer M (2014) Informationsextraktion, Aktuelles Schlagwort, Informatik-Spektrum 37(2)

6. Lellouche F, Mancebo J, Jolliet P et al (2006) A Multicenter Randomized Trial of Computer-driven Protocolized Weaning from Mechanical Ventilation. Am J Respir Crit Care Med 174(8):894–900

7. Puppe F (2008) Wissensbasierte Systeme in der Medizin. Künstliche Intelligenz 1/2008:53–58

8. Schwartz W, Patil R, Szolovits P (1987) Artificial Intelligence in Medicine: Where do We Stand? New Engl J Med 316:685–688

9. Shortliffe E (1976) Computer-Based Medical Consultation: MYCIN. American Elsevier

10. Sun W, Rumshisky A, Uzuner O (2013) Evaluating temporal relations in clinical text: 2012 i2b2 Challenge. J Am Med Inform Assoc 20(5):806–813

Autor und Copyright

Frank Puppe
Universität Würzburg, Institut für Informatik
E-Mail: 

© Springer-Verlag Berlin Heidelberg 2014