Vom Diktiergerät zum Gamechanger
Warum medizinische Sprachsysteme im Fokus von Big-Tech stehen.
Unter den zahlreichen Nüssen, die es im Gesundheitswesen zu knacken gibt, zählt die Bindung ärztlicher Ressourcen durch Dokumentation und Informationssuche zu den wohl härtesten. Bisher hat die Digitalisierung dieses Problem eher verschärft als verringert. Bildschirm, Maus und Tastatur binden die Aufmerksamkeit des Arztes sowohl was den Input als auch den Output betrifft. Moderne Text- und Spracherfassungssysteme mit künstlicher Intelligenz sollen es nun ermöglichen, den Arzt für das Gespräch mit dem Patienten freizuspielen und gleichzeitig einen Mehrwert durch besseres Informationsmanagement zu schaffen.
4.000 Mausklicks auf der Notaufnahme
Eine Studie aus dem Jahr 2013 hat sich mit der Produktivität von Ärzten auf einer Notfallabteilung beschäftigt und dabei unter anderem zwei Zahlen geliefert, die das Ausmaß des Problems deutlich illustrieren: 43 Prozent – das ist der durchschnittliche Anteil der Arbeitszeit, den ein Arzt mit der Eingabe von Daten verbringt. Demgegenüber stehen lediglich 28 Prozent, die im direkten Kontakt mit dem Patienten verbracht werden. Die zweite Zahl ist 4.000 - so viele Mausklicks tätigt der durchschnittliche Notfallmediziner während eines zehnstündigen Dienstes.
Aber wie kann künstliche Intelligenz hier Abhilfe schaffen? Möglich macht das das so genannte Natural Language Processing, also die intelligente Sprachverarbeitung mittels Deep Learning, einer speziellen Form von maschinellem Lernen. Stellen wir uns einmal so ein System im Vollausbau vor und gehen wir dabei einfach mal davon aus, dass Datensicherheit auf höchstem Niveau gewährleistet ist. Während der Arzt mit dem Patienten ein Anamnesegespräch führt, sei es im realen oder telemedizinischen Setting, „hört“ das intelligente System mit. Dabei ist es in der Lage aus der Vielzahl des Gesagten die entscheidenden Informationen, etwa die zu Vorerkrankungen, eingenommenen Medikamenten oder Lebensstilfaktoren herauszufiltern und in einer elektronischen Patientenakte abzulegen. Auf ähnliche Art kann solch ein System aus den verschiedensten Quellen, von Röntgenbefunden bis zu handschriftlichen Arztnotizen, die wesentlichen Inhalte extrahieren und abspeichern. Dies ist keineswegs eine triviale Aufgabe, denn ein und derselbe Sachverhalt kann in der Medizin auf viele unterschiedliche Arten ausgedrückt werden und natürlich muss auch die optische Texterkennung auf höchstem Niveau funktionieren.
Medizin auf neuem Niveau?
Die nun im Datenformat erfassten Informationen können von einem weiteren intelligenten Algorithmus für den Arzt zusammengefasst und gegebenenfalls nach relevanten Mustern, wie Risikokonstellationen oder Einschlusskriterien für klinische Studien durchsucht werden. All dies könnte das Gesundheitswesen deutlich effizienter machen und die Medizin auf ein neues Niveau heben. Unternehmen, die sich das Knacken der beschriebenen Nüsse auf ihre Fahnen geschrieben haben, sind zum Beispiel Dragon, MModal oder Suki Ai. Ebenfalls mittendrin und nicht nur dabei: Die großen Technologieunternehmen Google, Microsoft und Amazon. Sie alle bieten entweder selbst Applikationen in diesem Bereich an oder kooperieren eng mit einem kleineren Anbieter.
Training mit Pubmed
So hat Google Ende des vergangenen Jahres zwei einschlägige Anwendungen gelauncht und zeitweise zur kostenlosen Nutzung angeboten. Auch Nvidia, ein Unternehmen, das eigentlich auf intelligente Bilderkennung mittels Deep Learning spezialisiert ist, hat ein medizinisches Sprachverarbeitungssystem namens BioMegatron entwickelt. Diese Anwendung wurde mittels Pubmed anhand von insgesamt 6,1 Milliarden Wörtern trainiert und ist offenbar ein echtes Schwergewicht im Kampf um das größte Stück des Kuchens. Wie gut sich all diese Systeme in der klinischen Praxis bewähren, welche Akzeptanz sie bei Patienten, Ärzten und Spitalsbetreibern finden, werden wohl die kommenden fünf bis zehn Jahre zeigen.