CompuGroup Medical
Synchronizing Healthcare

Erfahren Sie alles über die Vision, Mission sowie die Menschen, die die CompuGroup Medical weltweit prägen. 

Investor Relations
Eine Person tippt mit dem Finger auf ein Tablet-PC mit einer Investor-Relations-Präsentation
Karriere
Eine junge Frau telefoniert mit ihrem Smartphone, während sie einen Tablet-PC hält
CGM Global
Mehrere CGM-Flaggen

Die Umwandlung von unstrukturierten medi­zinischer Infor­ma­tionenen

27. September 2024 | Walter Zifferer
Symbolbild: Unstrukturierte Informationen.
Symbolbild: Unstrukturierte Informationen.

Das Umwandeln von unstrukturierten medizinischen Informationen in strukturierte Daten ist ein essenzieller Prozess, der viele Vorteile bietet, z.B. die Verbesserung der Qualität von Patientenversorgung, die Durchführung von Forschungsarbeiten und die Nutzung von Datenanalyse. 

Es gibt verschiedene Ansätze und Technologien, die bei dieser Transformation helfen:

 

Natural Language Processing (NLP)

NLP ist eine Technologie, die es Computern ermöglicht, natürliche Sprache zu verstehen und zu verarbeiten. In der Medizin wird NLP häufig eingesetzt, um unstrukturierte Texte wie Arztberichte, Patientenakten oder Laborbefunde zu analysieren und strukturierte Informationen zu extrahieren. Wichtige Schritte umfassen:

Entitätserkennung (Named Entity Recognition, NER)

Hierbei werden medizinisch relevante Entitäten wie Diagnosen, Medikamente, Symptome, Prozeduren und Laborwerte aus dem Text identifiziert.

Textklassifikation

Der unstrukturierte Text wird in Kategorien eingeteilt, z.B. "Diagnosen", "Medikamentenverlauf" oder "Behandlungsverlauf".

Kontextanalyse

Die Beziehung zwischen verschiedenen Entitäten wird analysiert, z.B. die Zuordnung von Medikamenten zu bestimmten Diagnosen.

 

Manuelle Kodierung und Standardisierung

ICD-10, SNOMED CT, LOINC

Für strukturierte medizinische Informationen gibt es weltweit standardisierte Klassifikationen. Manuelle Kodierung bedeutet, dass medizinische Fachkräfte unstrukturierte Informationen anhand von Katalogen wie ICD-10 (Diagnosen), SNOMED CT (medizinische Konzepte) oder LOINC (Laborwerte) klassifizieren.

Assistierte Kodierung (Computer-Assisted Coding)

Systeme zur assistierten Kodierung unterstützen medizinische Fachkräfte, indem sie potenzielle Kodierungen vorschlagen, die aus unstrukturierten Texten extrahiert werden.

 

Vorlagen und strukturierte Dokumentation

Elektronische Patientenakten (EPA)

Elektronische Patientenakten bieten oft Vorlagen oder Formulare, die Ärzte oder Pflegekräfte ausfüllen müssen. Diese strukturieren die Eingabe von Anfang an, indem sie Dropdown-Menüs, Checklisten und vordefinierte Felder für Informationen verwenden, z.B. für Diagnosen, Symptome oder Laborwerte.

Formulareingaben

Durch die Verwendung strukturierter Eingabeformulare können von Anfang an standardisierte und strukturierte Daten erfasst werden, die später leichter analysiert werden können.

 

Regelbasierte Systeme

Regelbasierte Systeme verwenden vordefinierte Regeln und Algorithmen, um bestimmte Muster in unstrukturierten Daten zu erkennen. Zum Beispiel kann eine Regel besagen, dass ein Satz, der das Wort "Diagnose" enthält, Informationen über die Diagnose des Patienten enthält. Diese Systeme können einfache Extraktionen durchführen, sind jedoch oft begrenzt in ihrer Flexibilität und Skalierbarkeit im Vergleich zu NLP.

 

Maschinelles Lernen (Machine Learning, ML)

Durch maschinelles Lernen können Modelle trainiert werden, um Muster in unstrukturierten medizinischen Daten zu erkennen und diese automatisch in strukturierte Formate zu überführen. Dies ist insbesondere nützlich, wenn es darum geht, große Mengen an Texten zu analysieren und komplexe medizinische Informationen zu verstehen.

Deep Learning

Tiefe neuronale Netze werden verwendet, um medizinische Texte auf hohem Niveau zu verarbeiten, indem sie Kontext und Bedeutung erfassen, ähnlich wie Menschen dies tun. Dies ist besonders nützlich für die semantische Analyse, d.h. das Erfassen der Bedeutung hinter den Texten.

 

Optical Character Recognition (OCR)

Viele medizinische Informationen liegen in gescannter Form vor, z.B. handschriftliche Arztberichte oder ältere Papierdokumente. OCR-Software ermöglicht es, diese Dokumente in maschinenlesbare Texte umzuwandeln, die anschließend durch NLP oder regelbasierte Systeme weiterverarbeitet werden können.

 

Interoperabilitätsstandards

FHIR (Fast Healthcare Interoperability Resources)

FHIR ist ein Standard für den Austausch von Gesundheitsdaten, der die strukturierte Speicherung und Weitergabe medizinischer Informationen ermöglicht. Durch die Einhaltung solcher Standards können Systeme unstrukturierte Informationen in standardisierte Formate überführen und austauschen.

 

Datenvalidierung und -bereinigung

Sobald unstrukturierte Informationen in strukturierte umgewandelt sind, müssen sie validiert und bereinigt werden, um sicherzustellen, dass sie korrekt, konsistent und vollständig sind. Dies kann durch automatisierte Tools oder manuelle Überprüfungen erfolgen.

Verwandte Artikel
Symbolbild für Vernetzung
Vernetzung
CGM CDM+
Das unter­nehmens­über­greifende klinische Referenz­daten­modell

Nicht nur der Druck, Daten über Einrichtungs- und Sektorengrenzen ...

Symbolbild "Digitale Technologie".
Symbolbild "Digitale Technologie".
Struktur bitte!

Unstrukturierte medizinische Informationen sind nicht einfach ...