CompuGroup Medical
Synchronizing Healthcare

Erfahren Sie alles über die Vision, Mission sowie die Menschen, die die CompuGroup Medical weltweit prägen. 

Investor Relations
Eine Person tippt mit dem Finger auf ein Tablet-PC mit einer Investor-Relations-Präsentation
Karriere
Eine junge Frau telefoniert mit ihrem Smartphone, während sie einen Tablet-PC hält
CGM Global
Mehrere CGM-Flaggen

Struktur bitte!

26. September 2024 | Walter Zifferer
Symbolbild "Digitale Technologie".
Symbolbild "Digitale Technologie".

Unstrukturierte medizinische Informationen sind nicht einfach verarbeitbar, weil sie keine einheitliche, vorgegebene Struktur oder Formatierung haben, die Computeralgorithmen leicht interpretieren und analysieren können. Dafür gibt es einige ganz spezifische, wesentliche Gründe:

 

Inkonsistente Terminologie

In der Medizin gibt es viele Begriffe, Synonyme und Abkürzungen, die von verschiedenen Ärzten oder Kliniken unterschiedlich verwendet werden. Zum Beispiel kann „Myokardinfarkt“ auch als „Herzinfarkt“ oder „MI“ bezeichnet werden. Diese inkonsistente Terminologie erschwert es, Algorithmen genaue Informationen zu entnehmen.

 

Freitext-Narrative

Ärzte und medizinisches Personal schreiben oft Notizen im Freitextformat, das heißt, sie beschreiben Krankengeschichten, Symptome oder Behandlungspläne in natürlicher Sprache. Diese Freitext-Narrative sind für Maschinen extrem schwer verständlich, weil sie keine klar definierten Datenfelder enthalten, wie etwa in strukturierten Formularen.

 

Fehlen einer festgelegten Struktur

Strukturierten Daten (wie in einer Tabelle) können einfach analysiert werden, weil sie eine feste Struktur mit vordefinierten Feldern haben (z.B. Diagnose, Medikamentenname, Dosis). Bei unstrukturierten Daten fehlt diese klare Zuordnung von Informationen, was die maschinelle Verarbeitung deutlich erschwert.

 

Sprachliche Mehrdeutigkeit

Die natürliche Sprache ist oft mehrdeutig. Ein Wort oder eine Phrase kann mehrere Bedeutungen haben, und der Kontext ist entscheidend, um die korrekte Bedeutung zu verstehen. Maschinen haben nach wie vor große Schwierigkeiten dabei, den Kontext umfassend korrekt zu erfassen - insbesondere bei komplexen medizinischen Themen.

 

Unvollständige oder unklare Informationen

Unstrukturierte medizinische Daten enthalten oft unvollständige oder nur vage Informationen. Ärzte verwenden oftmals unvollständige Sätze oder Abkürzungen, die möglicherweise für andere Menschen verständlich sind, aber für (dazu nicht antrainierte) Maschinen schwer zu interpretieren sind.

 

Variationen im Schreibstil

Jede Person und somit auch jeder Arzt hat seinen eigenen Schreibstil, medizinische Informationen zu dokumentieren - es fehlt diesbezüglich gewissermaßen eine standardisierte Form. Diese ganz natürlichen Variationen erschweren es, Algorithmen zu entwickeln, die in der Lage sind, die Daten konsistent zu interpretieren.

 

Mangel an Standardisierung

Es gibt keine universellen Standards für die Dokumentation unstrukturierter medizinischer Informationen. Zum Beispiel werden medizinische Berichte in verschiedenen Sprachen, Dialekten oder mit lokalen Besonderheiten verfasst.

 

Komplexität der medizinischen Fachsprache

Medizinische Fachsprache enthält oft komplexe Ausdrücke, die nur in bestimmten Kontexten Sinn ergeben. Dies macht es für Maschinen schwer, genaue Bedeutungen zu extrahieren, da Algorithmen in der Regel auf klar definierte Regeln angewiesen sind.

Diese Faktoren machen es für Computersysteme schwierig, unstrukturierte medizinische Daten direkt zu nutzen. Um diese Informationen verarbeitbar zu machen, müssen oft Techniken der Künstlichen Intelligenz - wie Natural Language Processing (NLP), Machine Learning - und andere Algorithmen verwendet werden, um relevante Daten zu extrahieren und in eine strukturierte Form zu bringen.

Verwandte Artikel
Symbolbild: Unstrukturierte Informationen.
Symbolbild: Unstrukturierte Informationen.
Die Umwandlung von unstrukturierten medi­zinischer Infor­ma­tionenen

Das Umwandeln von unstrukturierten medizinischen Informationen in ...

Symbolbild für Vernetzung
Vernetzung
CGM CDM+
Das unter­nehmens­über­greifende klinische Referenz­daten­modell

Nicht nur der Druck, Daten über Einrichtungs- und Sektorengrenzen ...