ClaML – Classification Markup Language – Einführung und Nutzung

EN 14463 Health informatics – A syntax to represent the content of medical classification systems – ClaML (Classification Markup Language) ist ein Klassifikationsstandard, der 2007 als europäische Norm (CEN/TS 14463) akzeptiert und als Masterformat für die Darstellung des Inhalts von Klassifikationen von der WHO empfohlen wurde. Der Hauptzweck von ClaML ist die Darstellung des Inhalts medizinischer Klassifikationssysteme sowie die Unterstützung des zuverlässigen elektronischen Austausches von hierarchischen Klassifikationssystemen zwischen Organisationen im Gesundheitswesen. 

ClaML stellt eine spezielle XML-Notation für Klassifikationen dar und definiert fünf Hauptelemente für die Darstellung des Inhalts einer Klassifikation:

  1. Das Wurzelelement namens „ClaML“ dient der Definition der Klassifikation als Ganzes.
  2. Das Element „Class“ dient der Definition und Beschreibung der Strukturelemente der Klassifikation; im Falle der ICD-10-GM sind es Kapitel, Gruppen und Kategorien.
  3. Die Elemente „ModifierClass“ und „Modifier“ dienen der Definition und Zuordnung von tieferen Ebenen; d.h. im Fall der ICD-10-GM von Subkategorien und Subklassifikationen.
  4. Für die jeweiligen Textinhalte steht das Element „Rubric“ zur Verfügung, das in allen Elementen – auch mehrfach – enthalten sein kann.

Alle genannten Elemente können durch weitere (Kind-) Elemente und Attribute spezifiziert werden. Über Attribute können zum Beispiel die Art der „Class“ festgelegt werden – also, ob es sich bei der Klasse um ein Kapitel, eine Gruppe oder eine Kategorie handelt – sowie der entsprechende alphanumerische Kode zu dieser Klasse angegeben werden. Die hierarchische Strukturierung einer Klassifikation in ClaML erfolgt über die Elemente SubClass und SuperClass.

ClaML beschreibt  allerdings einige Einschränkungen in seiner Nutzung. ClaML beschreibt zum Beispiel nicht, wie ein Klassifikationssystem aufgebaut sein sollte. ClaML stellt außerdem kein Format bzw. keine Darstellung für den direkten Vorschau oder den Druck von Klassifikationen bereit. Darstellungen und Druckversionen müssen aus den beschriebenen Ausgabeformaten durch Nachbearbeitung erstellt werden. ClaML ist schließlich für die Definition von Beziehungstypen zwischen Elementen einer Klassifikation nicht vorgesehen. Diese Aufgabe wird Entwicklern von Klassifikationssystemen überlassen.

Der Einsatz kontrollierter Vokabulare ist für eine Mehrfachverwendung von Daten zwingend erforderlich. Man spricht von semantischer Interoperabilität, da kontrollierte Vokabulare einen Informationsaustausch auf Bedeutungsebene unterstützen. Sie können zur Definition von Konzepten, Merkmalen und Wertebereichen genutzt werden. Um die klinische Forschung in der Wiederverwendung ihrer Studiendaten zu unterstützen, fördert das Bundesministerium für Bildung und Forschung ein Projekt zur Erstellung eines nationalen Metadata Repository (MDR). Das Projekt sieht die Einbindung externer Standards vor. In diesem Rahmen wurde eine ClaML-Schnittstelle zum Import von ICD-10 und OPS in das MDR entwickelt. Ab 2013 ist ClaML das bevorzugte Format für die Bereitstellung von Klassifikationen durch das DIMDI. Die inhaltliche und technische Auseinandersetzung mit den Stärken und Schwächen von ClaML hat damit an Bedeutung gewonnen.