Ein Aktenschrank mit Karteikarten

Daten über Daten: Wie Metadaten Digital Asset Management ermöglichen

Deutsch

„Daten über Daten“ ist häufig die erste Definition, die im Zusammenhang mit Metadaten fällt. Doch wird diese Beschreibung dem Rückgrat Digitalen Asset Managements bei weitem nicht gerecht. In diesem Beitrag sollen die Herkunft sowie Relevanz von Metadaten im digitalen Kontext erläutert werden. Darüber hinaus werden die unterschiedlichen Kategorien und Segmente von Metadaten vorgestellt.

Von Büchern und Bildern: Ein Auszug aus der Geschichte der Metadaten

Im Kontext des Digital Asset Management sind Metadaten strukturierte, an Assets annotierte Informationen, die essenziell für den Funktionsumfang des DAM-Systems sind. Diese Zusatzinformationen sind fest am Asset gespeichert. Sie definieren und identifizieren das Asset eindeutig. Durch Metadaten werden Assets in DAM-Systemen erst durchsuchbar. Ohne die Verschlagwortung von Assets durch Metadaten können DAM-Systeme nicht annährend ihr volles Potential ausschöpfen.

Doch ist die zusätzliche Annotation von Informationen an eine gegebene Ressource bei weitem kein Phänomen digitaler Datenverarbeitung. Im Bibliothekswesen werden Büchern seit jeher Metadaten wie Titel, Autor, Veröffentlichungsdatum und Genre als Metadaten zugeordnet. Tatsächlich geht der erste nachweisebare Gebrauch von Metadaten auf das Jahr 280 v. Christus und damit in die Zeit der großen Bibliothek von Alexandria zurück. Unter Anleitung des Bibliothekars Zenodotus wurden alle Schriftrollen mit herunterhängenden Etiketten versehen. Somit wurden die Rollen klassifizierbar, sortierbar und einfach auffindbar bzw. suchbar gestaltet. Um den Inhalt der Rollen zu kennen war es also nicht mehr nötig diese zu entrollen.

Ein nächster große Entwicklungsschritt der Geschichte der Metadaten war dann der Siegeszug der Fotografie. Angefangen im 19 Jahrhundert wurden bei der Daguerreotypie, dem ersten kommerziell nutzbaren Fotografie-Verfahren, Informationen wie Name, Datum und Ort auf Rahmen vermerkt. So konnten die Inhalte der Bilder mit weiteren Informationen angereichert werden. Im Bereich der Fotografie sollten später vor allem die Formate Exif, IPTC-IIM und XMP die Bedeutung von Metadaten weiter prägen. Das Exif Format wurde von der japanischen Kamera-Industrie eingeführt. Durch dieses war es erstmals möglich, digitale Metadaten in Bilddaten der Formate JPEG und TIFF hinzuzufügen. Informationen wie:

  • Datum und Uhrzeit
  • Standortinformationen
  • Technische Daten (ISO-Wert, Belichtungszeit, Brennweite, etc.)
  • Vorschaubild
  • Urheberrecht und Informationen zum Fotografierenden

werden heute standardmäßig von praktisch allen Kameras, egal ob Smartphone, Digital oder Spiegelreflex, unterstützt. Mit dem Ziel der Vereinfachung des Bildaustauschs wurde das International Press Telecommunications Council (IPTC) Format von Nachrichtenagenturen und Zeitungsverbänden im Jahr 1979 entwickelt. Durch dieses ist es den Beteiligten möglich, zusätzliche Informationen wie bspw. eine Bildbeschreibung, Quelle, Ortsangaben oder Urheberrecht mitzusenden. 1991 sollte es zur Anwendung auf digitale Bilder um den neuen Standard Information Interchange Model (IIM) erweitert werden. Das Extensible Metadata Platform (XMP) Format wurde 2001 vom Softwareproduzenten Adobe kreiert. Neben den anderen genannten Formaten ist XMP in der Lage weitere Informationen zu speichern, die vor allem für die eigenen Programme wie Lightroom oder Photoshop relevant sind. Die Relevanz des XMP-Formats ist dementsprechend an den Erfolg des Adobe Softwareportfolios gekoppelt.

Doch bereits weit vor der Einführung digitaler Metadaten-Formate in der Fotografie wurde Ende des 19 Jahrhunderts das Dewey Decimal Classification (DDC) System im Bibliothekswesen eingesetzt. Die Digitalisierung der Katalogisierung im Bibliothekswesen fand dann Mitte des 20 Jahrhunderts durch die Machine-Readable Cataloging (MARC) Standards statt. Tatsächlich sollte jedoch erst kurz danach im Jahr 1968 von Metadaten gesprochen werden. In seinem Buch „Extension of Programming Language Concepts“ prägte Philip Bagley den Begriff erstmals.

Der letzte Entwicklungsschritt und damit die Voraussetzung zur Verwendung im Digital Asset Management wurde 1993 von Martiijn Koster getätigt. Er entwickelte ALIWEB, die erste mit Metadaten angetriebene Suchmaschine. Nur kurze Zeit später im Jahr 1995 startete mit MetaCrawler die erste kommerzielle Metadaten-Suchmaschine. MetaCrawler verband Teile der Suchergebnisse von Suchmaschinen wie Google, Yahoo!, Ask uvw. Neben Suchmaschinen wurde der Gebrauch von Metadaten und Metadaten-Sets auch für die Archivierung und Nachverfolgung von digitalen Ressourcen immer beliebter. Diese Anwendung von Metadaten bildete den Grundstein für die Art und Weise wie wir heutzutage digitalen Content verwalten.

Kategorien und Segmente von Metadaten

Die historische Entwicklung und Herkunft von Metadaten zeigt Anwendungsbeispiele in Kategorisierungs-, Archivierungs- und Zugehörigkeitsfragen. Metadaten digitaler Inhalte können im DAM Umfeld darüber hinaus unterschiedlichste Anwendungen finden. Verschlagwortungen, Informationseinbindungen aus Drittsystemen wie PIM oder ERP oder völlig individuelle Metadatenfeldkonfigurationen sind nur einige Beispiele. Übergeordnet lassen sich Metadaten in Kategorien und Segmente einteilen. Metadaten sind veränderbar und werden in Abhängigkeit zur Verwendung des Assets angepasst oder optimiert.

Kategorien von Metadaten umfassen administrative, beschreibende und strukturelle Metadaten. Administrative Metadaten beziehen sich typischerweise auf die technische Quelle des Assets: Dateityp, Dateigröße oder Erstellungsdatum sind administrative Metadaten. Beschreibende Metadaten dagegen sind Informationen, die das Asset näher beschreiben. In Rückblick auf die Historie der Metadaten können hier Titel, Autor, Eigentümer oder Genre genannt werden. Als strukturelle Metadaten werden Informationen bezeichnet, die die Organisation eines Assets näher beschreiben, wie beispielsweise Seitenzahlen, Abschnitte oder Kapitel in textuellen Assets.

Des Weiteren lassen sich bis zu vier Segmente von Metadaten unterscheiden. Die Inhaltsmetadaten kategorisieren Assets, sie beschreiben also was sich im Inhalt des Assets befindet. Verwendet werden hierzu häufig Schlagwörter oder Tags. Anleitungsmetadaten definieren, wie ein Asset intern bzw. extern verwendet wird, manchmal auch wie es verwendet werden darf. Historische Metadaten geben Auskunft darüber, woher das Asset stammt und auch ob und welche Anpassungen, Veränderungen oder Optimierungen durchgeführt worden sind. Aktuelle Metadaten sind Informationen zum Asset des aktuellen Zeitpunkts.

Ohne Metadaten kein Digital Asset Management

Wie bereits Eingangs erwähnt sind Metadaten entscheidend für die Funktionalität eines DAM-Systems. Dabei hängt die Qualität der Suchen maßgeblich mit der Qualität der Metadaten zusammen. Nur wenn Metadatenzuordnungen konsistent und genau annotiert werden können Suchergebnisse mit hoher Qualität erzielt werden. Modernde DAM-Systeme erlauben neben manuellen und Massen- auch eine automatische Annotation von Metadaten. Ein zeitgemäßes DAM-System stellt den Anwendenden also die Mittel bereit eine bestmögliche Qualitätsstufe von Metadaten zu erreichen, es erfordert jedoch immer mehr also nur die reine DAM-Technologie. Die korrekte und konstante Aufarbeitung der Assets mit Metadaten ist unabdinglich.