Metadaten


Metadaten (engl: meta data) sind strukturierte Daten, die übergreifende Informationen über eine Ressource - wie Bücher, Webdokumente, Videos oder Bilder - beinhalten. Durch Metadaten wird die Informationsressource mit zusätzlichen Daten beschrieben, um sie maschinell und automatisiert verarbeiten zu können.

Metadaten sind Informationen über Ressourcen, die Vorgänge wie Data Mining, Information Retrieval, Crawling oder Indexing ermöglichen. Aber auch übergeordnete Konzepte wie das Semantik Web oder die Informationsstrukturierung sind damit verbunden. Im Falle von Suchvorgängen, zum Beispiel durch Suchmaschinen oder Bibliothekssysteme, können Ressourcen besser und schneller gefunden werden, wenn sie durch Metadaten ausgezeichnet wurden.

Allgemeine Informationen zum Thema

Im Bibliothekswesen, in der Statistik, bei der Softwareentwicklung und insbesondere im Internet kommen Metadaten häufig zum Einsatz. Eine Bibliothek könnte zum Beispiel Titel, Autor, Veröffentlichungsdaten und Stichwörter verwenden. Bei anderen Systemen handelt es sich meist um abstraktere Formate wie die Beschreibung von Dokument- und Informationstypen, oder verschiedene Verarbeitungsregeln und Programmieranweisungen, um komplexere Anwendungen zu realisieren.

Interoperabilität

Metadaten können in verschiedenen Formaten oder Standards angegeben werden. Diese Standards gewährleisten die sogenannte Interoperabilität. Dies ist einerseits eine Austauschbarkeit von Informationen. Andererseits eine Zusammenarbeit von zwei oder mehreren Systemen. Die Informationen sind anwendungsübergreifend nutzbar und verlinkbar, wenn beides zusammenkommt. Das Ziel ist es, Daten zwischen verschiedenen Systemen und Anwendungen ohne Informationsverlust austauschen und verarbeiten zu können.

Es gibt verschiedene Arten von Interoperabilität:[1]

  • Strukturelle Interoperabilität: Verschiedenen Metadaten-Formaten liegt ein gemeinsames Datenmodell zugrunde. RDFa, Microformate und strukturierte Daten sind Beispiele hierfür.
  • Syntaktische Interoperabilität: Wenn Daten einer gemeinsamen Syntax folgen, sind sie syntaktisch interoperabel. Als Beispiel kann das XML-Format dienen, da alle möglichen Elemente und die Regeln zu ihrer Verknüpfung festgelegt sind.
  • Semantische Interoperabilität: Wird ein Metadatenstandard mit genau den gleichen Auszeichnungs-Begriffen verwendet, sind die Daten aus semantischer Sicht interoperabel. Der Dublin Core ist ein solches allgemeines Format, das prinzipiell eine semantische Interoperabilität herstellen kann.

Verschiedene Metadaten, Formate und Standards

Auch eine Vielzahl von Informationstypen, Anwendungen und unterschiedlichen Systemen stellt sich als schwierig heraus. Metadaten können Ressourcen strukturell beschreiben, um sie auffindbar zu machen. Sie können aber auch Prozesse in Gang setzen, um Programmieranweisungen zu realisieren. Ebenso können sie Inhalte bewerten, definieren und strukturieren sowie Beziehungen zwischen verschiedenen Ressourcen beschreiben. Als Meta-Metadaten sind sie übergeordnete Informationen über Datenmodelle, Syntax und Semantik, um Sprachen zu definieren und computer-linguistische Anwendungen zu ermöglichen.

Bestimmte Ressourcen und Informationstypen können letztendlich durch mehrere Systeme und Programme verwendet werden, wenn sie durch die gleichen Metadaten gemäß eines Standards ausgezeichnet sind. Dies erfolgt beispielsweise bei der Interaktion von Nutzern (Browsern) mit Websites (Servern), aber auch beim Parsen von Websites durch Suchmaschinen und deren Crawler. Weitere Verwendungsszenarien sind die Migration von Servern und Datenbanken sowie die Interaktion zwischen mobilen Endgeräten und NFC-Terminals.

Metadaten im WWW

In der HTML-Programmierung werden Metadaten genutzt, um Informationen für Server, Browser oder für automatisierte Programme (Robots, Spider, Crawler) zu notieren. Metaangaben können auch Befehle zum Verhalten einer Website beinhalten. Beispielsweise zur Weiterleitung einer Seite (dies wird als Forwarding bezeichnet) oder zur Anpassung der Inhalte an kleine Displays.

Die Daten werden üblicherweise im Head eines HTML-Dokuments editiert, können aber auch automatisch für mehrere Dokumente erzeugt werden. Jede Metaangabe ist durch Attribut- und Wertpaare gekennzeichnet und wird als Meta Tag in dem jeweiligen Dokument durch Tags geöffnet und geschlossen. Jedes Metatag ist strukturell gesehen ein Kind des Head-Elementes und wird dort in die Dokumentstruktur eingefügt.

Je nach Ziel sind dabei ganz verschiedene Attribut- und Wertpaare möglich. Zum Beispiel: Metadescriptions, Meta Titles, Meta Keywords oder verschiedene Informationen über den Autor des Dokumentes. Mit Bezug zur Suchmaschinenoptimierung wären Anweisungen für Spider und Crawler zu erwähnen, die mit dem Meta Tag robots bestimmt werden. Hinzu kommen unterschiedliche Informationen über Sprachen und Arten von Inhalten. So definiert der Datenstandard MIME einen wichtigen Teil der Metadaten, damit der Browser diese Inhalte korrekt lesen und mit der richtigen Anwendung ausführen kann.

Beispiel

Metadaten können auf verschiedene Weise notiert werden. Alle Angaben sind optional, werden aber in bestimmten Umfang sowohl von Suchmaschinen als auch von Experten im Bereich Online Marketing empfohlen. Einerseits erhalten Suchmaschinen Hinweise für den Inhalt von Webdokumenten, andererseits bekommen Nutzer beispielsweise die Meta Description als Snippet in den SERPs angezeigt, um die CTR zu erhöhen. Im Einzelfall ist also zu überlegen, welche Metadaten angegeben werden sollten.

Hier ein Auszug einer Metaangabe:

<head>
 <meta name="description" content="Dieser Beschreibungstext soll den Inhalt erläutern und die Klickraten erhöhen.">
 <meta name="author" content="Max Pattern">
 <meta name="keywords" content="HTML5, Metadaten, Metatag">
 <meta name="date" content="2014-12-15T08:49:37+02:00">
 <!-- ... weitere Angaben im Head-Bereich ... -->
 </head>

Bei der Erstellung von Metaangaben kann zudem der sogenannte Dublin Core als Standard dienen.

Metadaten, SEO und Datenschutz

Zur Suchmaschinenoptimierung gehört naturgemäß auch die Analyse von Webseiten. Hier werden weit über die Metadaten hinaus Informationen gesammelt, ausgewertet und entsprechende SEO-Maßnahmen erarbeitet. Metadaten sind nicht nur auf Webseiten zu finden, sondern auch in Mails, Textdokumenten, Videos und Fotos. Die meisten Suchmaschinenoptimierer verwenden für die Arbeit mit ihren Kunden Google Analytics. Doch spätestens seit der Einführung der Datenschutzgrundverordnung (DSGVO) ist das nicht unproblematisch.

Um als Suchmaschinenoptimierer über Google Analytics auf die Metadaten und zahlreiche andere Informationen des Kunden zugreifen zu können, sind folgende vorbereitende Maßnahmen notwendig:

Aktivierung der IP-Anonymisierung Aktualisierung der Datenschutzerklärung Das Setzen von Opt-out-Cookies und einen Link zum Browser-Plugin Aktivierung einer verkürzten Speicherung der Nutzerdaten

Die DSGVO schreibt hier eine Speicherdauer vor, die sich am Interesse des Nutzers orientiert. Um sicher zu sein, empfiehlt sich die kürzeste Speicherdauer von 14 Monaten (Stand: Oktober 2021).

Teilweise im Widerspruch zur DSGVO steht auch der Speicherort der Daten, die durch Google Analytics gesammelt werden. Meist landen diese – wenn auch zum Teil anonymisiert - auf den Servern in den USA.

Eine mögliche Alternative ist Matomo. Dort werden die Daten entweder auf der Matomo-Cloud gespeichert. Oder man kann alternativ dazu alle Daten auf einem eigenen Server hosten.

Schon im Jahr 2018 hat Matomo speziell auf die DSGVO zugeschnittene Features entwickelt, die es unter anderem erlauben, alle Daten automatisch zu anonymisieren.

[2]

Der Abschluss eines Auftragsverarbeitungsvertrages (kurz: AV-Vertrag) ist nicht mehr notwendig. Inzwischen reicht es aus, die sogenannten Standardvertragsklauseln (SCC – Standard Contractual Clauses) umzusetzen. Dabei müssen jedoch die Datenexporteure dafür Rechnung tragen, dass der geforderte Datenschutz auch im Drittland eingehalten wird.

[3]

Bedeutung für die Suchmaschinenoptimierung

Suchmaschinen Crawler benutzen Metadaten, um Meta-Informationen eines Webdokuments auszulesen. Diese Daten helfen der Suchmaschine, Seiten zu indexieren und richtig zuzuordnen. Im HTML können Informationen mittels Meta-Tags hinterlegt werden. Einige Meta-Tags wie zum Beispiel Title-Tag sind für Suchmaschinen sehr bedeutsam und werden wahrscheinlich als wichtiger Ranking Faktor betrachtet. In der Regel weisen die Suchmaschinen daraufhin, welche Metadaten sie lesen und verarbeiten können.[4] Im Einzelfall hängt die Verwendung bestimmter Metatags aber auch davon ab, welche Inhalte auf einer Website vorhanden sind, mit welchen Endgeräten die Website aufgerufen werden soll und welche weiteren Dienste darin enthalten sind (zum Beispiel Druckversionen von Dokumenten oder ausfüllbare Formulare).

Einzelnachweise

  1. Kleines Handbuch Metadaten kim-forum.org. Abgerufen am 24.08.2015
  2. matomo eine echte google analytics alternative psw-consulting.de. Abgerufen am 08.10.2021
  3. drittlanduebermittlung transfer impact assessment tia und neue standardvertragsklauseln psw-consulting.de. Abgerufen am 08.10.2021
  4. Meta-Tags, die Google versteht support.google.com. Abgerufen am 24.08.2015

Weblinks