RDF

RDF ist die Abkürzung für "Resource Description Framework". Es handelt sich bei RDF um eine Auszeichnungssprache, die für die Modellierung von Metadaten für Ressourcen im Internet verwendet wird. RDF legt dabei eine Syntax fest, die dem gemeinsamen Datenaustausch gilt. Dadurch können Informationen zwischen verschiedenen Anwendungen ausgetauscht werden, ohne dass es zu Bedeutungsverlusten kommt.


Allgemeine Informationen zum Thema

RDF trifft man im Netz häufig an. Mit Hilfe von URI werden Informationen im Internet identifiziert, zudem können Metadaten bezüglich Webressourcen dargestellt werden. Solche Daten sind etwa Angaben über den Autor, den Titel, das Copyright oder das Datum der letzten Änderung. Im RDF-Format stehen außerdem RSS-Feeds zur Verfügung. Als Ergänzung zu RDF können RDFS und OWL genannt werden.[1]


Probleme, die beim HTML-basierten Web auftreten

Das Problem mit HTML besteht in der Tatsache, dass Informationen erst durch den Benutzer erzeugt werden. HTML ist also eine reine Dokumentenbeschreibungssprache, die zunächst einmal nur Daten enthält. Computer können diese Daten zwar verarbeiten, doch der konkrete Inhalt (die Aussage) wird nicht erfasst. Das führt zu Problemen für Suchmaschinen, Datamining und Einkaufsagenten. XML kann diese Problemstellung teilweise lösen, weil es sich dabei um eine allgemeine Beschreibungssprache handelt und Information und Darstellung getrennt verlaufen. Zudem gibt es eine freie Definition der Zusammenhänge und Begriffe. Allerdings ist die Schreibweise von XML nicht eindeutig, die Bedeutung der Daten ist nicht definiert und die Struktur ist immer hierarchisch. Als Lösung scheint sich ein XML-Schema anzubieten, das eine feste Definition der Syntax (Grammatik) ermöglicht und Attribute und Elemente festlegt. Eine eindeutige Definition der Semantik ist aber auch über das XML-Schema nicht möglich.


RDF als Lösung des Problems

RDF bietet sich als Lösung an, weil es die Ressourcen (also: die Dinge aller Art) und die Beziehungen dazwischen beschreibt. Die Informationen werden in Dokumenten gespeichert.

Diese RDF-Dokumente bestehen aus Statements, die sich folgendermaßen zusammensetzen:

  • Subjekt: Damit ist die zu beschreibende Ressource gemeint
  • Prädikat: Meint die Eigenschaft der Ressource, die durch das entsprechende Statement beschrieben werden soll
  • Objekt: Dies ist der Wert der Eigenschaft

Zunächst also ist RDF ein rein abstraktes Modell, dessen Syntax bzw. Sprache noch nicht festgelegt ist. Als mögliche anwendbare Sprachen kommen N3 und XML in Betracht, außerdem besteht die Möglichkeit, die Darstellung als Graph zu wählen.[2]


Beispiel für das RDF-Modell

Um die Hintergründe zu verstehen, die das RDF-Modell für das Internet bedeutet, sei anhand eines Beispiels auf Subjekt, Prädikat und Objekt näher eingegangen:

  • Das Subjekt: In der Grammatik ist das Subjekt das Satzglied, das auf die Frage „Wer oder was?“ hinausläuft. Es handelt sich also um ein sachliches Objekt oder eine Person. Basierend etwa auf der Aussage „Dieses Unternehmen verkauft Schuhe“ ist das Unternehmen das Subjekt. Auf dem Gebiet der Logik wird mit dem Subjekt der Ausdruck beschrieben, über den etwas angegeben wird. Beim Modell RDF ist das Subjekt die Ressource, die in der Folge durch Prädikat und Objekt benannt wird. Im RDF-Modell wird das Subjekt mittels eines „Uniform Resource Identifier (URI)“ eindeutig dargestellt, weil der URI nicht nur in der analogen, sondern auch in der digitalen Welt unmissverständlich funktioniert. Das Subjekt „Das Unternehmen“ ist also grammatikalisch und digital klar eingeordnet.
  • Das Prädikat: In der Grammatik modifiziert dieser Teil eines Satzes das Subjekt. Im genannten Beispielsatz „Das Unternehmen verkauft Schuhe“ ist das Prädikat also „verkauft“. Somit wird dem Unternehmen eine klare und eindeutige Handlung zugeschrieben. In dem RDF-Modell muss also die Bedeutung des Wortes „verkauft“ klar werden, wofür eine URI definiert werden muss. Diese kann beispielsweise so aussehen: “https://www.unternehmen.org/schuhkunde/#verkauft”.
  • Das Objekt: Dieses Satzglied ist in der Grammatik ein Nomen, das sich auf das Prädikat bezieht. In unserem Beispielsatz ist das Objekt „Schuhe“. Im RDF-Modell stellt das Objekt eine Ressource dar, die sich auf das Prädikat, aber auch auf einen wörtlichen Wert (literal) beziehen kann. Auch für das Objekt ist es notwendig, dass ein eindeutiger URI definiert wird.

RDF kann also sowohl für elektronische Ressourcen stehen, zum Beispiel Dateien, als auch für Konzepte in Form von Personen. Maßgeblich ist dabei die eindeutige Zuordnung und Identifizierung mittels der genannten URIs. Das ist wichtig, damit keine Doppeldeutigkeiten entstehen, so wie das bei sprachlichen Zeichen oft der Fall sein kann.[3]


Bedeutung für das Development

Damit Programme Daten für Menschen verwertbar und lesbar machen können, ist RDF unverzichtbar. Ohne diese Möglichkeit können über zahlreiche Dinge im Netz keine logischen und nachvollziehbaren Aussagen gemacht werden. Heute wird RDF als ein grundlegender Bestandteil des semantischen Netzes betrachtet. Charakteristisch für RDF sind die drei genannten Einheiten, bestehend aus Objekt, Subjekt und Prädikat. In der Regel wird für RDF XML verwendet, hinzu kamen aber auch Notation 3 (N3) und die Sprache “Turtle“, die 2011 das erste Mal Anwendung fand. Hintergrund war der Wunsch, von N3 nur Elemente zu verwenden, also nicht das ganze Programm zur Anwendung kommen zu lassen. Das Ziel war eine größere Verbreitung für Turtle, die abgespeckte Version von N3[4].


Einzelnachweise

  1. Glossar e-teaching.org Abgerufen am 18.02.2020
  2. RDF nats-www.informatik.uni-hamburg.de Abgerufen am 18.02.2020
  3. Ressource Description Framework semantisches-web.net Abgerufen am 18.02.2020
  4. Ressource Description Framework semantisches-web.net Abgerufen am 18.02.2020


Weblinks