Semantic Web

Das sogenannte Semantic Web stellt eine Weiterentwicklung des World Wide Web bzw. des Web 2.0 dar, in dem nicht mehr nur Informationen miteinander verknüpft werden, sondern auch die Bedeutung der Dinge verarbeitet werden können. Man spricht auch vom Web 3.0. Um dem Ziel eines Semantic Web näher zu kommen, werden Hilfsmittel verwendet, um Maschinen die Bedeutung von Inhalten zu vermitteln. In diesem Zusammenhang arbeitet z.B. auch Google an einer semantischen Suche. Ein erster Entwicklungsschritt wurde hierfür bereits mit dem Hummingbird Update getan.

Hintergrund

Maschinen, also Computerprogramme, können nur die Informationen verarbeiten, mit welchen sie zuvor gespeist wurden bzw. für deren Verarbeitung der Mensch zuvor Regeln aufgestellt hat. Hierbei unterscheidet sich ein Computer z.B. von einem Mensch, der auch die Bedeutung der Dinge erkennen kann. Das Semantic Web soll nun dazu führen, dass Maschinen Inhalte und Daten selbständig auf der Basis von Algorithmen miteinander in Beziehung setzen können, um die Bedeutung der einzelnen Inhalte zu bestimmen.

Ein Beispiel für die Anforderungen an ein semantisches Web ist die Websuche. Heute ist es schwierig aus einer Query wie „Warum wachsen Bananen nicht in den Alpen?“ eine sinnvolle Antwort zu erhalten, wenn eine Webseite nicht exakt diese Wortkombination verwendet. Wenn das Semantic Web funktioniert, sollten derartige Fragestellungen von Maschinen leicht zu beantworten sein.

Umsetzung

Damit das Internet „klüger“ wird, müssen Menschen den Maschinen dabei helfen, die vorliegenden Informationen näher zu beschreiben. Der W3C gibt hierfür bereits Standards heraus: http://www.w3.org/standards/semanticweb/. Hierbei helfen z.B. auch sogenannte Markups oder Standards für Metaangaben, die hier kurz skizziert werden:

  • RDF (Ressource Description Framework): hiermit können die Informationen einer Website näher beschrieben werden. Als Ergänzung dient auch RDFa, womit RDF in XML-Dokumente eingefügt werden kann.
  • Dublin Core: hierbei handelt es sich um einen Standard, mit dessen Hilfe Metaangaben zum Inhalt eines digitalen Dokuments in maschinenlesbarer Form hinterlegt werden.
  • RIF: hierüber werden Regeln definiert, welche die Bedeutungszusammenhänge herstellen sollen.

Praxisbeispiele

Das Semantic Web befindet sich erst in seinen Anfängen. Jedoch zeigt sich vor allem an der Weiterentwicklung von Suchmaschinen, wie sehr Maschinen inzwischen die Bedeutung von Inhalten erkennen können.

Ein Beispiel ist die Bildersuche von Google, die ähnliche Bilder bereits über hochgeladene Dateien erkennen kann. Auch der Knowledge Graph von Google ist ein Ergebnis der immer besser werdenden semantischen Suche. Er erkennt z.B., wenn ein User einen Vergleich anstellen möchte.

Grundsätzlich handelt es sich bei der Weiterentwicklung des Semantic Web auch um einen Lernprozess. Viele Strategien des Google-Konzerns zeigen, wie dieser Lernfortschritt erreicht werden kann: durch Data Mining. Darüber hinaus helfen Funktionen wie das Webprotokoll von Usern den Suchmaschinen z.B. dabei zu unterscheiden, ob ein Nutzer nach dem Sport „Golf“ oder nach dem PKW sucht, wenn er das gleichnamige Wort in die Suchmaske eingibt.

Weblinks