URI

Ein Uniform Ressource Identifier (deutsch: Einheitlicher Bezeichner für Ressourcen, kurz: URI) ist eine Zeichenfolge, die als eindeutige Referenz für Ressourcen im Internet dient. Diese Ressourcen können abstrakt oder auch physikalisch sein. Mögliche Ressourcen sind Text-, Video- und Audiodateien, aber auch Webservices wie Email, Programme zum Datentransfer oder Netzwerkadapter.

Das Konzept des Uniform Ressource Identifier bildet die Grundlage für verschiedene Protokolle im Internet. URIs stellen die Syntax dar, an der sich Protokolle wie HTTP oder FTP orientieren müssen, um einbahnfrei zu funktionieren. Allerdings sind URIs keine spezifische Grammatik, sondern eher ein Metakonzept, dass es erlaubt, unterschiedliche Typen von einheitlichen Bezeichnern zu formulieren. Die einzelnen URIs, die je nach System verschiedene Kriterien erfüllen sollen, werden erst anhand eines Schemas erzeugt, das einer spezifischen Grammatik näher kommt als das Metakonzept. Das bedeutet, dass URI ein abstraktes Konzept ist, dass erst in den verschiedenen Anwendungsbereichen mithilfe des jeweiligen Schemas einen einheitlichen Bezeichner erzeugt. Die oberste Prämisse ist stets die Einzigartigkeit dieses Bezeichners, damit ein gegebenes Objekt, zum Beispiel ein Netzwerkadapter, exakt referenziert werden kann.

Es gibt drei grundsätzliche Arten von einheitlichen Bezeichnern: Namen, Orte und Individuen. Mit Namen kann der Inhalt einer Ressource gekennzeichnet werden, um ihn aus einer Vielzahl von Ressourcen herausgreifen zu können. Wird ein Ort im Bezeichner angegeben, wird eine Ressource mittels einer Netzwerkadresse identifiziert. Und grundsätzlich können URIs auch abstrakte Entitäten bezeichnen, um zum Beispiel eine Person anhand einer Mobilfunknummer oder Email-Adresse zu identifizieren.[1]

Funktionen

Jeder URI beginnt mit einem Schema (englisch: scheme), das definiert, wie URIs innerhalb dieses Schemas formuliert werden. Ein URI kann mit dem Authority-Element mit einem privilegierten Zugang zu der jeweiligen Ressource verbunden werden. Werden hier User-Information, Host und ein optionaler Port angegeben, sind dies Subkomponenten von Authority, die den Zugang zur Ressource regeln. Das Element Path gibt den Pfad einer Ressource an. Sowohl absolute als auch relative Pfade sind möglich. Das Query-Element kann anhand von Attribut-Wert-Paaren eine Ressource identifizieren, ohne auf hierarchisch sortierte Daten zurückzugreifen, wie das bei dem Authority-Element der Fall ist. Fragment ist ein Element, das eine indirekte Identifikation mithilfe von anderen Ressourcen erlaubt, ohne auf diese direkt zugreifen zu müssen.

Praxisbezug

In der Praxis werden URIs zwar ständig verwendet, aber in vielen Fällen ist nicht ersichtlich, dass es sich um einen URI handelt. Als Unterart ist hier die URL (Uniform Ressource Locator) zu erwähnen. Wer im Internet surft, kann nur mithilfe von URLs zwischen verschiedenen Webadressen navigieren. Eine URL ist ein Anwendungsbeispiel eines URI. Das Schema ist darauf ausgelegt, einen Ort in einem Netzwerk exakt zu bestimmen. Im allgemeinen Sprachgebrauch ist es jedoch fälschlicherweise üblich, URI und URL synonym zu verwenden. Wenn eine URL als eindeutige Referenz angegeben wird, nennt man dies in Fachsprache einen Permalink.

Bedeutung für das SEO

Für die Suchmaschinenoptimierung sind URLs, die Unterart von URIs, besonders wichtig. Schon bei der Planung einer Website sollte die URL-Struktur beachtet werden, um Nutzern und Suchmaschinen Hinweise auf die Inhalte der Website zu geben. Die grundsätzliche Struktur sollte nicht mehr verändert werden, wenn die Seite einmal gecrawlt wurde. Gleiches gilt für jede URL innerhalb der Struktur. Denn die Suchmaschinen können eine neu formulierte URL als Duplicate Content werten, wenn eine andere, aber inhaltsgleiche URL existiert. Bei der Wahl von URLs sollten nicht nur relevante Keywords, die den Seiteninhalt beschreiben, verwendet werden, sondern auch Begriffe, die für sich selbst sprechen. Das heißt: Es werden solche Begriffe verwendet, die den Seiteninhalt mit einfachen Worten beschreiben und sich nicht in Fachvokabular oder langen Zeichenketten mit Parametern verlieren. Letzteres ist oft bei dynamisch erzeugten Webseiten der Fall. Hier gibt es aber Lösungen wie zum Beispiel das mod_rewrite Modul von Apache Servern, das eine dynamische URL in eine statische umschreiben kann.

Einzelnachweise

  1. Uniform Resource Identifier (URI): Generic Syntax. Ietf.org. Abgerufen am 02. Dezember 2013.

Weblinks

Kategorie

Verwandte Artikel