URI


Ein Uniform Resource Identifier (deutsch: Einheitlicher Bezeichner für Ressourcen, kurz: URI) ist der Überbegriff für eine Zeichenfolge, die als eindeutige Referenz für Ressourcen in einem unsortierten und dezentralen Informationsraum wie dem Internet dient. Diese Ressourcen können abstrakt oder auch physikalisch sein. Mögliche Ressourcen sind Text-, Video- und Audiodateien, aber auch Webservices wie Email, Programme zum Datentransfer oder Netzwerkadapter.

Allgemeine Informationen zum Thema

Das Konzept des Uniform Resource Identifier bildet die Grundlage für verschiedene Protokolle im Internet. URIs stellen die Syntax dar, an der sich Protokolle wie HTTP oder FTP orientieren müssen, um reibungslos zu funktionieren. Allerdings beruhen URIs nicht auf einer spezifischen Grammatik, sondern sie sind eher ein Metakonzept, das es erlaubt, unterschiedliche Typen von einheitlichen Bezeichnern zu formulieren. Die einzelnen URIs, die je nach System verschiedene Kriterien erfüllen sollen, werden erst anhand eines Schemas erzeugt, das einer spezifischen Grammatik näher kommt als das Metakonzept. Das bedeutet, dass URI ein abstraktes Konzept ist, dass erst in den verschiedenen Anwendungsbereichen mithilfe des jeweiligen Schemas einen einheitlichen Bezeichner erzeugt. Die oberste Prämisse ist stets die Einzigartigkeit dieses Bezeichners, damit ein gegebenes Objekt, zum Beispiel ein Netzwerkadapter, exakt referenziert werden kann.

Es gibt drei grundsätzliche Arten von einheitlichen Bezeichnern: Namen, Orte und Individuen. Mit Namen kann der Inhalt einer Ressource gekennzeichnet werden, um ihn aus einer Vielzahl von Ressourcen herausgreifen zu können. Wird ein Ort im Bezeichner angegeben, wird eine Ressource mittels einer Netzwerkadresse identifiziert. Und grundsätzlich können URIs auch abstrakte Entitäten bezeichnen, um zum Beispiel eine Person anhand einer Mobilfunknummer oder Email-Adresse zu identifizieren.[1]

Die URI als Konzept zur Adressierungsmöglichkeit in einem Informationsraum kann wiederum in unterschiedliche Einzelkonzepte untergliedert werden:

  • URL: Als Uniform Resource Locator ist die URL für die Nutzung des Webs in Form von Internetadressen bekannt.
  • URN: Die Uniform Resources Names werden zum Beispiel für die Adressierung von Resourcen in Bibliotheken genutzt. Die Deutsche Nationalbibliothek referenziert die Bände in ihren Beständen nach diesem Konzept.
  • PURL: Bei einem Persistent Uniform Resource Locator handelt es sich um einen Identifikator mit einer permanenten Adressierung einer Internet-Ressource. Verwendet werden PURL zum Beispiel vom Internet Archive.
  • URC: Mit den Uniform Resource Characteristics wurde ein Konzept geschaffen, um die Metadaten von URI wiederzugeben. Das Konzept stammt noch aus den frühen Zeiten des Internet, aus den 1990er-Jahren.

Aufbau

Ein URI besteht immer aus der Bezeichnung des Schemas und dem Standort der Ressource. Das Grundprinzip lautet immer:

Schema: Schemaspezifisch Bei einer URL kann der Aufbau unterschiedlich ausfallen, abhängig vom Schema:

  • mailto:max@mustermann.de In diesem Fall wäre das Schema „mailto“ ein Verweis auf eine Mail-Adresse als Ressource.
  • https://www.eineseite.de Hier wäre https das Schema, das auf eine Internetressource verweist.

Funktionen

Jeder URI beginnt mit einem Schema (englisch: scheme), das definiert, wie URIs innerhalb dieses Schemas formuliert werden. Ein URI kann mit dem Authority-Element mit einem privilegierten Zugang zu der jeweiligen Ressource verbunden werden. Werden hier User-Information, Host und ein optionaler Port angegeben, sind dies Subkomponenten von Authority, die den Zugang zur Ressource regeln. Das Element Path gibt den Pfad einer Ressource an. Sowohl absolute als auch relative Pfade sind möglich.

Das Query-Element kann anhand von Attribut-Wert-Paaren eine Ressource identifizieren, ohne auf hierarchisch sortierte Daten zurückzugreifen, wie das bei dem Authority-Element der Fall ist. Fragment ist ein Element, das eine indirekte Identifikation mithilfe von anderen Ressourcen erlaubt, ohne auf diese direkt zugreifen zu müssen.

Praxisbezug

In der Praxis werden URIs zwar ständig verwendet, aber in vielen Fällen ist nicht ersichtlich, dass es sich um einen URI handelt. Als Unterart ist hier die URL (Uniform Resource Locator) oder PURL (Persistent Uniform Resource Locator) zu erwähnen. Wer im Internet surft, kann nur mithilfe von URLs zwischen verschiedenen Webadressen navigieren. Eine URL ist das wohl bekannteste Anwendungsbeispiel eines URI. Das Schema ist darauf ausgelegt, einen Ort in einem Netzwerk exakt zu bestimmen. Im allgemeinen Sprachgebrauch ist es jedoch fälschlicherweise üblich, URI und URL synonym zu verwenden. Wenn eine URL als eindeutige Referenz angegeben wird, nennt man dies in der Fachsprache einen Permalink.

Bedeutung für das SEO

Für die Suchmaschinenoptimierung sind URLs, die Unterart von URIs, besonders wichtig. Schon bei der Planung einer Website sollte die URL-Struktur beachtet werden, um Nutzern und Suchmaschinen Hinweise auf die Inhalte der Website zu geben. Die grundsätzliche Struktur sollte nicht mehr verändert werden, wenn die Seite einmal gecrawlt wurde.

Bei der Wahl von URLs sollten nicht nur relevante Keywords, die den Seiteninhalt beschreiben, verwendet werden, sondern auch Begriffe, die für sich selbst sprechen. Das heißt: Es werden solche Begriffe verwendet, die den Seiteninhalt mit einfachen Worten beschreiben und sich nicht langen Zeichenketten mit Parametern verlieren. Parameter entstehen in der Regel bei dynamisch erzeugten Webseiten. Um aus URLs mit Parametern sprechende URLs zu machen, gibt es aber Lösungen wie zum Beispiel das mod_rewrite Modul von Apache Servern, das eine dynamische URL in eine statische umschreiben kann.

Einzelnachweise

  1. Uniform Resource Identifier (URI): Generic Syntax. Ietf.org. Abgerufen am 02. Dezember 2013.

Weblinks