Content-Type


Unter dem Begriff Content-Type werden Inhalte einer per HTTP übertragenen Datei anhand einer zweigeteilten Angabe klassifiziert. Diese Klassifikation wird von der IANA standardisiert und veröffentlicht. Ein alternativer Begriff ist auch der MIME-Type. In diesem Fall werden die Dateninhalte gemäß den MIME (Multipurpose Internet Mail Extensions) spezifiziert. Beide werden als „Internet Media Type“ zusammengefasst. Zum anderen ist der Content-Type auch ein Meta Tag im Header eines HTML-Dokuments, das Browsern anzeigen kann, welche Inhalte auf einer Website verwendet werden.

MIME Content-Typen

Es gibt eine große Vielzahl an Content-Types, die auch als MIME-Typen bezeichnet werden. Der MIME-Standard wurde speziell für E-Mails nach RFC 7233 eingeführt.[1]

Wird der Internet Media Type angegeben, sind das zwei Angaben sowie optional eine Ergänzung. Erstere umfasst den Medientyp, zweitere die Unterkategorie. Folgende Medientypen können verwendet werden:

  • application: Dabei handelt es sich um Dateien, die zum Beispiel von einer bestimmten Anwendung genutzt werden können oder Dateien, für die keine eindeutige Zuordnung möglich ist.
  • audio: Diese Angabe bezieht sich auf in einem Dokument enthaltene Audio-Dateien.
  • example: Wird ein Dokument so ausgezeichnet, enthält es Beispiele für bestimmte Dateiformate.
  • image: Damit wird auf Bilder und Grafikdateien verwiesen.
  • message: Verweist darauf, dass es sich um eine Nachricht, zum Beispiel eine E-Mail handelt.
  • model: Bezeichnet Daten mit mehrdimensionaler Struktur.
  • multipart: Dieser Typ gibt einen Hinweis auf Dateien, die aus mehreren Teilen bestehen.
  • text: Das ist der Internet Media Type für Textdateien.
  • video: Wird für Videodateien genutzt.

Gängige Kombinationen mit Unterkategorien sind:[2]

  • image/jpeg: JPEG-Bilddatei
  • image/tiff: TIFF-Bilddatei
  • text/plain: TXT-Datei (Plain Text)
  • video/mpeg: MP2-, MPA-, MPE-, MPEG-, MPG-Dateien
  • audio/mpeg: MP3-Dateien
  • audio/x-wav: WAV-Dateien

Wird ein html-Dokument klassifiziert, kann zusätzlich auch der Zeichensatz ergänzt werden. Eine mögliche Angabe wäre zum Beispiel:text/html; charset=UTF-8

Content-Type als Meta-Angabe

Die Meta-Angabe Content Type wird im Header einer Seite definiert, um den standardisierten Zeichensatz und den Typ des Inhalts anzeigen zu lassen, die auf einer HTML-Seite verwendet wurden.

Nutzen

Mit der Definition des Content-Types und insbesondere des „charset“, also des Zeichensatzes, kann sichergestellt werden, dass jeder Browser die Seite korrekt darstellen kann. Wird diese Angabe im Head-Bereich einer Website nicht eingefügt, kann es beispielsweise passieren, dass Browser Umlaute wie ä, ö und ü nicht richtig darstellen können. Früher sah man häufig Seiten, bei denen die Umlaute dann ersatzweise durch einen variierenden Platzhalter ersetzt wurden.

Auch spezielle Satzzeichen können zu Problemen führen. Durch die Angabe des Content-Types wird der zu verwendende Zeichensatz gemäß ISO-Richtlinie definiert. Ruft ein Browser später die Seite auf, erkennt er anhand dieser Angabe, welcher Zeichensatz zu verwenden ist. Dadurch wird die korrekte Interpretation aller Zeichen ermöglicht.

Beispiel für die Einbindung

Das Content Type Meta-Tag sieht wie folgt aus:

 

Für deutschsprachige Seiten gilt der westeuropäische und der amerikanischer Zeichensatz ISO-8859-1.

Weitere ISO-Standards für fremdsprachige Webseiten

Kommen Seiten in anderen Sprachen vor, gelten hier andere Standards:

ISO-8859-1: Albanisch, Dänisch, Deutsch, Englisch, Farörisch, Finnisch, Französisch, Galizisch, Irisch, Isländisch, Italienisch, 
Katalanisch, Niederländisch, Norwegisch, Portugiesisch, Schwedisch, Spanisch.
 
ISO-8859-2: Kroatisch, Polnisch, Rumänisch, Slowakisch, Slowenisch, Tschechisch, Ungarisch.
 
ISO-8859-3: Esperanto, Galizisch, Maltesisch, Türkisch (Türkisch s. auch ISO-8859-9).
 
ISO-8859-4: Estnisch, Lettisch, Litauisch.
 
ISO-8859-5: Bulgarisch, Mazedonisch, Russisch, Serbisch, Ukrainisch.
 
ISO-8859-6: Arabisch.
 
ISO-8859-7: Neugriechisch.
 
ISO-8859-8: Hebräisch.
 
ISO-8859-9: Türkisch.
 
ISO-8859-10: Grönländisch (Inuit), Lappisch (Sami)

Bedeutung für die Suchmaschinenoptimierung

Beim Definieren von Meta Tags können Suchmaschinen wichtige Informationen einer Seite mitgeteilt werden. Deshalb wird empfohlen auch den Content-Type-Meta-Tag zu verwenden. Diese Angabe gehört zu den Tags, die von Suchmaschine Google problemlos gelesen werden können. Wird der Tag gesetzt, kann der Googlebot die gecrawlten Inhalte schon im Vorfeld genauer einordnen. Zugleich wird die Zuordnung zu vertikalen Suchen wie der Bilder- oder Videosuche erleichtert.

Auch für die sprachliche Zuordnung ist der Content-Type wichtig. Wird für eine deutsche Seite der westeuropäische Zeichensatz hinterlegt, erfährt Google damit auch automatisch, dass die Umlaute ä, ö und ü mit ae, oe und ue gleichzusetzen sind. Sucht ein Nutzer also beispielsweise nach "Linkpopularitaet", ist Google dazu in der Lage, auch Suchergebnisse auszugeben, die das Wort "Linkpopularität" enthalten.

Einzelnachweise

  1. RFC 7233 ietf.org Abgerufen am 22.10.2018
  2. MIME Types by Content Type About.com. Abgerufen am 1. April 2014.

Weblinks