Canonical Tag

Das Canonical Tag ist eine Angabe im Quellcode einer Website. Es verweist auf eine Standardressource – eine kanonische URL – bei Websites mit gleichen oder fast gleichen Inhalten. Wird eine kanonische URL korrekt ausgezeichnet, so wird nur diese Quelle zur Indexierung der Suchmaschinen herangezogen. Suchmaschinen bewerten Duplicate Content negativ, da kein Mehrwert für den Internetnutzer besteht. Um Duplicate Content zu erkennen, kann ein Duplicate Content Checker verwendet werden.

Anwendungsfälle

Angewendet wird das Canonical Tag immer dann, wenn Inhalte mehrfach verwendet werden oder eine eindeutige URL technisch nicht möglich ist:

  • Die Startseite ist über verschiedene URLs erreichbar (www.domain.de, domain.de, www.domain.de/index.html u.s.w.).
  • Seiten sind mit und ohne Trailing Slashes (“/”) oder mit Klein- und Großschreibung aufrufbar (Case sensitivity).
  • Der Server achtet durch Rewriting der URL nur auf eine ID, lässt also Variationen der Adresse zu.
  • Es werden IDs (z. B. Session-ID oder Produktfilter) verwendet, die den Inhalt nicht ändern.
  • Der Inhalt wird in verschiedenen Ansichten dargeboten (z. B. in einer Druckversion, als PDF u.s.w.).
  • Es gibt https-Varianten der Seiten.
  • Inhalte werden auf anderen, externen Websites zusätzlich veröffentlicht.

Grundsätzlich ist es sinnvoll, das Canonical Tag auf jeder Unterseite einzubauen, sodass jede Seite auf sich selbst zeigt. Damit werden unerwartete Fehler und falsche Verlinkungen korrigiert oder vorgebeugt.

Zwei Varianten, eine kanonische URL anzugeben

Es gibt grundsätzlich zwei Möglichkeiten, eine kanonische URL anzugeben. Bei beiden Varianten empfiehlt Google die Angabe von absoluten URLs – d.h. der gesamten Internetadresse.

  • Die Syntax der ersten Variante sieht folgendermaßen aus:
<link rel=“canonical“ href=“http://www.beispiel.de/beispielseite.htm"/>

Das <link/>-Element mit dem Attribut canonical wird im <head/>-Element des Quellcodes platziert und ergänzt die Meta-Angaben eines Dokumentes. Es verweist auf die Standardseite, wird aber nur dort verwendet, wo Seiten, die nicht als Originalressource behandelt werden sollen, identische Inhalte aufweisen.

Nehmen wir an, wir haben zwei Webseiten:

 http://www.beispiel.de/beispielseite.htm
 http://www.beispiel.de/beispielseite/?session_id=xyz.htm

Die erste soll die Standardressource sein. Die zweite ist eine Session, wie sie bei Onlineshops oft üblich ist, um benutzerbezogene Daten speichern zu können, z.b. hinterlegte Artikel in einem Warenkorb. Nun wird das Canonical Tag in das Head-Element der zweiten Seite integriert. Es enthält einen Verweis auf die Standardressource, die erste Seite. So wissen Google und Co., welche Seite bevorzugt behandelt und in den Index aufgenommen werden soll.

  • Wenn die Standardressource eine PDF-Datei oder ein anderer Dateityp ist, der von Google unterstützt wird, dann muss das Canonical Tag in den Header der Seite integriert werden. Die Syntax unterscheidet sich und die Einbindung erfordert Kenntnisse des Hypertext Transfer Protokolls (HTTP):
Link: <http://www.beispiel.de/beispielseite.pdf>; rel=“canonical“

Dies ist keine Angabe im Dokument, sondern vielmehr eine Anweisung für die Antwort des HTTP-Protokolls: Kommt eine Anfrage vom Client (z.b. Browser oder eine Suchmaschine), sendet der Server die Antwort, dass diese Seite die kanonische URL ist. Mitunter ist eine neue Konfiguration des Servers notwendig.

Angenommen wir haben diese beiden Webseiten:

 http://www.beispiel.de/beispielseite.htm
 http://www.beispiel.de/beispielseite.pdf

Die zweite Seite soll die Standardressource sein. Da es eine PDF-Datei ist, muss das Canonical Tag in den Header der Seite integriert werden. Es verweist auf sich selbst und gibt Google den Hinweis, dass das PDF-Dokument als Standard zur Indexierung dienen soll.

Hintergrund

Mithilfe von Canonical Tags können Webseitenbetreiber Suchmaschinen mitteilen, welche der Seiten mit identischen Inhalten als Standardressource zu behandeln sind. Um dem Problem des Duplicate Contents Herr zu werden, ist ein korrekt verwendetes Canonical Tag die erste Wahl. Dadurch nehmen Webmaster auch Einfluss auf die Linkpopularität bestimmter Seiten mit identischen Inhalten und bündeln gleichzeitig die Reputation dieser Seiten auf einer kanonischen URL.

Anwendungsfälle

  • Canonical Tags und Paginierung: Bei einer Paginierung von Webseiten mit rel=”next” und rel=”prev” sollte jede Seite per Canonical auf sich selbst verweisen oder es sollten überhaupt keine Canonical-Tags verwendet werden. Einzige Ausnahme: Wenn es eine “view-all-Seite” gibt, kann der Canonical-Tag auf diese Übersichtsseite mit allen paginierten Seiten verweisen.
  • Canonical Tags und hreflang: Wenn eine Webseite mit hreflang arbeitet, sollten die jeweiligen URLs entweder per Canonical Tag auf sich selbst verweisen oder überhaupt keine Canonicals verwenden. Werden beide Tags gemeinsam genutzt, erhält Google widersprüchliche Signale. Während das hreflang-Tag zeigt, dass eine andere Sprachversion vorhanden ist, würde der Canonical-Tag diese Version zur Original-URL machen.
  • Canonical Tags und noindex: Mit dem noindex-Tag können Webmaster Google mitteilen, dass eine URL nicht indexiert werden solle. Verweist nun ein Canonical-Tag auf diese Seite, erhält Google unklare Signale. Es soll eine Seite als kanonisch gewählt werden, die aber nicht indexiert werden darf. Webmaster sollten sich deshalb entscheiden, ob sie die noindex- oder Canonical-Variante wählen.

Häufige Fehler

Allerdings ist es auch ein mächtiges Werkzeug, denn wird es falsch eingesetzt, können Webseiten von Google komplett ignoriert werden. Der Webseitenbetreiber sollte sich zunächst fragen, ob es sich wirklich um identische oder nahezu identische Inhalte handelt. Dann und nur dann sind Canonical Tags sinnvoll.

Häufige Fehler sind:

  • Bei paginierten / nummerierten Seiten durch rel-next, rel-prev sind Canonical Tags nicht sinnvoll, da es sich genau genommen nicht um identische Inhalte handelt.
  • Die ausgezeichnete Webseite sollte zudem erreichbar sein: Ein 404-Fehler ist unbedingt zu vermeiden.
  • Die Kombination von „noindex“, „disallow“ oder „nofollow“- Tags und kanonischen URLs ist von Google ausdrücklich nicht erwünscht.
  • Das Canonical Tag hat im Body-Bereich eines Dokumentes nichts verloren und es darf auch nicht in den Meta-Angaben mehrmals verwendet werden.
  • Es wird eine relative Pfadangabe als kanonisches Linkziel angegeben. Dadurch kann es vorkommen, dass der Googlebot die Angabe falsch interpretiert und das Tag somit seine Wirkung verliert. Aus diesem Grund sollte der Link im Canonical Tag immer als komplette URL angegeben werden.
  • Die Syntax wird nicht beachtet. Deshalb sollten immer alle Zeichen bei der Angabe berücksichtigt werden. Gleiches gilt für das Protokoll. Der Canonical Tag sollte zum Beispiel nicht von https auf das http-Protokoll verweisen.
  • Der Canonical Tag verweist auf die Startseite der Domain. In diesem Fall wird nur noch die Startseite als kanonische URL interpretiert. Das kann zur Folge haben, dass Google mittelfristig nur noch diese indexiert.
  • Der Canonical Tag verweist bei einer Seitenpaginierung auf die erste Seite. Der Tag wäre hier falsch gesetzt, da er anzeigt, dass es Duplikate einer Seite gibt. Bei einer Paginierung sind die Inhalte der Seiten sowie die URLs nicht gleich. Es wird Google lediglich mitgeteilt, dass die entsprechende paginierte Seite Teil einer Reihe von Seiten der gleichen Kategorie ist.

Alternativen

Mit der Google Search Console können Webmaster festlegen, wie Google Parameter einer Webseite behandeln sollen. Auf diese Weise kann der Googlebot dazu bewegt werden, bestimmte URLs einer Seite zu ignorieren.

Weblinks

Kategorie

Brauchst Du noch Hilfe?
Feedback einreichen