Canonical Tag

Für die Indexierung von Website-Inhalten sollte jeder Content nur unter einer einzigen URL erreichbar sein. Möchte man den Inhalt auch auf anderen Seiten bereitstellen, muss die zweite URL auf die ursprüngliche Ressource verweisen. Andernfalls zählen diese gleichen Inhalte als Duplicate Content. Das kann dazu fürhen, dass mindestens eine der beiden Webseiten von Google abgestraft wird - also vom Index genommen wird. Um das zu vermeiden, greift man auf sogenannte kanonische URLs zurück. Diese erhält man durch die Ergänzung um ein Canonical Tag im Head-Bereich des HTML-Codes der Seite.

Hintergrund

Mithilfe von im Quellcode einer Website implementierten Canonical Tags können Webseitenbetreiber Suchmaschinen mitteilen, welche der Seiten mit identischen oder fast identischen Inhalten als Standardressource zu behandeln ist. Wird eine kanonische URL korrekt ausgezeichnet, wird nur die Originalquelle zur Indexierung von der Suchmaschine herangezogen. Mit einem Canonical Tag kann vermieden werden, dass der gleiche Content auf unterschiedlichen Seiten von Google als Duplicate Content erkannt wird. Webmaster nehmen so auch Einfluss auf die Linkpopularität bestimmter Seiten mit identischen Inhalten und bündeln gleichzeitig die Reputation dieser Seiten auf einer URL.

Anwendungsfälle

Angewendet wird das Canonical Tag immer dann, wenn Inhalte mehrfach verwendet werden oder eine eindeutige URL technisch nicht möglich ist^[1]

Die Startseite ist über verschiedene URLs oder Protokolle erreichbar (beispielsweise www.domain.de, domain.de, www.domain.de/index.html, http://domain.de, https://domain.de usw.).
Seiten sind mit und ohne Trailing Slashes ("/") oder mit Klein- und Großschreibung aufrufbar ([[Case_sensitivity]Case Sensitivity]]).
Der Server achtet durch Rewriting der URL nur auf eine ID, lässt also Variationen der Adresse zu.
Es werden IDs (z. B. Session-ID oder Produktfilter) verwendet, die den Inhalt nicht ändern.
Der Inhalt wird in verschiedenen Ansichten dargeboten (z. B. in einer Druckversion, als PDF usw.).
Inhalte werden auf anderen, externen Websites zusätzlich veröffentlicht.

Arten, ein Canonical Tag zu implementieren

Es gibt grundsätzlich zwei Möglichkeiten, eine kanonische URL anzugeben^[2]: Wahlweise im Head-Element des Quellcodes, wo es die Meta-Angaben eines Dokumentes ergänzt. Oder in den HTTP-Antwort-Header einer Seite.^[3] Die Art der Implementierung orientiert sich in der Regel an der Art der zu markierenden Dokumente. Verweist das Canonical Tag auf HTML-Dokumente, sollte es im Quellcode implementiert sein. Die Syntax sieht dann folgendermaßen aus:

<link rel="canonical" href="https://www.beispiel.de/beispielseite.htm"/>

Verweist es auf einen anderen Dokumententyp, der von Google unterstützt wird, zum Beispiel auf ein PDF, sollte es im Header platziert werden.

Link: <https://www.beispiel.de/beispielseite.pdf>; rel="canonical"

Anwendungsfälle

Wird das Canonical Tag falsch eingesetzt, können Webseiten von Google komplett ignoriert werden.^[4] Der Webseitenbetreiber sollte sich zunächst fragen, ob es sich wirklich um identische oder nahezu identische Inhalte handelt. Nur dann sind Canonical Tags sinnvoll.===Canonical Tags und hreflang=== Wenn eine Webseite mit hreflang arbeitet, sollten die jeweiligen URLs entweder per Canonical Tag auf sich selbst verweisen oder überhaupt keine Canonicals verwendet werden.^[5] Werden beide Tags gemeinsam genutzt, erhält Google widersprüchliche Signale. Während das hreflang-Tag zeigt, dass eine andere Sprachversion vorhanden ist, würde der Canonical-Tag diese Version zur Original-URL machen.^[6]===Canonical Tags und noindex=== Mit dem noindex-Tag können Webmaster Google mitteilen, dass eine URL nicht indexiert werden solle. Verweist nun ein Canonical-Tag auf diese Seite, erhält Google unklare Signale. Es soll eine Seite als kanonisch gewählt werden, die aber nicht indexiert werden darf. Webmaster sollten sich deshalb entscheiden, ob sie die noindex- oder Canonical-Variante wählen.

Canonical Tags und Paginierung

Bei einer Paginierung von Webseiten mit rel="next" und rel="prev" sollte

entweder jede Unterseite per Canonical auf sich selbst
oder auf eine “View-All-Seite” verweisen, auf der alle Produkte in einer Übersicht dargestellt werden.

Besser wäre, in Verbindung mit rel="next" / rel="prev" überhaupt keine Canonical Tags zu verwenden und stattdessen das Meta-Element der paginierten Seiten ab der zweiten mit einem Robots-Tag zu versehen und die Unterseiten so mit von der Indexierung auszuschließen. Tatsächlich stellt die Implementierung von Canoncial Tags in paginierten Seiten eine der häufigsten Fehler dar.

Häufige Fehler bei Canonicals

Durch rel-next, rel-prev paginierte / nummerierte Seiten werden mit Canonical Tags versehen und verweisen auf die Haupt-URL.^[7]
Die Zielseite ist nicht erreichbar.^[8]
Kanonische URLs werden mit den Attributen "noindex", "disallow" oder "nofollow" kombiniert.^[9]
Das Canonical Tag wird im Body-Bereich eines Dokumentes implementiert und / oder wird in den Meta-Angaben mehrmals verwendet.^[10]
Es wird eine relative anstelle einer absoluten Pfadangabe als kanonisches Linkziel angegeben.^[11]
Das Canonical Tag verweist nicht vom HTTP-Protokoll zur HTTPS-Seite, sondern umgekehrt.^[12]
Zielseiten eines Canonical Links verweisen auf andere Canonicals, wodurch sich eine sogenannte Canonical-Kette ergibt.^[13]

Alternativ können Webmaster in der Google Search Console festlegen, wie Google Parameter einer Webseite behandeln sollen. Auf diese Weise kann der Googlebot dazu bewegt werden, bestimmte URLs einer Seite zu ignorieren.

Einzelnachweise

↑ Monster der Webseitenoptimierung - Das falsche Canonical Tag Monster Ryte Magazine. Abgerufen am 25.12.2021
↑ So setzt du einen Canonical Tag Sistrix. Abgerufen am 25.12.2021
↑ Canonical Tag Praxis Guide Ryte Magazine. Abgerufen am 25.12.2021
↑ Deutsches Google Webmaster Hangout Transkript, 08.09.2015 SEO Portal. Abgerufen am 25.12.2021
↑ hreflang muss immer auf Canonical URL zeigen SEOsüdwest. Abgerufen am 25.12.2021
↑ International SEO Guide - Optimierung mit hreflang und Co. Ryte Magazine. Abgerufen am 25.12.2021
↑ Canonical Tag vs. Paginierung morefire. Abgerufen am 25.12.2021
↑ 5 häufige Fehler bei der Verwendung von rel=canonical-Tags Google Search Central. Abgerufen am 25.12.2021
↑ Canonical Tag und Noindex Tag niemals zusammen nutzen Technickr. Abgerufen am 25.12.2021
↑ Canonical Tag searchmetrics. Abgerufen am 25.12.2021
↑ Für Canoncial am besten absolute URLs verwenden SEOsüdwest. Abgerufen am 25.12.2021
↑ Duplizierte URLs zusammenfassen Google Search Central. Abgerufen am 25.12.2021
↑ Canonical Tags: Was ist das und wofür braucht man es? lunapark. Abgerufen am 25.12.2021

Weblinks

[1] Monster der Webseitenoptimierung - Das falsche Canonical Tag Monster Ryte Magazine. Abgerufen am 25.12.2021

[2] So setzt du einen Canonical Tag Sistrix. Abgerufen am 25.12.2021

[3] Canonical Tag Praxis Guide Ryte Magazine. Abgerufen am 25.12.2021

[4] Deutsches Google Webmaster Hangout Transkript, 08.09.2015 SEO Portal. Abgerufen am 25.12.2021

[5] reflang muss immer auf Canonical URL zeigen SEOsüdwest. Abgerufen am 25.12.2021

[6] International SEO Guide - Optimierung mit hreflang und Co. Ryte Magazine. Abgerufen am 25.12.2021

[7] Canonical Tag vs. Paginierung morefire. Abgerufen am 25.12.2021

[8] 5 häufige Fehler bei der Verwendung von rel=canonical-Tags Google Search Central. Abgerufen am 25.12.2021

[9] Canonical Tag und Noindex Tag niemals zusammen nutzen Technickr. Abgerufen am 25.12.2021

[10] Canonical Tag searchmetrics. Abgerufen am 25.12.2021

[11] Für Canoncial am besten absolute URLs verwenden SEOsüdwest. Abgerufen am 25.12.2021

[12] Duplizierte URLs zusammenfassen Google Search Central. Abgerufen am 25.12.2021

[13] Canonical Tags: Was ist das und wofür braucht man es? lunapark. Abgerufen am 25.12.2021

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]