« Zurück zum Magazine

Monster der Webseitenoptimierung – Das Duplicate Content Monster

Du hast teures Geld für Dein SSL-Zertifikat bezahlt, stellst aber fest, dass stattdessen die http-Version Deiner Seite in den Google SERPs rankt? Schuld an diesem Debakel könnte das unscheinbare Duplicate Content Monster sein.

Wir zeigen Dir in wenigen Schritten, wie Du es am schnellsten identifizierst und zur Strecke bringst!

Magazin-Monster-duplicateContent

Ähnliche Inhalte, die unter verschiedenen URLs oder auch verschiedenen Domains zu finden sind, werden als Duplicate Content bezeichnet. Duplicate Content erschwert es Suchmaschinen, dem User das beste und relevanteste Suchergebnis zu liefern, weil diese zwischen verschiedenen Versionen entscheiden müssen.

Jeder Webseitenbetreiber sollte es sich deshalb zum Ziel setzen, einzigartigen Content zu produzieren. So kann die Gefahr doppelter Inhalte minimiert werden.

Die häufigsten Ursachen für Duplicate Content sind:

  • Inhalt in verschiedenen Versionen (Druckversionen, PDF, …)

  • Automatisiert generierte Dokumente oder Listen

  • Mangelnde Serverkonfiguration (mit/ohne www)

  • Seite ist über http und https erreichbar

  • Seite ist mit und ohne / am Ende aufrufbar

  • Seite ist über Groß- und Kleinschreibung aufrufbar

  • Umfangreiche Footer-Inhalte und Sidebars

  • Unerlaubt kopierte Inhalte (Content Diebstahl)

Unser monster-vernichtendes Praxis-Beispiel

Vor allem für Onlineshop-Betreiber ist es häufig unvermeidbar, doppelte Inhalte anzuzeigen. Beispielsweise wenn ein Produkt mit der gleichen Beschreibung in mehreren Kategorien gelistet ist, oder in verschiedenen Farben erhältlich ist. - Ein klassischer Fall von Duplicate Content, der sich zum Beispiel im Deichmann Onlineshop wiederfindet:

Abbildung 1: Sneaker bei Deichmann

Die Produktdetailseite der auf Abbildung 1 angezeigten Sneaker sind im Onlineshop sowohl unter der Kategorie "Damenschuhe Sneaker" (URL 1):

www.deichmann.com/DE/de/shop/damen/damen-schuhe/damen-schuhe-sneaker/00000001447234/Sneaker.prod

als auch unter der Kategorie "Damenschuhe" (URL 2)

www.deichmann.com/DE/de/shop/damen/damen-schuhe/00000001447234/Sneaker.prod

erreichbar.

Lösung: Das Canonical Tag

Das Canonical Tag ist ein Meta-Element im -Bereich einer Webseite, mit welchem Du Suchmaschinen auf die Original-URL hinweisen kannst. Suchmaschinen indexieren dann in der Regel nur diese "kanonische URL" und ignorieren die Kopie. Wenn Du nun vermeiden willst, dass eine Seite mit doppelten Inhalten indexiert wird, fügst Du auf dieser das Tag ein und gibst den Link zur Original-URL an.

Im Quellcode macht Deichmann alles richtig: Auf beiden URLS wird mittels Canonical Tag auf URL 2 verwiesen und damit der Suchmaschine angegeben, dass dies die Original-URL ist.

Abbildung 2: Ausschnitt aus dem Quellcode.

Durch Duplicate Content verschenkt man wertvolles Potential. Daher ist es nicht nur wichtig, die Anzahl von Duplikaten zu reduzieren, sondern auch, die notwendigen technischen Voraussetzungen zu schaffen. Der Canonical Tag ist eine schnelle Lösung um Duplicate Content zu verhindern. Er kann und sollte punktuell eingesetzt werden, aber auf keinen Fall sollte er dazu genutzt werden um Duplicate Content großflächig zu lösen. Trotz Canonical Tags müssen Suchmaschinen die entsprechenden URLs analysieren um den Canonical Tag zu sehen. Dieser Prozess kann bei einer großen Anzahl an betroffenen Seiten enorme Crawler Ressourcen verschwenden.

Deshalb sollte immer versucht werden, Duplicate Content gar nicht erst entstehen zu lassen. Google selbst empfiehlt, Inhalte, die unter mehreren URLs erreichbar sind, durch die Webseitenstruktur zu vermeiden. So entsteht Duplicate Content gar nicht erst und das Crawl Budget wird geschont.

Duplicate Content identifizieren mit Ryte

Mithilfe von Ryte können interne Duplikate in wenigen Schritten erkannt werden. Dafür ruft man im Modul Website Success den Report "Inhalt", "Duplicate Content" und "Duplikate" auf. Im Report werden alle vom Crawler gefundenen Duplikate der Webseite aufgelistet und wie viele Duplikate die betroffene URL besitzt. Mit einem Klick auf die Lupe in der Spalte "Duplikate Zähler" werden alle Duplicate Content URLs angezeigt.

duplikate

Abbildung 3: Duplicate Content Report

Die unterschiedlichen Farben stehen für den verschiedenen Optimierungsgrad. Rot bedeutet es gibt noch sehr viel Verbesserungspotential. Gelbe Balken enthalten URLs, die nicht so dringenden Optimierungsbedarf haben und grün bedeutet, dass alles in bester Ordnung ist. Dabei steht die Anzahl Duplikate bei jedem Balken.

Klicke auf die Lupe, um Informationen über alle Duplikate in Verbindung mit dieser Seite zu bekommen.

dc-inspektor

Abbildung 4: Duplikate optimieren

Nun werden zum existierenden Original alle sechs Duplikate aufgelistet. Da von den Seiten eine sehr hohe Duplikat-Gefahr ausgeht, solltest Du am besten optimieren.

Fazit

Duplicate Content stellt für Google zwar keinen Grund dar, eine Webseite abzustrafen, allerdings verschenkt man durch Duplikate enorm viel Potential. Mit den oben genannten Tipps schaffst Du es, Duplicate Content zu vermeiden und dieses Potential zu nutzen.

Kennst Du schon die anderen Monster der Webseitenoptimierung:

Das Weiterleitungs-Monster

Das fehlende ALT-Attribute Monster

Das Thin Content Monster

Das 404 Monster

Das verwaiste Seiten Monster

Das falsche Canonical Tag Monster

Das hreflang-Monster

Das Monster der langsamen Ladezeit

Das Monster der internen Verlinkung

Bekämpfe jetzt das Duplicate Content Monster mit Ryte!

Veröffentlicht am May 24, 2017 von Eva Wagner