Du hast teures Geld für Dein SSL-Zertifikat bezahlt, stellst aber fest, dass stattdessen die http-Version Deiner Seite in den Google SERPs rankt? Schuld an diesem Debakel könnte das unscheinbare Duplicate Content Monster sein.
Wir zeigen Dir in wenigen Schritten, wie Du es am schnellsten identifizierst und zur Strecke bringst!
Ähnliche Inhalte, die unter verschiedenen URLs oder auch verschiedenen Domains zu finden sind, werden als Duplicate Content bezeichnet. Duplicate Content erschwert es Suchmaschinen, dem User das beste und relevanteste Suchergebnis zu liefern, weil diese zwischen verschiedenen Versionen entscheiden müssen.
Jeder Webseitenbetreiber sollte es sich deshalb zum Ziel setzen, einzigartigen Content zu produzieren. So kann die Gefahr doppelter Inhalte minimiert werden.
Die häufigsten Ursachen für Duplicate Content sind:
Inhalt in verschiedenen Versionen (Druckversionen, PDF, …)
Automatisiert generierte Dokumente oder Listen
Mangelnde Serverkonfiguration (mit/ohne www)
Seite ist über http und https erreichbar
Seite ist mit und ohne / am Ende aufrufbar
Seite ist über Groß- und Kleinschreibung aufrufbar
Umfangreiche Footer-Inhalte und Sidebars
Unerlaubt kopierte Inhalte (Content Diebstahl)
Vor allem für Onlineshop-Betreiber ist es häufig unvermeidbar, doppelte Inhalte anzuzeigen. Beispielsweise wenn ein Produkt mit der gleichen Beschreibung in mehreren Kategorien gelistet ist, oder in verschiedenen Farben erhältlich ist. - Ein klassischer Fall von Duplicate Content, der sich zum Beispiel im Deichmann Onlineshop wiederfindet:
Abbildung 1: Sneaker bei Deichmann
Die Produktdetailseite der auf Abbildung 1 angezeigten Sneaker sind im Onlineshop sowohl unter der Kategorie "Damenschuhe Sneaker" (URL 1):
www.deichmann.com/DE/de/shop/damen/damen-schuhe/damen-schuhe-sneaker/00000001447234/Sneaker.prod
als auch unter der Kategorie "Damenschuhe" (URL 2)
www.deichmann.com/DE/de/shop/damen/damen-schuhe/00000001447234/Sneaker.prod
erreichbar.
Das Canonical Tag ist ein Meta-Element im -Bereich einer Webseite, mit welchem Du Suchmaschinen auf die Original-URL hinweisen kannst. Suchmaschinen indexieren dann in der Regel nur diese "kanonische URL" und ignorieren die Kopie. Wenn Du nun vermeiden willst, dass eine Seite mit doppelten Inhalten indexiert wird, fügst Du auf dieser das Tag ein und gibst den Link zur Original-URL an.
Im Quellcode macht Deichmann alles richtig: Auf beiden URLS wird mittels Canonical Tag auf URL 2 verwiesen und damit der Suchmaschine angegeben, dass dies die Original-URL ist.
Abbildung 2: Ausschnitt aus dem Quellcode.
Durch Duplicate Content verschenkt man wertvolles Potential. Daher ist es nicht nur wichtig, die Anzahl von Duplikaten zu reduzieren, sondern auch, die notwendigen technischen Voraussetzungen zu schaffen. Der Canonical Tag ist eine schnelle Lösung um Duplicate Content zu verhindern. Er kann und sollte punktuell eingesetzt werden, aber auf keinen Fall sollte er dazu genutzt werden um Duplicate Content großflächig zu lösen. Trotz Canonical Tags müssen Suchmaschinen die entsprechenden URLs analysieren um den Canonical Tag zu sehen. Dieser Prozess kann bei einer großen Anzahl an betroffenen Seiten enorme Crawler Ressourcen verschwenden.
Deshalb sollte immer versucht werden, Duplicate Content gar nicht erst entstehen zu lassen. Google selbst empfiehlt, Inhalte, die unter mehreren URLs erreichbar sind, durch die Webseitenstruktur zu vermeiden. So entsteht Duplicate Content gar nicht erst und das Crawl Budget wird geschont.
Mithilfe von Ryte können interne Duplikate in wenigen Schritten erkannt werden. Dafür ruft man im Modul Website Success den Report "Inhalt", "Duplicate Content" und "Duplikate" auf. Im Report werden alle vom Crawler gefundenen Duplikate der Webseite aufgelistet und wie viele Duplikate die betroffene URL besitzt. Mit einem Klick auf die Lupe in der Spalte "Duplikate Zähler" werden alle Duplicate Content URLs angezeigt.
Abbildung 3: Duplicate Content Report
Die unterschiedlichen Farben stehen für den verschiedenen Optimierungsgrad. Rot bedeutet es gibt noch sehr viel Verbesserungspotential. Gelbe Balken enthalten URLs, die nicht so dringenden Optimierungsbedarf haben und grün bedeutet, dass alles in bester Ordnung ist. Dabei steht die Anzahl Duplikate bei jedem Balken.
Klicke auf die Lupe, um Informationen über alle Duplikate in Verbindung mit dieser Seite zu bekommen.
Abbildung 4: Duplikate optimieren
Nun werden zum existierenden Original alle sechs Duplikate aufgelistet. Da von den Seiten eine sehr hohe Duplikat-Gefahr ausgeht, solltest Du am besten optimieren.
Duplicate Content stellt für Google zwar keinen Grund dar, eine Webseite abzustrafen, allerdings verschenkt man durch Duplikate enorm viel Potential. Mit den oben genannten Tipps schaffst Du es, Duplicate Content zu vermeiden und dieses Potential zu nutzen.
Kennst Du schon die anderen Monster der Webseitenoptimierung:
Das fehlende ALT-Attribute Monster
Das falsche Canonical Tag Monster
Veröffentlicht am May 24, 2017 von Eva Wagner