Duplicate Content Checker
Ein Duplicate Content Checker prüft, ob es vom Content einer Webseite Duplikate auf anderen URLs gibt. Der ursprüngliche Sinn dieser Tools bestand darin, Plagiate von Websites zu finden, um so Urheberrechtsverletzungen aufzuspüren. Duplicate Content Checker lassen sich jedoch auch als SEO-Tool einsetzen, um Webseiten auf Duplicate Content zu prüfen. Die Ergebnisse helfen dabei, um z.B. mit Canonical-Tags oder Noindexgegen doppelte Inhalte vorzugehen. Duplicate Content hindert Webseiten an guten Rankings, da sich URLs u.a. kannibalisieren können.
So funktioniert ein Duplicate Content Checker
Ein Duplicate Content Checker arbeitet nach demselben Prinzip wie Google, um Duplikate im Web zu erkennen. Er greift sich aus einem Text eine beliebige Passage heraus und prüft, ob diese Seiteninhalte gleich oder ähnlich bereits im Web vorhanden sind. Hierfür wird der Google Index herangezogen. Werden Webseiten gefunden, auf denen gleiche oder ähnliche Inhalte vorhanden sind, weist der Duplicate Content Checker darauf hin. Das Ergebnis ist in der Regel eine Prozentangabe. Das Tool zeigt an, zu wie viel Prozent die geprüfte URL ein Duplikat einer anderen ist.
Außerdem wird festgehalten, unter welcher URL das Duplikat zu finden ist, darüber hinaus, welche Passagen ein Duplikat darstellen könnten. Die Websites werden im Regelfall Wort für Wort miteinander verglichen. Bei vielen Softwareprodukten kann der Nutzer selbst mitbestimmen, wie sensibel der Duplicate Content Checker vorgehen soll, ob also ein Duplikat beispielsweise bereits ab vier zusammenhängenden, identischen Wörtern ausgegeben werden soll oder erst nach sechs oder acht.
Funktionen
Duplicate Content Checker unterscheiden sich hinsichtlich ihres Funktionsumfangs. Möglich sind beispielsweise:
- farbliche Markierung gefundener Plagiatsstellen
- wiederholte und automatisierte Prüfung des Contents eigener Websites
- Dokumentation der Ergebnisse der Plagiatsprüfung in dauerhaft vorgehaltenen Berichten
- Prüfung im Hintergrund
- Verfügbarkeit von jedem Rechner mit Internetzugang
- Abrechnung der Plagiatskontrollen über Credits oder ein Guthaben
- Logo des Duplicate Content Checkers für die eigene Website zur Abschreckung von Kopierern
Umfangreiche SEO-Tools enthalten einen Duplicate Content Checker als Teil einer kompletten OnPage-Analyse.
Grenzen
Duplicate Content Checker bringen zwar etwas mehr Sicherheit vor Rechtsverletzungen mit sich. Eine Garantie für Rechtssicherheit können sie allerdings nicht abgeben. Der Google Index umfasst nicht annähernd alle im Internet verfügbaren Internetseiten. Basiert der Prüfmechanismus auf diesem Index, ist davon auszugehen, dass bei der Plagiatskontrolle Websites nicht erfasst werden, die durch Google nicht indexiert wurden. Selbst wenn sich eine Website im Index befindet, sind nicht zwingend auch alle Unterseiten indexiert und dementsprechend auch nicht für die Plagiatskontrolle verfügbar.
Es lässt sich also nicht ausschließen, dass Internetquellen kopiert wurden, obwohl der Duplicate Content Checker keine Duplikate anzeigt. Zudem bietet die Software insofern keine 100-prozentige Sicherheit, da Inhalte durch das Kopieren von Passagen aus Printmedien wie Büchern oder Zeitschriften nicht berücksichtigt werden können. Gleiches gilt für Webcontent, der in passwortgeschützten Bereichen vorzufinden istund nichtt von Google indexiert werden kann.
Ein weiteres Problem ist die Sensibilität der Software. Will der Nutzer auf Nummer sicher gehen, muss er die Sensibilität relativ niedrig einstellen. In diesem Fall würde allerdings bereits eine einfache Phrase mit drei oder vier Worten, die unter Umständen zigtausende Male exakt im Internet auftaucht, zu einer Plagiatsmeldung führen. Ein erhöhter Prüfaufwand wäre die Folge. Senkt man die Sensibilität, um den Aufwand für die Kontrolle zu verringern, können unter Umständen Plagiate durch das Raster fallen, wenn der Inhalt nur leicht abgeändert wurde.
Bedeutung für die Suchmaschinenoptimierung
Für die Suchmaschinenoptimierung ist ein Duplicate Content Checker ein wichtiges Werkzeug, um Rankingnachteile bei Google aufgrund von Duplicate Content zu vermeiden. Doch auch hier kann der Checker an seine Grenzen stoßen. Manche Tools geben z.B. bereits Duplicate Content Probleme aus, wenn lediglich das Layout oder das Menü einer URL mit einer anderen internen URL übereinstimmen. Dieser interne Duplicate Content wäre nicht wirklich schwerwiegend. Im Hinblick auf Duplicate Content aus SEO-Sicht ist vor allem relevant, dass der Checker den Text innerhalb des-Tags prüft. Auch wenn Duplicate Content von Google nicht als negatives Rankingsignal eingestuft wird, <refGoogle Duplicate Content is not a negative ranking factor searchenginejournal.com Abgerufen am 10.10.2021 ist es wichtig doppelte Inhalte zu vermeiden, um Google dabei zu unterstützen, die relevantesten Seiten zu einem bestimmten Suchbegriff zu finden.
Einzelnachweise
Weblinks