Duplicate Content Checker


Ein Duplicate Content Checker (deutsch: Überprüfung auf doppelte Inhalte) dient dazu, um Duplikate einer URL im Internet aufzustöbern. Auf der Basis der Analyseergebnisse können Webmaster und SEOs gezielt mit Canonical-Tags oder anderen Maßnahmen gegen Duplicate Content vorgehen, der ein gutes Ranking einer Webseite verhindert. In rechtlicher Hinsicht kann ein DC-Checker dabei helfen, widerrechtlich kopierte Inhalte ausfindig zu machen.

Funktionsprinzip eines Duplicate Content Checkers[Bearbeiten]

Ein Duplicate Content Checker arbeitet nach demselben Prinzip wie Google, um Duplikate im Web zu erkennen. Er greift sich aus einem Text eine beliebige Passage heraus und prüft, ob diese Seiteninhalte gleich oder ähnlich bereits im Web vorhanden ist. Hierfür wird der Google Index herangezogen. Werden Webseiten gefunden, auf denen gleiche oder ähnliche Inhalte vorhanden sind, weistder Duplicate Content Checker darauf hin.

Zum einen wird festgehalten, unter welcher URL das Duplikat zu finden ist, zum anderen aber auch, welche Passagen ein Duplikat darstellen könnten. Die Websites werden im Regelfall Wort für Wort miteinander verglichen. Bei vielen Softwareprodukten kann der Nutzer selbst mitbestimmen, wie sensibel der Duplicate Content Checker vorgehen soll, ob also ein Duplikat beispielsweise bereits ab vier zusammenhängenden, identischen Wörtern ausgegeben werden soll oder erst nach sechs oder acht.

600x400-DuplicateContentChecker-01.png

Funktionen[Bearbeiten]

Duplicate Content Checker unterscheiden sich hinsichtlich ihres Funktionsumfangs. Möglich sind beispielsweise:

  • farbliche Markierung gefundener Plagiatsstellen
  • wiederholte und automatisierte Prüfung des Contents eigener Websites
  • Dokumentation der Ergebnisse der Plagiatsprüfung in dauerhaft vorgehaltenen Berichten
  • Prüfung im Hintergrund
  • Verfügbarkeit von jedem Rechner mit Internetzugang
  • Abrechnung der Plagiatskontrollen über Credits oder ein Guthaben
  • Logo des Duplicate Content Checkers für die eigene Website zur Abschreckung von Kopierern

Umfangreiche SEO-Tools enthalten einen Duplicate Content Checker als Teil einer kompletten OnPage-Analyse.

Zielgruppen[Bearbeiten]

Es gibt mehrere Personengruppen, die von einem Duplicate Content Checker profitieren. Webmaster möchten dafür sorgen, dass ihre hochwertigen Inhalte nicht von anderen Menschen kopiert und als deren eigene Arbeit ausgegeben werden. Wer hingegen Content einkauft, möchte sicherstellen, dass der Dienstleister seine Arbeit gut gemacht hat und ihn nicht durch etwaige Plagiate in die Gefahr eines Rechtsstreits mit dem eigentlichen Urheber bringt.

Jeder Website-Betreiber sollte stets beweisen können, dass seine Inhalte zum Zeitpunkt der Veröffentlichung unique waren. Durch die dauerhafte Speicherung von Prüfprotokollen lässt sich dies problemlos nachweisen – auch der Zeitpunkt der Veröffentlichung. Dadurch sorgt man bereits heute mit Beweisen für etwaige Urheberrechtsstreitigkeiten zu einem späteren Zeitpunkt vor.

Grundsätzlich sollte es für jeden SEO und Webseitenbetreiber das Ziel sein, einzigartige Inhalte zu erstellen. Mit Hilfe eines Duplicate Content Checkers können die eigenen Inhalte in Bezug auf ihre Einzigartigkeit sinnvoll geprüft werden. Anschließend haben Texter die Möglichkeit, mit weiteren Tools wie einem WDF*IDF-Tool die Inhalte zu optimieren.

Grenzen[Bearbeiten]

Duplicate Content Checker bringen zwar etwas mehr Sicherheit vor Rechtsverletzungen mit sich. Eine Garantie für Rechtssicherheit können sie allerdings nicht abgeben. Der Google Index umfasst nicht annähernd alle im Internet verfügbaren Internetseiten. Basiert der Prüfmechanismus auf diesem Index, ist davon auszugehen, dass bei der Plagiatskontrolle Websites nicht erfasst werden, die durch Google nicht indexiert wurden. Selbst wenn sich eine Website im Index befindet, sind nicht zwingend auch alle Unterseiten indexiert und dementsprechend auch nicht für die Plagiatskontrolle verfügbar.

Es lässt sich also nicht ausschließen, dass Internetquellen kopiert wurden, obwohl der Duplicate Content Checker keine Duplikate anzeigt. Zudem bietet die Software insofern keine 100-prozentige Sicherheit, da Inhalte durch das Kopieren von Passagen aus Printmedien wie Büchern oder Zeitschriften nicht berücksichtigt werden können. Gleiches gilt für Webcontent, der in passwortgeschützten Bereichen vorzufinden istund nichtt von Google indexiert werden kann.

Ein weiteres Problem ist die Sensibilität der Software. Will der Nutzer auf Nummer sicher gehen, muss er die Sensibilität relativ niedrig einstellen. In diesem Fall würde allerdings bereits eine einfache Phrase mit drei oder vier Worten, die unter Umständen zigtausende Male exakt im Internet auftaucht, zu einer Plagiatsmeldung führen. Ein erhöhter Prüfaufwand wäre die Folge. Senkt man die Sensibilität, um den Aufwand für die Kontrolle zu verringern, können unter Umständen Plagiate durch das Raster fallen, wenn der Inhalt nur leicht abgeändert wurde.

Bedeutung für die Suchmaschinenoptimierung[Bearbeiten]

Für die Suchmaschinenoptimierung ist ein Duplicate Content Checker ein wichtiges Werkzeug, um Rankingnachteile bei Google aufgrund von Duplicate Content zu vermeiden.

Weblinks[Bearbeiten]