Gibberish Scores


Gibberish Scores ist ein 2009 angemeldetes Google-Patent , das es dem Suchmaschinenkonzern erleichtern soll, Unique Content noch genauer von thin content, kopierten Inhalten und Webspam zu unterscheiden. In Deutschland wird auch von „Schwafel-Score“ gesprochen[1].

Worterklärung

Gibberish bedeutet wörtlich übersetzt „Kauderwelsch“ oder „Geschwätz“. Dabei handelt es sich um Teile einer Sprache, die keine bedeutungstragenden Einheiten darstellen. In der Praxis wird Gibberish z.B. bei Stimmübungen vor Konzerten verwendet oder im Theater, wenn eine sprechende Menschenmenge simuliert werden soll. Die Gibberish Scores sollen folglich inhaltslosen Content erkennen.

Hintergrund

Spätestens seit der Umsetzung der einflussreichen Panda und Penguin Updates hat Google seine Bemühungen massiv verstärkt, Webspam in seinen Suchergebnislisten zu bekämpfen. Mit dem sogenannten Hummingbird Updates im Herbst 2013 hat der Suchmaschinenkonzern nochmals unterstrichen, wie genau er Suchanfragen auswerten kann, um passende Suchergebnisse auszuliefern. Die als Patent angemeldeten Gibberish Scores sollen dabei helfen, vermehrt „gute“ Inhalte von „schlechten“ ohne Mehrwert für den User zu unterscheiden.

Funktion

Der Gibberish Score eines Dokuments wird laut Patentbeschreibung anhand von zwei verschiedenen Ansätzen ermittelt:

  • language model score: hierbei findet eine Sprachbewertung des Contents statt. Dabei wird der Quelltext zunächst um die HTML-Elemente bereinigt und danach in kleine Spracheinheiten zerlegt. Diese Texteinheiten werden dann mit den Texteinheiten anderer Inhalte verglichen, die zu einer bestimmten Suchanfrage innerhalb einer spezifischen Zeitdauer gespeichert werden. Dabei ermittelt ein Algorithmus, wie wahrscheinlich bestimmte Wortfolgen innerhalb eines Textes sind. Der sogenannte „language model score“ ist eine Zusammenfassung dieser Wahrscheinlichkeiten.
  • query stuffing score: mit Hilfe dieser Methode ermitteln Algorithmen, wie relevant ein Text zu einer bestimmten Suchanfrage ist und legen zugleich offen, ob die Relevanz durch Keyword Stuffing, also durch vermehrte Verwendung von zum Beispiel Money-Keywords auf unnatürliche Weise erzielt wurde. Das Besondere an dieser Methode besteht jedoch darin, dass nicht nur einzelne Schlüsselbegriffe herangezogen werden, sondern auch ganze Wortfolgen oder Phrasen.

Die Auswertung beider hier beschriebenen „Scores“ ergibt den Gibberish Score eines Web-Dokuments. Die Konsequenz aus zu vielen Gibberish-Elementen in einem Text besteht in einer Abwertung des Rankings der entsprechenden Webseite zu einem bestimmten Suchterm.

GibberishScore.png

Nutzen für die Suchmaschinenoptimierung

Die Mitteilung, dass Google die Gibberish Scores als Patent angemeldet hat, passt in die vor allem 2013 stark geführte Debatte, um die sogenannte WDF*IDF-Optimierung. Bei dem Prinzip WDF*IDF werden Texte nicht mehr nur anhand der Keyworddichte erstellt, sondern es wird auch die Bedeutung der einzelnen Terme in Bezug zu deren Verwendung auf anderen - für das zu optimierende Keyword relevanten - Webseiten berücksichtigt.

Bei der Suchmaschinenoptimierung werden demnach die Aufgaben der OnPage Optimierung, insbesondere bei der Content-Erstellung immer komplexer. Die Content Generierung kann leicht ausgelagert werden, indem dafür ein Unternehmen wie beispielsweise Demand Media beauftragt wird. Der Gibberish Score kann der Kontrolle dienen. Massiv keywordoptimierter Content, sowie leicht umgeschriebene Inhalte und auch maschinell erstellte Texte werden durch den Einsatz des Gibberish-Scores noch leichter als solche identifiziert. Das Google-Patent ist somit ein weiterer Schritt zu hochwertigen Webseiten, die für den Besucher erstellt werden und nicht für die Suchmaschine.

Einzelnachweise

Weblinks