Random Surfer Model


Das Random Surfer Model liefert eine Berechnungsgrundlage für den PageRank Algorithmus. Das Modell bildet das Verhalten von Internetnutzern ab und liefert eine Wahrscheinlichkeit, mit der ein zufälliger Nutzer eine Seite besucht.

Das Verhalten eines Surfers

Ein beliebiger Surfer bewegt sich im Internet auf zwei Arten. Zum einen gibt er eine URL ein oder nutzt Lesezeichen, um direkt auf eine Seite zu kommen. Zum anderen verfolgt er eine Reihe von aufeinander folgenden Links, bis er schließlich wieder selbst eine neue Seite aufruft. Beim Random Surfer Model wird nun angenommen, dass der Link, der als nächstes angeklickt wird, zufällig ausgewählt wird. Der Inhalt spielt dabei keine Rolle. Darüber hinaus wird angenommen, dass der Klick auf einen weiteren Link keine unendliche Kette ist, sondern der Zufallsnutzer ab einem bestimmten Punkt keine Lust mehr hat diesen Links zu folgen und stattdessen eine neue Website besucht.

Wahrscheinlichkeiten

Die Wahrscheinlichkeit, mit der ein Surfer auf einer bestimmten Seite ist, lässt sich durch den PageRank ableiten. Die Wahrscheinlichkeit, mit der er dann einen bestimmten Link folgt, hängt nur von der Anzahl der vorhandenen Links ab. Somit ist die Wahrscheinlichkeit, mit der ein Surfer eine Seite besucht, die Summe aller Wahrscheinlichkeiten, mit der er von eingehenden Links aus diese Seite besucht. Dadurch werden Seiten, die oft verlinkt sind, auch häufiger besucht und haben einen hohen PageRank. Dieser Wert wird noch um einen Faktor d verringert. Der Grund ist, dass ein Zufalls-Surfer nicht unendlich lange immer wieder einem Link folgt, sondern selbstständig nach gewisser Zeit eine andere Seite aufruft. Je nachdem, wie groß die Wahrscheinlichkeit ist, dass der Surfer die Verfolgung von Links nicht abbricht, hat d einen Wert zwischen 1 und 0. Je näher der Wert an 1 ist, desto eher wird der Link verfolgt. Die Wahrscheinlichkeit, mit der der Surfer eine beliebige neue Seite aufruft, wird mit der Konstante (1-d) verrechnet.

Realität

In der Realität hat ein Nutzer ein Ziel und bewegt sich deshalb nicht zufällig über Links durchs Netz. Er klickt nur auf einen Link, wenn er aufgrund des Kontextes erwartet, dass ihn die aufgerufene Seite seinem Ziel näher bringt. Der Inhalt spielt dabei eine entscheidende Rolle. Somit entspricht das Random Surfer Model nicht mehr unbedingt der heutigen Realität. Ohnehin handelt es sich um ein Modell, das einen zufälligen Nutzer besser beschreiben kann und das dazu beitragen sollte, die Wichtigkeit einer Website zu bemessen. Damals spielte der PageRank für Internetnutzer sowie für SEOs eine wichtige Rolle. Denn er konnte einen Hinweis darauf geben, wie seriös oder wertig eine Internetseite ist. Da dieses Modell jedoch überwiegend auf der Stärke der eingehenden Links beruhte und den Inhalt der Zielseiten außer Acht ließ, ist es heute nicht mehr zeitgemäß. Es war zum Beispiel möglich, dass eine Website mit dürftigem Inhalt einen PageRank von 6 erhielt, nur weil eine andere Website mit PageRank 7 auf sie verlinkte. Diese Tatsache mag auch einer der Gründe sein, warum Google den PageRank mittlerweile nicht mehr aktualisiert und ihn nicht mehr als Gradmesser für die Qualität einer Website heranzieht. Letztlich war der PageRank auch nur für Internetnutzer gedacht. Der Suchmaschinenprovider arbeitet selbst mit einem eigenen Scoring-System, das die Qualität von Websites bemisst.

Bedeutung für die Suchmaschinenoptimierung

Indirekt war das Random Surfer Modell für SEOs lange Zeit wichtig, da es zur Bestimmung des PageRanks einer Website beitrug. Der PageRank wiederum konnte einen Anhaltspunkt dafür geben, wie stark ein Backlink ist. Da heute allerdings viele verschiedene Kriterien darüber entscheiden, welche Qualität ein Backlink hat, ist auch das Random Surfer Modell nicht mehr wirklich relevant für die Suchmaschinenoptimierung. Vielmehr gibt es einen Einblick in die Anfangszeiten des Internets, als Suchmaschinen wie Google nach einer Möglichkeit suchten, die Qualität einer Website zu bestimmen.

Weblinks