Das Zufallssurfermodell
Zielsetzung
Wir nutzen jetzt die Verlinkungsstruktur der Gesamtheit aller Webseiten (kurz: Webseitenwelt), um die Relevanz einzelner Webseiten zu bestimmen. Wir bewerten Webseiten danach, wie viele andere auf sie verlinken und wie stark verlinkt diese anderen Seiten wiederum sind. Links von Webseiten, auf die selbst viele Links verweisen, werden dabei stärker berücksichtigt als Links, die ihren Ursprung auf Webseiten haben, auf die nur wenige oder gar keine Links verweisen.
In der vorliegenden vereinfachten Webseitenwelt ist das gar nicht so leicht zu beantworten. Die mit C markierte Webseite scheint wichtiger zu sein als die mit A markierte Seite. Aber, wie kann man das nachvollziehbar bestimmen? Ziel ist es, die Verlinkungsstruktur von Webseiten jetzt zahlenmäßig zu erfassen. Das führt uns zu folgendem Problem:
Wie kann man mithilfe der Verlinkungsstruktur konkrete Werte für die Relevanz einer Webseite berechnen?
Die Verlinkung mit einem Surfverfahren vermessen
Man benutzt das World Wide Web, indem man von einer Webseite über einen Link zur nächsten „surft“. Wir können dieses Surfverhalten simulieren. Dabei gehen wir davon aus, dass die Nutzerinnen und Nutzer sich einen zufälligen Link zum surfen auswählen. Deshalb spricht man vom Random-Surfer-Modell. Webseiten, auf die viele bedeutende Links verweisen, werden bei der Simulation daran zu erkennen sein, dass dort viele Besucher:innen durch das ziellose Surfen landen.
(Erweitertes) Surfer-Modell
Wir gehen von folgenden Annahmen aus:
(A1) Zu Beginn verteilen sich alle Surfer (Besucher:innen) gleichmäßig auf die Webseiten.
(A2) Alle Surfer (Besucher:innen) folgen jeweils im gleichen Takt einem Link auf eine weitere Webseite. Wenn auf einer Webseite mehrere Links vorkommen, dann verteilen sich die Besucher:innen gleichmäßig auf die verschiedenen Links.
Die folgende Klickstrecke veranschaulicht das Vorgehen:
Aufgabe 1
Begründe: Die Durchführung des Surfverfahrens stellt einen Austauschprozess dar.
Aufgabe 2
Benutze das Simulationstool ProSiTo, um Werte für die Relevanz der Webseiten in der betrachteten Webseitenwelt zu bestimmen. Erstelle zunächst den Übergangsgraphen passend zur oben gezeigten einfachen Webseitenwelt. Simuliere das Verhalten der Surfer. Starte mit einer Situation, in der jeweils $600$ Surfer sich auf den Webseiten befinden.