Modellerweiterung
Zielsetzung
Ziel ist es weiterhin, mithilfe der Verlinkungsstruktur konkrete Werte für die Relevanz einer Webseite zu berechnen.
Schwierigkeiten im Surfer-Modell erkunden
Wir haben bisher dieses Surfer-Modell betrachtet:
(Vereinfachtes) Surfer-Modell
Wir gehen von folgenden Annahmen aus:
(A1) Zu Beginn verteilen sich alle Surfer (Besucher:innen) gleichmäßig auf die Webseiten.
(A2) Alle Surfer (Besucher:innen) folgen jeweils im gleichen Takt einem Link auf eine weitere Webseite. Wenn auf einer Webseite mehrere Links vorkommen, dann verteilen sich die Besucher:innen gleichmäßig auf die verschiedenen Links.
Aufgabe 1
Im Simulationstool ProSiTo ist jetzt eine etwas veränderte Webseitenwelt dargestellt. Beschreibe, worin sich die neue Webseitenwelt von der vorherigen unterscheidet. Führe die Simulation mehrere Schritte aus. Beschreibe die Schwierigkeit, die hier bei der Ausführung des Surfer-Modells entsteht.
Das Surfer-Modell verbessern
Die oben betrachtete Webseitenwelt hat eine Link-Sackgasse
. Wenn Surfer zur Webseite B gelangen, dann
verbleiben sie auf dieser Webseite. Das entspricht sicher nicht dem Verhalten von Surfern in der Realität.
Auf Links zu klicken ist nicht die einzige Möglichkeit, sich im World Wide Web zu bewegen. Man kann jederzeit, z.B. weil man in einer Link-Sackgasse steckt, die zuletzt besuchte Seite aufrufen, eine beliebige bekannte Webseite (mit ihrer URL) aufrufen oder ganz mit dem Surfen aufhören.
Der zweite der drei Vorschläge, also einfach eine beliebige Seite aufzurufen, ist besonders einfach umsetzbar. Wir ergänzen das Surfer Modell entsprechend:
(Verbessertes) Surfer-Modell
Wir gehen von folgenden Annahmen aus:
(A1) Zu Beginn verteilen sich alle Surfer (Besucher:innen) gleichmäßig auf die Webseiten.
(A2) In jedem Schritt folgt der Großteil der Surfer (z.B. 80%) jeweils im gleichen Takt einem Link auf eine weitere Webseite. Wenn auf einer Webseite mehrere Links vorkommen, dann verteilen sich die Surfer gleichmäßig auf die verschiedenen Links.
(A3) In jedem Schritt springen die übrigen Surfer (hier also 20%) zu einer beliebigen anderen Webseite. Sie teilen sich dabei gleichmäßig auf alle zur Verfügung stehenden Webseiten auf. Wir nennen sie die Gelegenheitsjumper.
Aufgabe 2
(a) Erläutere die Einträge in der folgenden Übersicht.
(b) Ergänze die Einträge in der Übersicht.
(c) Erweitere die Übersicht, indem du auch die Übergänge von den anderen Webseiten aus betrachtest.
Übergang | Rate | Erläuterung |
---|---|---|
$A \longrightarrow B$ | $0.8 \cdot \frac{1}{2} = 0.4$ | Von A aus kann man $2$ Webseiten per Link erreichen. Nur $80 \%$ folgen diesen Links. |
$A \longrightarrow C$ | ||
$A \longrightarrow D$ | ||
$A \longrightarrow A$ | $0.2 \cdot \frac{1}{4} = 0.05$ | $20 \%$ springen auf eine beliebige Seite. Diese teilen sich auf die $4$ Seiten gleichmäßig auf. |
Aufgabe 3
Mit den in Aufgabe 2 bestimmten Übergangsraten kannst du jetzt das verbesserte Modell im Simulationstool simulieren. Ändere das vorgegebene Modell passend ab. Beachte: Der Graph wird jetzt recht komplex. Hier musst du darauf achten, den Überblick nicht zu verlieren.