Verlinkung als Lösungsansatz
Zielsetzung
Beim Ranking-Problem geht es um folgende Fragestellung: Wie lässt sich für eine Webseite die Relevanz in Bezug auf den Suchbegriff bestimmen. Ist das Relevanz-Problem gelöst, müssen die Ergebnisse nach dieser Relevanz sortiert werden. Hier geht es darum, einen Lösungsansatz zur Bestimmung der Relevanz von Webseiten zu entwickeln.
Die Relevanz von Webseiten bestimmen
Wie können/sollen die Suchergebnisse (Webseiten zu einem Suchbegriff) sinnvoll der Reihe nach angeordnet werden? Hierzu braucht man geeignete Kriterien.
Aufgabe 1
(a) Welche Kriterien könnte man benutzen, um die Relevanz von Webseiten zu bestimmen?
(b) Wenn du auf den Button drückst, werden einige Lösungsansätze eingeblendet. Bewerte diese Ansätze – auch im Vergleich zu deinen eigenen Überlegungen.
Die Verlinkung von Webseiten verwenden
Um von einer Webseite zu einer anderen zu gelangen, klickt man auf einen Verweis. Man nennt ihn Hyperlink oder kurz Link.
Die folgende Klickstrecke [1] verdeutlicht die Situation:

- Verschiedene Webseiten sind miteinander verlinkt.
- Zur Vereinfachung ignorieren wir den Inhalt und konzentrieren uns auf die Links.
- Die genaue Position der Links auf der Seite ist auch nicht relevant. Es bleibt die Struktur als Graph.
Klicke auf die einzelnen Schritte zur Veranschaulichung.
Wir wollen die Verlinkungsstruktur nutzen, um das Relevanz-Problem zu lösen. Dabei werden wir das Problem ganz analog zu den Entwicklern der Suchmaschine Google lösen. Wir konzentrieren uns dabei auf kleine Webseiten-Welten, um die Grundprinzipien zu verdeutlichen.
Aufgabe 2
(a) Lies dir die folgende Erklärung zum PageRank-Verfahren durch und fasse den Grundgedanken in eigenen Worten zusammen.
(b) Erläutere anhand der folgenden Grafik, wie sich die Bedeutung von Webseiten aus der Verlinkung ergibt.
Aufgabe 3
Wir gehen nun näher auf den zweiten Satz des Patents ein: Erkläre anhand der folgenden Klickstrecke, dass es nicht ausreicht, die Anzahl Links auf eine Webseite zu zählen.
- Ansicht nur mit Links.
- Ansicht mit Namen der Webseiten.
- Ansicht mit (angedeuteten) Werten für die Webseiten C-F.
Klicke auf die einzelnen Schritte zur Veranschaulichung.
Aufgabe 4
Betrachte die folgende Webseitenwelt. Welche der dort gezeigten Webseiten würdest du (nach dem beschriebenen Bewertungsansatz) eine größere / geringere Relevanz einräumen?
Quellen
- [1]: Verlinkung von Webseiten - Urheber: Andreariverac - Lizenz: Creative Commons BY-SA 3.0
- [2]: Patent US6285999B1: Method for node ranking in a linked database - Urheber: Leland Standford Junior University -
- [3]: Pagerank - Urheber: Felipe Micaroni Lalli - Lizenz: Creative Commons BY-SA 2.5