Der PageRank-Algorithmus – Alles zum Google-Algorithmus

Grundlagen

Der PageRank-Algorithmus ist das bekannteste Verfahren zur Bewertung/Gewichtung von Webseiten. Der Algorithmus wurde Ende der 90er Jahre von Sergey Brin und Lawrence Page an der Stanford Universität entwickelt und publiziert [S. Brin, L. Page, 'The PageRank Citation Ranking: Bringing Order to the Web'; 'The Anatomy of Large-Scale Hypertextual Web Search Engine']. Die Innovation bestand darin, einen Bewertungsfaktor nur aufgrund der Verlinkungsstruktur zu generieren. Der Inhalt einer Seite spielt beim PageRank ebenso wenig eine Rolle wie die URL. Außerdem wird nicht zwischen internen und externen Links unterschieden. Der PageRank-Wert spiegelt die "Wichtigkeit einer Webseite" wieder. Beim PageRank handelt es sich um einen "Off-Page-Faktor", d.h. er ist vom Inhalt der Seite unabhängig. Das Ranking (die Platzierung der Webseiten) wird aus der Kombination von On-Page- und Off-Page-Faktoren ermittelt. Zu den ersteren zählen z.B. der Titel, die Beschreibung, Überschriften und normale Texte; zu den letzteren gehört neben dem PageRank der verweisende Linktext. Der PageRank-Algorithmus ist somit nur ein Teil eines Ranking-Algorithmusses.

Ein modifizierter PageRank-Algorithmus wurde bei Google eingesetzt. In der Anfangszeit war Googles Ranking-Algorithmus anderen Algorithmen überlegen, da er schwieriger zu manipulieren war und somit bessere Suchergebnisse lieferte. Die Veröffentlichung des PageRank-Verfahrens sowie die Anzeige des PageRank in der Google-Toolbar führten jedoch zu verstärkter Manipulation (z.B. durch den Kauf und Verkauf von PageRank). Zudem entwickelten andere Suchmaschinen vergleichbare Algorithmen, d.h. Verfahren, die die Struktur der Verlinkung und den verweisenden Ankertext als wichtiges Mittel zur Bewertung benutzen. Dies führte dazu, dass die Qualität der Ergebnislisten der besten Suchmaschinen sich inzwischen angeglichen hat.

Suchmaschinenoptimierung

Eine Optimierung des PageRank-Wertes allein ist verhältnismäßig einfach. Dies liegt daran, dass das (Original-) Verfahren komplett bekannt ist. Allgemein gilt, dass die gesamte Internetpräsenz keine ausgehenden Links bzw. keine Links die PageRank transferieren haben sollte. Die Struktur der Verlinkung hängt davon ab, ob der PageRank lediglich für eine Seite optimiert werden soll oder für eine größere Anzahl von Seiten. Im ersten Fall würde die Webseite stark hierarchisch aufgebaut sein, wobei alle internen Seiten zu der Startseite verlinken. Alle externen Seiten würden ebenfalls auf die (zu optimierende) Startseite verlinken. Die Anzahl der eigenen Seiten würde möglichst groß gewählt werden. Im zweiten Fall würde eine relativ flache Struktur gewählt werden. Eingehende Links würden in diesem Fall auf die verschiedenen Seiten verteilt werden.

Eine Optimierung des PageRanks muss allerdings nicht automatisch zu einer Verbesserung des Rankings (d.h. der Position in den Suchergebnissen) führen. PageRank ist nur ein Kriterium innerhalb des Ranking-Algorithmusses. Ausgehende Links, die den PageRank gering reduzieren können oft problemlos durch andere, positive Effekte kompensiert werden. Außerdem können ausgehende Links dazu führen, dass die entsprechenden Seiten auf die eigene zurückverlinken und der PageRank-Profit größer als der Verlust ist.

Schließlich hat Google auch Veränderungen am Original-PageRank-Algorithmus  vorgenommen, die sich auch die optimale Verlinkung verändert haben.

Die Mathematik

Lineares Gleichungssystem

Die Berechnung des PageRanks ist die Lösung eines linearen Gleichungssystems der Form

 M * PR = ( 1 - d )

wobei 0 < d < 1 ein Dämpfungsfaktor, PR ein N-dimensionaler Vektor und M eine N x N-Matrix ist. N ist die Anzahl der Seiten des betrachteten Systems. Die i-te Komponente des Vektors PR, d.h. PRi, ist der PageRank der i-ten Seite. Die Matrix  M setzt sich wie folgt zusammen

 M = 1 – d T

wobei T die Übergangsmatrix beschreibt. Die Komponenten von T lassen ergeben sich aus der Anzahl der ausgehenden Links:

 Tij= 1 / Cj (falls Seite j zu Seite i linkt)
 Tij= 0 (sonst)

Cj ist die Anzahl von Links auf Seite j. Die Lösung des linearen Gleichungssystems ist

 PR = M-1 * ( 1 – d )

Die Berechnung der inversen Matrix M-1 kann prinzipiell analytisch erfolgen. Für 0 < d <1 hat M keine Eigenwerte die Null sind, so dass die letzte Gleichung eine eindeutige Lösung hat. Für größere Dimensionen N ist es allerdings sinnvoll (d.h. weniger zeitaufwändig) die Berechnung numerisch vorzunehmen. Dies geschieht mittels eines Iterationsschemas. Das einfachste Verfahren ist die Jacobi-Iteration

 PR{k+1} = ( 1 –d ) + d T * PR{k}

PR{k} bezeichnet den Wert des PageRank-Vektors in der k-ten Iteration. Als Startwert kann z.B. PR{0} = 1 genommen werden. Die Konvergenz des Verfahrens ist garantiert, da der größte Eigenwert von d T kleiner als 1 ist. Der Dämpfungsfaktor d bestimmt den Anteil des Pageranks, der weiter transferiert wird. Für d=1 wird alles weitergeleitet, für kleinere d erfolgt eine Dämpfung. Für Werte von d nahe 1 treten allerdings Konvergenzprobleme auf. Die Anzahl der Iterationen, bis das Ergebnis stabil ist, nimmt zu. Für eine reale Berechnung des PageRanks wären ca. 100 Iterationen nötig. Natürlich ist die genaue Anzahl auch von der Verlinkungsstruktur und der gewünschten Genauigkeit abhängig. Die Anzahl der Iterationen kann reduziert werden, wenn als Ausgangswert z.B. das Endergebnis der letzen Iterationen genommen wird (vorausgesetzt die Verlinkungsstruktur hat sich in der Zwischenzeit nicht grundsätzlich geändert).

Schreibt man die Gleichung in Komponenten und lässt die Bezeichnung für die Nummer der Iteration weg, so ergibt sich

 PRi= ( 1 – d ) + d ( PRX1 / CX1 + ...
                          + PRXn / CXn )

Die letzte Gleichung wird oftmals auch als der PageRank-Algorithmus bezeichnet. Genau genommen ist allerdings nur ein Iterationsschema zur numerischen Lösung der obigen Matrixinversion. Die Jacobi-Iteration ist einfach, allerdings nicht das schnellste Verfahren. So konvergiert beispielsweise das folgende Iterationsschema (minimal residue)

 PR{k+1} = PR{k} + R{k} ( ∑ Ri Mij Rj) / 
                        ( ∑ Min Rn Mij Rj) 

mit

 R{k+1} = R{k} – M * R{k} ( ∑ Ri Mij Rj) / 
                          ( ∑  Min Rn Mij Rj)

i.A. schneller. Daneben gibt eine Anzahl weiter Iterationsschemata zur Matrixinversion (s. z.B. A. S. Householder. "The Theory of Matrices in Numerical Analysis" New York, 1964) wie Gauss-Seidel, Überrelaxationsverfahren, Konjugierte-Gradienten-Verfahren, Präkonditionierung, Multigrid und Blocking Techniken or Chebyshev. Allerdings sind einige dieser Methoden auf hermitesche Matrizen beschränkt.

In einigen Fällen wird alternativ auch das Gleichungssystem

 M * PR = ( 1 - d ) / N

betrachtet. Offensichtlich ergibt sich der gleiche Lösungsvektor nur mit einer anderen Normierung ( 1 / N ).

Einen Sonderfall stellt der Fall d=1 (d.h. keine Dämpfung) dar. In diesem Fall wird der Eigenvektor der Matrix T mit dem Eigenwert eins gesucht. Das Problem sind degenerierte Eigenwerte. Diese treten immer auf, falls die Verlinkungsstruktur so ist, dass nicht jede Seiten von jeder anderen aus erreicht werden kann. Dies ist der Fall, wenn es tote Enden gibt (d.h. Seiten ohne ausgehende Links)  oder geschlossene Strukturen existieren. Das Endergebnis der Iteration ist in diesem Fall von den Anfangswerten abhängig und ist eine Kombination der verschiedenen Eigenvektoren mit Eigenwert 1. Für d < 1 stellen tote Ende kein Problem dar und brauchen nicht gesondert behandelt zu werden.

Zufalls-Surfer-Modell

Eine anschauliche Interpretation des PageRanks (für d < 1) ist das Zufalls-Surfer-Modell: Ein Surfer startet auf einer zufälligen Seite und bewegt sich dann durch das Netz, indem er mit der Wahrscheinlich d zufällig einem Link auf der Seite folgt bzw. mit der Wahrscheinlichkeit (1-d) auf einer beliebigen Seite neu startet. Falls es keine toten Enden gibt, so entspricht die Wahrscheinlichkeit auf Seite i zu landen genau dem PageRank  des Gleichungssystems

 M * PR = ( 1 - d ) / N
Gibt es in dem System solche toten Enden, so ist der Wahrscheinlichkeits-Vektor proportional zum PageRank-Vektor.

Beispielrechnungen

Einfache Beispiele

Im Folgenden soll die Berechnung des PageRanks anhand einiger Beispiele veranschaulicht werden. Dabei wird die Normierung/Formel M * PR = (1-d) benutzt. Die meisten Berechnungen erfolgen analytisch. Numerische Werte ergeben sich durch Wahl konkreter Parameter, z. B. eines Dämpfungsfaktors von d = 0.85.

Pagerank berechnen Beispiel: Einfachster Fall Beispiel 1
Der einfachste Fall sind nicht verlinkte Webseiten. Hier gilt:
 PRA = PRB = PRC = (1 – d)
Alle Seiten haben den gleichen PageRank. Der Wert entspricht dem möglichen Minimalwert. Das Ergebnis gilt entsprechend für eine beliebige Anzahl von nicht verlinkten Seiten.
Pagerank berechnen Beispiel: Simple Kette Beispiel 2
Jede Seite verlinkt jede andere Seite. Es ergibt sich:
 PRA = PRB = PRC = 1
Auch hier haben alle Seiten den gleichen PageRank – wie bei jeder symmetrischen Verlinkung. Das Ergebnis gilt auch für eine beliebige Anzahl von Seiten.
Pagerank berechnen Beispiel: Drei Seiten Beispiel 3
Der erste nicht-triviale Fall: Seite B verlinkt auf A und C, die wiederum zurücklinken. Es ergibt sich:
 PRB = ( 1 + 2 d ) / (1 + d)
	
 PRA = PRC
      = ( 1 + d / 2 ) / (1 + d)
Offensichtlich ist der PageRank von Seite B höher, als der von A und C. Die Summe der PageRank-Werte ist gleich der Anzahl der Seiten:
 PRSumme = 3
Man kann zeigen, dass für jede Verlinkungsstruktur, bei der jede Seite mindestens einen ausgehenden Link besitzt (d.h. keine toten Enden existieren), die Summe aller PageRank-Werte gleich N (der Anzahl der Seiten) ist.

Komplexere Beispiele

Pagerank berechnen Beispiel: Komplere Verlinkung Beispiel 4
Der eigene Internetauftritt besteht aus einer einzigen Seite, hat keine ausgehenden Links, aber einige eingehende:
 PRHome = (1 – d ) + X
X bezeichnet die Summe aller Beiträge von eingehenden Links.
Pagerank berechnen Beispiel 5 Beispiel 5
Der eigene Internetauftritt besteht aus N + 1 Seiten. Die Startseite verlinkt zu N Unterseiten  (i = 1,…, i = N, N > 0), die jeweils zur Startseite zurück verlinken. Es gibt einige eingehende Links zur Startseite, aber keine ausgehenden Links zu externen Seiten:
 PRHome = ( N d + 1 ) / ( 1 + d ) + 
           X / ( 1 - d2 ) 
           
 PRi = ( N + d ) / N ( 1 + d ) + 
        d X / N ( 1 – d2 )
Für die Summe aller Beiträge der eigenen Seite gilt
 PRSumme = N + 1 + X / ( 1 – d )
Der Anteil N + 1 ist selbst 'produziert'; der Anteil X / ( 1 – d ) beruht aus transferiertem PageRank. Der Faktor 1 / (1 – d) ergibt sich aus
 ∑ di = 1 / ( 1 - d )
d.h. es wird in der nullten Ordnung der PageRank X transferiert, in der ersten d X u.s.w.
Wie bereits erwähnt, ist der produzierte PageRank gleich der Summe der Seiten, vorausgesetzt es gibt keine toten Enden.

Tote Enden sind eine Verschwendung von PageRank. Dies wird deutlich, wenn man das Ergebnis für N = 1 mit Beispiel 4 vergleicht. Der PageRank hat sich um weit mehr als 1 (durch die zusätzliche Seite) erhöht. Die Verlinkungsstruktur ist optimal, wenn man einer Seite einen möglichst hohen Wert geben will. Falls keine Selbstlinks (Links zu der eigenen Seite) bei der PageRank-Berechnung berücksichtigt werden, so gibt es keine Struktur, die einer einzelnen Seite mehr PageRank gibt.
Pagerank berechnen Beispiel 6 Beispiel 6
Der eigene Internetauftritt besteht aus N + 1 Seiten. Die Startseite verlinkt zu N Unterseiten, die alle untereinander verlinkt sind. Es gibt einige eingehende Links zur Startseite, aber keine ausgehenden Links zu externen Seiten:
 PRHome = 1 + X ( N (1 – d) + d) / 
                (N + d)(1 – d)
                
 PRi = 1 + d X / (N + d) (1 – d)
Für die Summe aller Beiträge der eigenen Seite gilt
 PRSumme = N + 1 + X / ( 1 – d )
Man kann zeigen, dass sich immer die gleiche Summe ergibt, vorausgesetzt, es gibt keine ausgehenden Links und keine toten Enden auf der eigenen Webseite. Die interne Verlinkungsstruktur ändert lediglich die Verteilung.
Im Vergleich zu Beispiel 5 ist der PageRank der Startseite geringer, der PageRank der Unterseiten höher.
Pagerank berechnen Beispiel 7 Beispiel 7
Wie Beispiel 6, jedoch haben alle Unterseiten einen ausgehenden Link zu externen Seiten. Die verlinkten externen Seiten haben keine Verbindung (direkt oder indirekt) zu den Seiten mit den eingehenden Links, d.h. die Verlinkung der externen Seiten führt zu keiner Erhöhung der Beiträge von eingehenden Links (X).
Zur Vereinfachung wurde d = 0.8 und N = 20 angenommen:
 PRHome ≈ 0,845 + 1,124 X 
 PRi ≈ 0,846 + 0,163 X
 PRSumme ≈ 17,78 + 4,38 X 
Vergleich man die Werte mit Beispiel 6 (d = 0.8, N = 20), so sieht man, dass alle Werte gesunken sind:
 PRHome = 1 + 15 / 13 X ≈ 1 + 1.154 X
 PRi = 1 + 5 / 26 X ≈ 1 + 0.192 X
 PRSumme = 21 + 5 X
Pagerank berechnen Beispiel 8 Beispiel 8
Wie Beispiel 6, jedoch hat die Startseite einen ausgehenden Link zu einer externen Seite, die keine Verbindung (direkt oder indirekt) zu den Seiten mit den eingehenden Links hat.
Zur Vereinfachung wurde d = 0.8 und N = 20 angenommen:
 PRHome ≈ 0,993 + 1,145 X
 PRi ≈ 0,991 + 0,182 X
 PRSumme ≈ 20,81 + 4,78 X
Vergleich man die Werte mit Beispiel 6 (d = 0.8, N = 20), so sieht man, dass alle Werte gesunken sind, während der PageRank höher als im Beispiel 7 liegt.

Erweiterungen & Modifikationen

Personalisierter PageRank

Der personalisierte PageRank wurde zuerst von Page, Brin, Motwani und Winograd erwähnt. Die Idee ist einfach: Anstatt die Quellen des PageRank gleichmäßig zu verteilen, werden sie individuell (nach Interessen) modifiziert. Konkret berechnet sich der PageRank aus

 PR = M-1 * V
wobei V ein personalisierter Vektor ist. Bei einer gleichmäßigen Verteilung der Quellen
 Vi = konstant
ergibt sich der normale PageRank-Vektor. Die Auswahl des Quellvektors V hängt von den persönlichen Interessen ab. So könnte man beispielsweise die persönlichen Bookmarks als Quellen für den personalisierten PageRank verwenden. Auf diese Weise würde beispielsweise ein Surfer mit starken Interesse an kommerziellen Seiten ebensolche als favorisierte Suchergebnisse bekommen, während bei einem Benutzer mit Interesse an nicht-kommerziellen Informationsseiten diese bevorzugt als Suchresultate angezeigt werden.

Das Problem des personalisierten PageRanks ist, dass er entweder für jede Person individuell berechnet werden muss oder zunächst ein kompletter Basissatz von Vektoren bestimmt werden muss. Dieser Basissatz würde allerdings der Anzahl aller Webseiten entsprechen. Beide Berechnungsmethoden sind derzeit aufgrund der Berechnungsdauer praktisch unmöglich.

Themenabhängiger PageRank

Beim themenabhängigen PageRank werden Übergangsmatrizen T[i] für einzelne Themen gebildet. Aus

 PR[i] = M[i]-1 * (1 - d)
wird dann ein themenabhängiger PageRank PR[i] bestimmt. Die Anzahl der Themen ist dabei relativ klein (z.B. die 16 Top-Level-Themen des ODP). Durch individuelle Gewichtung (w[i]) der einzelnen themenabhängigen Werte lässt sich dann ein individueller (personalisierter) Pagerank gewinnen
 PR = Σ w[i] PR[i]
 Σ w[i] = 1
Somit ergibt sich eine einfache Form des personalisierten PageRanks.

Modularer PageRank

Der Modulare PageRank ist eine weitere Form des personalisierten PageRanks. Hierbei wird ein Basissatz von wichtigen, zentralen Webseiten als Quellen für den PageRank benutzt:

 PR[i] = M-1 * V[i]
Durch Gewichtung der PR[i] in Abhängigkeit von den persönlichen Interessen, ergibt sich ein personalisierter PageRank. Im Grenzfall i → (Anzahl aller Webseiten) ergibt sich die allgemeine Form des personalisierten PageRanks.

BlockRank

Der BlockRank ist kein neuer Ansatz für die Ordnung der Ergebnisse, sondern lediglich eine Methode zur schnelleren Berechnung des PageRanks. Hierbei wird der RageRank zunächst auf kleinen Blöcken (z.B. Domains) berechnet, bevor die Gesamtberechnung vorgenommen wird. Dies bietet zwei Vorteile: Zum einen ist die Berechnung schneller, zum anderen kann die Berechnung parallelisiert werden.

Die Verwendung von Block-Techniken  bei Matrixinversionsverfahren ist nicht neu. Sie wurden lange vor der Beschreibung des PageRank-Verfahrens benutzt. Neben der Block-Technik existieren weitere effizientere Methoden der Berechnung. Insbesondere lassen sich im Bereich der Gittereichtheorie viele Verfahren finden große Matrizen, bei denen viele Einträge null sind, zu invertieren.

Sonstiges

PageRank-Produktion & Googles aktueller Algorithmus

Wenn man den PageRank-Algorithmus studiert hat und eine Verbesserung für die eigene Seite erreichen möchte, so wird man schnell auf die Idee kommen, Millionen von Seiten zu generieren nur mit dem Zweck PageRank zu produzieren. Theoretisch ist dies bei geeigneter Verlinkungsstruktur möglich – praktisch allerdings nicht! Google hat schon vor Jahren seinen Algorithmus grundsätzlich modifiziert. Eine dieser Veränderungen verhindert die eigene 'Produktion' von PageRank. Es ist im Gegenteil sogar PageRank nötig (d.h. entsprechende eingehende Links), um eine größere Webseite komplett spidern zu lassen. Daneben hat Google einige weitere kleine Anpassungen vorgenommen und z.B. den Wert des Dämpfungsfaktors von ursprünglich d=0.85 angepasst.

Ein weiterer praktischer Aspekt ist die Frage welche Links von Google gezählt werden. Verlinkt Seite A zweimal auf Seite B und einmal auf Seite C, so gibt es mehrere Möglichkeiten, wie der PageRank verteilt werden könnte. Googles derzeitige Implementierung berücksichtigt mehrfache Links nicht, d.h. im obigen Beispiel wird der transferierte PageRank zu 50% auf Seite B und Seite C verteilt. Auch bei der Verlinkung der Seite selber (d.h. ein Selbstlink) gibt es verschiedene Möglichkeiten der Implementierung. Zurzeit werden Selbstlinks von Google berücksichtigt. Dagegen werden Links, die mit dem Attribut rel="nofollow" gekennzeichnet sind, nicht gewertet.

Google-Toolbar und Verzeichnis-Werte

Derzeit gibt es nur zwei Möglichkeiten Informationen über den PageRank zu erhalten: die Google-Toolbar und das Google-Verzeichnis. Zwar gibt es auch Anbieter, die den PageRank direkt im Browser anzeigen, allerdings greifen diese auch auf die Google-Toolbar-Werte zurück.

Die Google-Toolbar arbeitet mit einer logarithmischen Skala von null bis zehn. Durch die logarithmische Skala entspricht eine Erhöhung um eine Einheit in der Toolbar, der Erhöhung des realen PageRanks um den Faktor b – der logarithmischen Basis. Die Skala ist vermutlich so angepasst, dass die Seite mit dem aktuell höchsten PageRank einen Toolbar-Wert von genau 11 hat.

Das Google-Verzeichnis arbeitete bis Anfang 2008 mit einer logarithmischen Skala von null bis sieben. Durch die andere Einteilung war es möglich zusätzliche, genauere Informationen über den Wert des PageRanks zu bekommen. Zum einen konnten Webseiten, die einen gleichen Toolbar-Wert besitzen, einen unterschiedlichen Wert im Verzeichnis haben zum andere ergaben sich aus der Ordnung nach PageRank im Verzeichnis weitere Hinweise auf den genauen PageRank. Da es sich bei dem Verzeichnis um einen Klon des ODP  handelt, muss die Seite dort verzeichnet sein, um die zusätzliche Information zu erhalten. Probleme ergaben sich allerdings dadurch, dass die Toolbar- und die Verzeichnis-Werte nicht gleichzeitig aktualisiert werden. Im Allgemeinen waren die Verzeichnis-Werte neueren Datums. Inzwischen wird jedoch nur noch der Toolbar-Wert von 0 - 10 im Google-Verzeichnis angezeigt.

Seit einiger Zeit ist es auch zu Manipulationen der Toolbar-Werte gekommen. Dazu werden Seiten per Redirect auf bestehende Seiten mit hohem PageRank weitergeleitet. Google setzt in diesem Fall beide Seiten gleich und übernimmt den PageRank-Wert der Zielseite. Wird die Weiterleitung nach einiger Zeit durch neue Inhalte ersetzt, so bleibt der angezeigte (falsche) PageRank erst einmal bestehen. Alternativ wird auch Cloaking betrieben und nur den Suchmaschinen eine Weiterleitung angezeigt, während Besucher andere Inhalte zu sehen bekommen. Falsche PageRank-Werte können durch Ansicht zwischengespeicherter und archivierter Versionen, Durchsicht der Verweise, Überprüfung der Vererbung und Nutzung des 'info'-Befehls erkannt werden.

PageRank-Rechner

PageRank-Rechner kalkulieren für wählbare Verlinkungsstrukturen den PageRank der einzelnen Seiten numerisch. PageRank-Rechner können durchaus sinnvoll sein, um das grundsätzliche Verständnis zu erhöhen. Natürlich können hiermit nur eine kleine Anzahl von Seiten betrachtet werden. Außerdem sind externe eingehende und ausgehende Links oft nicht berücksichtigt. Da sie zudem weder Googles aktuelle Veränderungen berücksichtigen noch komplexere Strukturen möglich sind, dienen sie jedoch mehr didaktischen Zwecken und nicht als konkrete Entscheidungshilfe bei der Entwicklung von Verlinkungsstrukturen.

PageRank-Vorhersage

Im Internet findet man einige Seiten, die versprechen den künftigen PageRank vorherzusagen. Da natürlich keine Seite die Verlinkungsstruktur des Internets bzw. des von Google indexierten Teils hat, muss die 'Vorhersage' auf anderen Daten beruhen. Entweder wird nur die Anzahl von eingehenden Links für eine Webseite genommen was sehr ungenau ist oder es werden die eingehenden Links und der dazugehörige Toolbar-Wert des PageRanks für die Prognose benutzt. Auch im zweiten Fall gibt es jedoch eine Vielzahl von Unbekannten:

  • Falls die eingehenden Links von Google genommen werden, so ergibt sich ein Problem, da Google nicht alle Verweisseiten anzeigt. Werden die eingehenden Links von anderen Suchmaschinen genommen, so ist nicht klar, ob Google diese überhaupt berücksichtigt.
  • Es kann nicht überprüft werden, ob der PageRank vererbt wird.
  • Der Toolbar-Wert des PageRanks ist nur als ganze Zahl verfügbar. Ein angezeigter Wert von PR6 kann 6.0 oder 6.99 bedeuten. Somit muss mit einem mittleren Wert gerechnet werden.
  • Für dynamische URLs stimmen die in der Toolbar angezeigten Werte nicht.
  • Es werden die aktuell angezeigten Toolbar-PageRank-Werte der Verweisseiten genommen. Diese Werte ändern sich jedoch nach der nächsten Kalkulation.
  • In die Berechnung muss die Basis von Googles logarithmischer Toolbar-Skala einfließen. Hier werden nahezu immer völlig falsche Werte zwischen 5 und 8 verwendet.
  • Die Anzahl der ausgehenden Links muss durch einen Mittelwert geschätzt werden.
  • Die Toolbar-Skala ist nicht fixiert, so dass sich der Toolbar-Wert ändern kann, auch wenn der reale PageRank konstant bleibt.

All diese Fehler addieren sich. Eine sinnvolle Prognose ist somit unmöglich. Die Trefferquote dürfte nicht höher liegen, als bei simplen Abschätzung  der Form 'Maximale PageRank einer Verweisseite -1' oder 'Der PageRank der Seite ändert sich nicht'.

Kauf & Verkauf

Möchte man den eigenen PageRank verbessern, so ist der Kauf eine Möglichkeit. Allerdings gibt es hierbei eine Vielzahl von Punkten zu beachten:

  • Ist der PageRank auf der Verkäuferseite echt?
  • Wird der PageRank zu anderen Seiten transferiert? Ist er von der Seite selber geblockt (z.B. mit nofollow oder einem Skript) oder verhindert Google eine Weiterleitung?
  • Wie viele Links (externe plus interne) sind auf der Seite? Ist diese Anzahl fest oder kann sie sich ändern?
  • Was passiert, wenn sich der PageRank der Verkäufer-Seite ändert?

Sind alle diese Fragen geklärt, so kann der Kauf von PageRank durchaus sinnvoll sein. Dies muss allerdings im Einzelfall anhand konkreter Projekte entschieden werden. Eine Garantie, dass der PageRank tatsächlich transferiert wird, gibt es allerdings nicht. Google kann prinzipiell jederzeit manuell in den Algorithmus eingreifen und den Transfer zum Zwecke des Verkaufs verhindern, wie im Beispiel SearchKing.com geschehen.

Der PageRank-Algorithmus als PDF (150 kB)


Fragen und Antworten

  • Keine PageRank-Information verfügbar

    Warum zeigt mir die Google-Toolbar bei einigen Seiten 'Kein PageRank-Information verfügbar' an?
  • Sind sprechende URLs sinnvoll?

    Hallo, im Rahmen von SEO höre ich immer wieder von sprechenden URLs, z.B. die von Bild.de. Ist das ei Maarketinggag oder haben solche URLs einen positiven Einfluss auf de PageRank oder das Suchergebnis?
  • Webstatistik und Suchmaschinenoptimierung

    Liebe SEO Welt, im Rahmen eines Interprojektes ist die Anforderung an ein sogenanntes Link- bzw. Elementtracking gestellt. Beispiel: Ein Element besteht aus einem verlinkbaren Element 'Überschrift','Bild' und 'Link'. Alle 3 Targets ist die Seite www.domain.de/zielzeite. Um die Nutzung der o.a. Elemente zu tracken, ist ein eigener Parameter zur Unterscheidung notwendig. Dies bedeutet, ...
  • Frage zum Pagerank einer Webseite

    Hallo, unsere Webseite www.xxx.de ist eine mit Joomla erzeugte Webseite. Ziemlich umfangreich aber mit dynamischen URLs. Ich habe versucht sie zu optimieren so gut es geht. Die Seite ist in einigen Webkatalogen eingetragen. Aber seltsamer weise steigt weder der Pagerank (0). Obwohl wir teilweise bei guten Platzierungen gefunden werden. Eine Sitemap wird regelmäßig an Google gesendet. Die ...
  • Pagerank Verlust nach Update

    Nach dem aktuellen Pagerank Update wurden viele Seiten mit einem Pagerank verlust abgestraft - heise.de/newsticker/meldung/98042. Gibt's schon eine Erklärung hierfür?
  • Pagerank geändert

    Nach dem aktuellen Pagerank Update liest man oft, dass der Algorithmus verschärft wurde oder interne Links abgewertet wurden. Kann das sein?
  • Pagerank und Traffic

    Kann es sein, dass ein Zusammenhang wischen dem Pagerank und dem Traffic einer Seite besteht? D.h. bekommt eine Seite mit weniger Traffic einen geringeren Pagerank?
  • gefälschter PageRank

    Wie kann ich feststellen, ob der angezeigte Pagerank echt ist oder ob es sich um gefälschten Pagerank handelt?
  • PageRank abgeschafft

    Ist Pagerank derzeit überhaupt noch relevant? Wird der Pagerank Verfahren vielleicht demnächst völlig abgeschafft?
  • Ursache Pagerank Verlust

    Alle Seiten meiner Homepage hatten lange PR4. Jetzt sind viele nur noch PR3. Woran kann das liegen?
  • Pagerank bei dynamischen Seiten

    Die Anzeige für meine dynamischen Sieiten ist etwas komisch. ich habe gerade eine neue Seite angelegt und schon wird ein Pagerank von 3 angezeigt. Ist der Wert echt?
  • Sandbox durch Pagerank

    Ich habe eine Theorie gelesen, nach der die Sandbox durch Schwankungen bei der Berechnung des Ragrank verursacht werden. Bei der Berechnung PR(A) = (1-d) + d (PR(T1)/C(T1)+ ... +PR(Tn)/C(Tn)) verändern sich die Werte während der ersten Iterationen, insbesondere für neue Domains, sehr stark. Dies soll für den Effekt verantwortlich sein. Kann das stimmen ?
  • Pagerank trotz Penalty

    Meine Seite scheint einen Penalty von Google bekommen zu haben. Alle Seiten sind aus dem Index. Trotzdem zeigt die Homepage einen PR5 an - kann das sein?
  • Pagerank Update

    Wieso hat sich mein ranking nicht verbesser obwohl meine Seite beim letzten Updaten von PR2 auf PR4 gestiegen ist?
  • Pagerank-Vererbung

    Stimmt es, dass an Unterverzeichnisse der Pagerankwert-1 vererbt wird?

Das Copyright für Texte und Bilder liegt bei Suchmaschinen-Doktor.de. Eine Folgeverwertung ist nur mit Zustimmung des Autors möglich. Cloaking, Doppelter Content.
© 2006-2024 Dr. SEO – der Suchmaschinen-Doktor Dr. SEO