Ein kürzlich veröffentlichtes, stark redigiertes Zeugnis eines Google-Ingenieurs durch das Justizministerium der USA ermöglicht einen Einblick in die Funktionsweise der Rankingsysteme von Google. Dieses Dokument bietet einen allgemeinen Überblick darüber, wie Google Seitenqualität bewertet und wie Signale genutzt werden, darunter ein mysteriöses Signal, das auf Chrome-Daten basiert. Es zeigt, wie Google mathematische und statistische Modelle verwendet, um die Qualitäts- und Relevanzbewertungen von Webseiten zu erstellen. Obwohl detaillierte technische Informationen hier fehlen, geben die Aussagen ein besseres Verständnis der Komplexität hinter den Google-Algorithmen.
Hand-gefertigte Signale
Google setzt laut Zeugnis auf „hand-crafted“ Signale, was bedeutet, dass die Algorithmen von Ingenieuren skaliert und fein abgestimmt werden. Dabei werden Daten von Qualitätsbewertern, Nutzerdaten und Klickstatistiken herangezogen, um Ranking-Scores zu erstellen. Dies ist jedoch nicht so zu verstehen, dass Google Websites manuell in Rankings einordnet. Stattdessen wird durch statistische Berechnungen ein algorithmischer Mechanismus entwickelt, der skalierbar ist.
Inhaltsverzeichnis
ToggleDie ABC-Signale des Rankings
Die „ABC-Signale“ bilden laut Google ein Kernstück der Themenrelevanz einer Seite in Bezug auf eine Suchanfrage:
- A (Anker): Bezieht sich auf die Seiten, die Links zur Zielseite enthalten.
- B (Body): Inhalte und Begriffe, die mit der Suchanfrage übereinstimmen.
- C (Clicks): Nutzerverhalten, insbesondere Verweildauer auf einer Seite, bevor zur Suchergebnisseite zurückgekehrt wird.
Während diese Signale wichtig sind, sind sie nur eine von vielen Facetten des Rankingprozesses, der eine Vielzahl weiterer Algorithmen umfasst.
Interaktion zwischen Seitenqualität und Relevanz
Die Bewertung der Seitenqualität erfolgt unabhängig von der Suchanfrage und bleibt konsistent („statisch“) über verschiedene Suchanfragen hinweg. Eine Seite, die als vertrauenswürdig eingestuft wird, behält diesen Status quer durch relevante Anfragen. Allerdings spielen in der tatsächlichen Platzierung auch kontextabhängige Relevanzsignale mit ein.
Die Ingenieure betonten, dass die Qualität meist auf der Grundlage einer Seite oder Website generalisiert wird und nicht ständig für jede Suchanfrage neu berechnet wird.
KI und damit verbundene Herausforderungen
Ein faszinierender Einblick war der Bericht über Beschwerden in Verbindung mit den von Google verwendeten KI-Methoden. Laut dem Zeugen hat KI die Probleme mit der Qualität nicht gelöst, sondern neue Ebenen von Problemen erzeugt. Der Umgang mit dieser Herausforderung erfordert erhebliche Anstrengungen durch die Ingenieure.
Einblick in die LLM-Technologien
„eDeepRank“ ist eine von BERT beeinflusste Technologie für maschinelles Lernen bei Google. Diese modularisierte Methode versucht, komplizierte Signale aus einer KI verständlich herunterzubrechen. Dies dient dazu, Transparenz zu schaffen und Ingenieuren zu helfen, Entscheidungen der KI nachzuvollziehen.
Weiterentwicklung von PageRank
Das ursprüngliche Konzept von Googles PageRank wurde weiterentwickelt. Ein anschauliches Beispiel ist die Verwendung von „Entfernungsrankings“, bei denen die Distanz zwischen einer Website und anerkannten autoritativen Websites (sogenannte „Seed Sites“) innerhalb eines Themas analysiert wird.
Ein verborgenes Signal aus Chrome-Daten
Ein besonderes und mysteriöses Signal, dessen Name in dem Dokument redigiert wurde, basiert anscheinend auf Daten aus dem Chrome-Browser. Es wird als ein „Beliebtheitssignal“ beschrieben. Unklar bleibt, ob es sich dabei um öffentlich bekannte Messgrößen wie Core Web Vitals handelt oder um ein bisher unbekanntes Signal.
Abschlussgedanken
Zusammenfassend eröffnet diese Publikation einen seltenen Einblick in Googles Suchalgorithmen. Durch die detaillierte Analyse von Themenrelevanz, Seitenqualität, maschinellem Lernen und Nutzersignalen können wir mehr über die Herausforderungen und Entwicklungen erfahren, die Google bewältigt, um die Suchergebnisse zu optimieren.