Einführung in Sachen Google-Ranking

Freitag, 11. Juli 2008

Im Mai hat Udi Manber unser Search Quality Team vorgestellt , jene Gruppe innerhalb Googles also, die für das Ranking der Suchergebnisse verantwortlich ist. Er hat verschiedene Teams innerhalb von "Quality" (wie wir die Gruppe gerne nennen) angeführt, unter anderem Core Ranking, International Search, User Interfaces, Evaluation und Webspam. In diesem Post will ich euch mehr über eines dieser Teams erzählen: über das Core Ranking Team.

Zuerst stelle ich mich aber selbst mal vor: ich heiße Amit Singhal und bin derjenige Google Fellow, der die Verantwortung für das Ranking Team trägt. Ich arbeite seit 18 Jahren an Projekten im Zusammenhang mit Search. 1990 kam ich als Student das erste Mal mit Suche in Berührung. Im akademischen Umfeld nennt man diesen Bereich "Information Retrieval" (oder kurz IR). Nach einem Jahrzehnt als IR-Wissenschaftler kam ich im Jahr 2000 zu Google und arbeite seitdem am Google-Ranking.


Das Google-Ranking besteht aus einer Sammlung von Algorithmen, die dazu benutzt werden, die relevantesten Inhalte für Useranfragen zu finden. Täglich werden hunderte Millionen von Anfragen beantwortet - aus einem Datensatz von Milliarden und Abermilliarden von Webseiten. Diese Algorithmen arbeiten einen Großteil der Anfragen ab, die an unsere Google-Suchservices gerichtet werden. Während die Websuche der meistgenutzte und bekannteste davon ist, werden dieselben Algorithmen - mit einigen Modifikationen - auch für andere Google-Suchservices benutzt, etwa für Bilder, News, Youtube, Maps, Produktsuche, Buchsuche und mehr.


Die Frage, die mir bezüglich des Google-Rankings am häufigsten gestellt wird, ist "Wie macht ihr das?" Selbstverständlich braucht es einiges, um ein State-of-the-Art-Ranking-System wie das unsere aufzubauen, und ich werde in einem kommenden Post einen tieferen Einblick in die Technologie dahinter geben. Heute will ich kurz die Philosophie hinter dem Google-Ranking umreißen:

  1. Liefere weltweit die besten lokal relevanten Resultate.
  2. Halte es einfach.
  3. Kein Eingriff von Menschenhand.
Prinzip Nummer eins erklärt sich von selbst. Mit unserer Leidenschaft für die Suche wollen wir sicherstellen, dass jede Suchanfrage die relevantesten Suchergebnisse bringt. Wir nennen es das "No query left behind"-Prinzip. Sollten wir einmal nicht das ideale Ergebnis für eine Anfrage, egal in welcher Sprache oder in welchem Land, liefern - und das passiert (schließlich ist Search keinesfalls ein bereits gelöstes Problem) - sehen wir das als Inspirationsquelle für Verbesserungen.

Das zweite Prinzip erscheint ebenfalls klar. Ist es nicht der Wunsch aller Systemarchitekten, ihre Systeme einfach zu halten? Tja, was Suchsysteme betrifft - bedenkt man die große Bandbreite von Useranfragen, die wir in einer Vielzahl von Sprachen beantworten - kann es schnell passieren, dass die Komplexität schleichend zunimmt. Wir arbeiten sehr hart daran, unsere Systeme einfach zu halten, ohne die Qualität der Suchergebnisse zu beeinträchtigen. Das ist eine permanente Anstrengung, die sich auszahlt. Jede Woche führen wir an die zehn Änderungen am Ranking durch und ein wichtiger Faktor beim Launch jeder dieser Änderungen ist, alles einfach zu halten. Unsere Programmierer wissen genau, warum eine Seite für eine bestimmte Suchanfrage so rankt, wie sie es tut. Dieses einfach nachvollziehbare System ermöglicht es uns, schnell neue Innovationen einzuführen. Das macht sich bemerkbar. Die "Keep it simple"-Philosophie hat sich bewährt.


Keine Diskussion über Googles Ranking wäre vollständig, wenn nicht die häufig gestellte - aber irreführende! :) - Frage auftauchen würde: "Bearbeitet Google die Suchergebnisse durch menschlichen Eingriff?" Durch den dritten Punkt unserer Philosophie lässt sich sich diese Frage schnell beantworten: kein Eingriff von Menschenhand.


Unserer Ansicht nach wird das Web von Menschen gestaltet. Ihr seid diejenigen, die Websites online stellen und diese verlinken. Durch unsere Algorithmen machen wir uns diesen menschlichen Beitrag zunutze. Indem unsere Algorithmen den Input der gesamten Internet-Community verwerten, führen sie das abschließende Sortieren der Resultate durch, nicht durch unseren manuellen Eingriff. Wir sind der Meinung, das subjektive Urteil eines jeden Individuums ist, nun ja ... subjektiv und die Informationen, die unsere Algorithmen aus dem allumfassenden, in Webseiten und ihren Links enthaltenen, Wissen der Menschheit beziehen, sind nützlicher als individuelle Subjektivität.


Der zweite Grund, warum wir aus Prinzip gegen eine manuelle Anpassung unserer Resultate sind, ist die Tatsache, dass ein fehlerhaftes Suchergebnis nur ein Symptom für eine potentielle Verbesserungsmöglichkeit unserer Ranking-Algorithmen ist. Indem man den zu Grunde liegenden Algorithmus verbessert, verbessert man nicht nur ein Ergebnis, sondern die Ergebnisse für eine ganzen Klasse von Suchanfragen - und das in vielen Fällen für alle Sprachen. Ich möchte aber hinzufügen, dass es klar formulierte
Richtlinien von Google für Websites gibt, und dass wir gegen Verstöße gegen unserer Richtlinien sowie aus einer kleinen Anzahl anderer Gründe (z. B. gesetzliche Bestimmungen, Kinderpornographie, Viren und Malware, usw.) Maßnahmen ergreifen.

Bleibt auf jeden Fall dran, denn in meinem nächsten Post werde ich genauer auf die Technologie hinter unserem Ranking eingehen und Beispiele für mehrere innovative Rankingtechniken liefern! Für heute habe ich zum Abschluss nur hinzuzufügen, dass unser Leidenschaft für Search stärker ist als jemals zuvor - und dass ich als Search-Forscher den besten Job der Welt habe :-).


Introduction to Google Ranking (English version)

Post von Amit Singhal, Google Fellow (Übersetzung von Jörg, Search Quality)