Rankingfaktoren – Gewichtung, Relevanz
Im Information Retrieval müssen alle Dokumente bewertet werden um aus einem riesigen Datenbestand DIE Dokumente zu liefern, welche für den User als Relevant zu seiner Suchanfrage eingeordnet werden.
Eine wirkliche Relevanz zur Suchanfrage bedeutet, dass die gefundenen Ergebnisse sich möglichst nahe an die Suche annähern. Der Algorithmus welcher dahinter steht ist komplex und wird von Suchmaschinen ständig verändert. Seit einigen Monaten springen die SERP zu vielen Suchabfragen erheblich. Früher kannte man dieses Phänomen als Google Dance. Mittlerweile ist dies mehrfach täglich zu beobachten. Dies hängt mit hoher Wahrscheinlichkeit daran, dass die Ergebnisse ausliefernden Datencenter varieren.
Man kann hoffen, dass diese Effekte abnehmen und Google demnächst einen besseren Abgleich zwischen seinen Datencentern schafft.
Im Auswertungs-Prozess dienen verschiedene statistische Modelle, wie das Boolsche Retrieval der Bewertung. Weitere Modelle sind beispielsweise das Vektorraummodell, Inverse Wortphrasen Häufigkeit, Fuzzy-Logik (ungenaue Suche).
Die einzelnen Modelle werden im Laufe der nächsten Zeit hier genauer vorgestellt werden.