IDF

Aus Handbuch » XOVI

IDF ist die Abkürzung für Inverse Document Frequenzy. Mit dieser Methode lässt sich die Häufigkeit eines Wortes innerhalb eines Datensatzes aus mehreren Texten ermitteln. Die Methode kommt aus der Informationswissenschaft und -statistik. Zusammen mit Within Document Frequency (WDF) ermöglicht IDF die Erstellung von einzigartigen Inhalten. IDF und WDF haben in Kombination den Stellenwert eingenommen, den die Keyword-Dichte ehemals hatte.

Geschichte

IDF ist viel älter als das Internet, wie wir es kennen. In den Sechzigerjahren arbeitete der US-amerikanische Forscher C.W. Cleverdon an "The Cranfield tests on index language devices". Dabei ging es um Termgewichtung und eine bestmögliche Indizierung von Dokumenten. In den darauffolgenden Jahren wurde nach einer passenden Formel gesucht, um die Bedeutung eines Terms innerhalb von Dokumenten bzw. innerhalb eines Datensatzes aus Dokumenten zu bestimmen. Dabei stellte sich heraus, dass alle Wörter in die Formel mit einbezogen werden müssen, das Ergebnis war die IDF-Formel. Die IDF Formel besteht im Wesentlichen aus einer Logarithmus-Rechnung. Teilt man die Anzahl der Dokumente durch die Anzahl der Dokumente, in denen der Term vorkommt, und addiert das mit Eins kann man aus diesem Wert den Logarithmus berechnen, der letztendlich die Bedeutung des Terms beschreibt.

Die Relevanz von IDF für die Suchmaschinenoptimierung

IDF allein sagt zunächst nichts über die Einzigartigkeit eines Textes aus, nur über die Bedeutung eines Terms bzw. Keywords. Erst mithilfe von WDF lässt sich eine Aussage über die Einzigartigkeit treffen. In der SEO-Branche spricht man deshalb immer öfter von WDF*IDF mithilfe dessen man einen neuen Text mit einem bereits vorhandenem in Beziehung setzen kann. In der SEO-Praxis ist allerdings nicht nur die Analyse des Contentteils wichtig, auch Seitentitel und Alt-Tags gehören dazu.