Skip to main content

WDF*IDF


Es gibt unzählige Ratgeber, die einem mehr oder weniger schlaue Ratschläge mitgeben, wie ein Text SEO optimiert werden kann. Ein Ratschlag, der sich in der Realität als sehr brauchbar erwiesen hat, lässt sich mit der Formel WDF*IDF zusammenfassen. Die Formel gibt das Verhältnis an, mit dem bestimmte Keywords im Vergleich zur definierten Grundgesamtheit auftauchen. Diese Grundgesamtheit kann die gesamte Page darstellen, der einzelne Artikel oder die Pages der Konkurrenten. Es lässt sich hieraus die Frequenz ermitteln, mit der ein oder mehrere Keywords im Text auftauchen und deshalb stellt die Formel WDF*IDF einen Faktor in der OnPage-Optimierung dar. Damit soll die Relevanz des Artikels und der Page insgesamt erhöht werden, ohne das es nach Keyword stuffing aussieht.

Die Berechnung der Formel

WDF ist eine Abkürzung und steht für „within document frequency“, das übersetzt werden kann mit der Frequenz im Dokument. Mit der Formel wird ermittelt, wie oft ein Term oder eine Kombination von Keywords innerhalb eines definierten Dokumentenrahmens vorkommt. IDF dagegen steht für „inverse document frequency“ also die Häufigkeit der Dokumente. Der Faktor WDF wird also ins Verhältnis der relativen Dokumentenhäufigkeit gesetzt.

Um zu verhindern, dass dieser Wert künstlich erhöht wird, wenn das Hauptkeyword häufiger verwendet wird, nutzt man bei der Berechnung den Logarithmus. Deshalb ist WDF auch von der Keyword-Density zu unterscheiden. Diese gibt an, wie häufig ein Keyword im Verhältnis zur Gesamtwörteranzahl des Textes vorkommt. Der Faktor WDF dagegen berücksichtigt auch noch das Verhältnis aller im Text vorkommenden Wörter.

Die Formel WDF*IDF wird auch als Termgewichtung bezeichnet. Der Faktor IDF komplementiert die Gewichtung. IDF kann auch als Dokumentenhäufigkeit übersetzt werden. Er stellt das Korrektiv des WDF-Faktors dar. Damit wird berücksichtigt, dass zu manchen Themen mehr Dokumente vorhanden sind als bei anderen. Deshalb setzt der Faktor IDF auch die Anzahl aller bekannten Dokumente zu den Dokumenten ins Verhältnis, die den Term beinhalten. Mit dem Faktor IDF wird also ermittelt, wie gut ein Text zu einem bestimmten Thema passt, wie hoch also seine Relevanz hierfür ist.

Beide Faktoren ergeben also, wie stark ein Term in einem Dokument gewichtet wurde, wenn die Gesamtanzahl aller Dokumente zu Grunde gelegt wird, die diesen Term ebenfalls enthalten. Wer deshalb den eigenen Content nach dieser Methode optimiert, sollte die Berechnung für jedes sinnvolle Keyword im eigenen Text durchführen. Dabei gilt, dass je umfangreicher die Datenbasis ist, desto präziser sind die sich hieraus ergebenden Ergebnisse.

Der Nutzen für das SEO

Wenn im SEO von WDF*IDF die Rede ist, geht es um die Frage, wie einzigartig und unique der erstellte Content ist. Der Faktor kann mithilfe gängiger Tools ermittelt werden und zielt darauf ab, den eigenen Content möglichst weit vorne in den SERPs zu ranken. Dies geschieht, je einzigartiger der eigene Content ist. Hierfür wurde lange Zeit die Keyworddichte verwendet. Ein Wert von zwei bis drei Prozent innerhalb eines Textes galt als wünschens- und erreichenswert. Die Formel WDF*IDF stellt nun eine weitaus präzisere Möglichkeit dar, den eigenen Content zu optimieren und gilt deshalb als Weiterentwicklung der Keyword Density.

Die Updates des Google-Algorithmus führten dazu, dass die Suchmaschine immer häufiger versucht, den Inhalt eines Textes zu erfassen und hinsichtlich seiner Relevanz einzuschätzen. Deshalb sollte der Content einer Page auch semantisch optimiert werden. Diese semantische Optimierung wird im Fachjargon auch als „Latent Semantic Optimization“ bezeichnet.

Mithilfe der Formel WDF*IDF, empfehlenswert sind die hierfür bereits in großer Menge vorhandenen Tools, kann auch dasjenige Keyword ermittelt werden, auf das die Page optimiert werden sollte. Mit den entsprechenden Programmen ist es möglich, dass ein Text hinsichtlich eines Keywords optimiert wird. Zudem geben die Tools Hinweise darauf, welche weiteren Keywords oder Kombinationen ein Text enthalten sollte, um möglichst unique Content darzustellen.

Nachteile der Formel

Wer diese Formel als Maßstab zur Optimierung des eigenen Contents anwendet, sollte sich dabei bewusst sein, dass der gesamte Content der eigenen Page bei der Analyse mit berücksichtig wird. Das umfasst auch Überschriften sowie Produktbeschreibungen in Online-Shops und diese beeinflussen die Gewichtung. Deshalb ergibt sich für Online-Shops, die lediglich ein oder wenige Produkte pro Page beschreiben, ein eher geringerer und somit negativer Wert. Diese Art der Optimierung benötigt in der Regel eine große Anzahl an bereits vorhandenem Content.

Auch der ganzheitliche Ansatz der Formel ist nicht immer von Vorteil. Wer deshalb ein Keyword häufig in einem Absatz verwendet, aber darüber hinaus nicht im gesamten Text oder der Page, ermittelt mit WDF*IDF einen geringen Wert für dieses Keyword. Auch wird die Verwendung von Synonymen, um beispielsweise dem Verdacht des Keyword stuffing zu entgehen, nicht in dieser Formel mit berücksichtigt.

Hintergrund zu WDF*IDF

Die hier vorgestellte Formel erfreut sich in Deutschland im SEO inzwischen hoher Popularität. Dies liegt auch am Online-Marketing Experten Karl Kratz. In einem Artikel 2012 wies Kratz nach, dass die alleinige Konzentration auf die Keyword Density einen erheblichen Nachteil für die Optimierung des eigenen Contents darstellt. Vorher war es üblich, dass die Orientierung an diesem Konzept vollkommen ausreichend ist, um ein gutes Ranking zu erzielen. Damit wurde von Kratz eine Formel wieder in die Diskussion eingeführt, die bereits 1957 entdeckt wurde. Der Forscher Hans Peter Luhn von IBM entwickelte die hier vorgestellte Formel, um Texte besser analysieren zu können. Bevor die Formel vom SEO wiederentdeckt wurde, fand sie Anwendung in der Linguistik sowie der Computer-Linguistik bei der Auswertung von Übungsmaterial.

Kategorien



Eintrag teilen