„Content is King“ – oder doch nicht? Eric Kubitz nimmt die Termgewichtung WDF\*IDF genauer unter die Lupe. Mit hilfreichen Beispielen zeigt er, was mit der „Zauberformel“ heute noch möglich ist und wofür sie gänzlich ungeeignet ist.
Schon fast ein Standard: Die WDF*IDF-Analyse wird von vielen unserer Content-Kunden - wie selbstverständlich - erwartet. Es scheint, dass sich nun der Rauch darum ein wenig gelegt hat und sich diese Wort-Analyse zu einem SEO-Must-Have etabliert hat. So wie 300-Wörter-Texte und H1-Headlines im HTML. Zu unrecht, wie ich finde. Denn einerseits ist das WDF*IDF-Zeugs manchmal geradezu unsinnig. Und andererseits steckt da noch viel mehr drin als ihr glaubt.
WDF*IDF = gewichtete Worthäufigkeit der besten Rankings
Zunächst einmal kurz beschreiben, worum es bei diesem "WDF*IDF" geht: Hierbei werden für ein beliebiges Keyword die Texte der aktuell bei Google am besten positionierten Suchergebnisse analysiert. Und zwar nach einer gewichteten Häufigkeit. Im Web seltenere Begriffe (z.B. „Wälzfräsmaschine“) werden dabei höher gewichtet als Allerweltswörter wie „Hund“ oder „und“. Je seltener ein Wort im Web zu finden ist, umso besser beschreibt es das jeweilige Dokument und ist deshalb interessanter für Google. Diese Gewichtung erfolgt in Echtzeit und das Ergebnis sieht dann etwa so aus:
Abbildung 1: Prinzip von WDF*IDF
Zur Sicherheit, noch einmal: Das sind die Begriffe, die Ryte auf den Seiten gefunden hat, die bei Google für „Wälzfräsmaschine“ am besten ranken. Der Begriff „wälzfräsmaschinen“ ist nicht häufiger darauf zu finden als „maschinen“ sondern er ist insgesamt im Web seltener und wird deshalb höher gewichtet da er die Seite besser beschreibt als das allgemeine „maschinen“. Die Y-Achse markiert also nicht die Zahl der Nennungen des Wortes sondern einen errechneten Index-Wert.
So weit, so logisch. Google kann also an einem Text erkennen, ob er von der Wortwahl und Worthäufigkeit gut „ins Thema passt“. Vorausgesetzt, dass die am besten rankenden Beiträge das Thema prima beschreiben. Das muss aber nicht immer so sein. Denn wirft man dem WDF*IDF-Analysator das Wort „News“ in den Rachen, kommt das heraus:
Abbildung 2: Das geht nicht mit WDF*IDF
Nicht nur, dass der Begriff „news“ auf den Seiten offenbar eher untergewichtet verwendet wird. Auch das Übergewicht von Fußballthemen und der Nachrichtenagentur „dpa“ könnte einen veranlassen, an der WDF*IDF-Analyse zu verzweifeln. Doch das muss nicht sein, die Analyse macht hier halt einfach keinen Sinn. Denn es geht in bei der Positionierung für dieses Keyword offensichtlich um andere Ranking-Faktoren. Das ist meist dann der Fall, wenn man für ein so allgemeines und/oder hart umkämpftes Keyword wie „News“ gut ranken möchte. Außerdem gibt es auf den gängigen News-Seiten herzlich wenig Text ÜBER News sondern es gibt einfach News zu lesen. Klar?
Also WDF*IDF sollte kein Must-Have sein. Es eignet sich aber vor allem für:
Inhaltsseiten (weniger für Kategorie- bzw. Start-Seiten)
Longtail-Keywords bzw. komplexe Themen
Weniger aktuelle Themen (da sich ansonsten die Rankings und damit die verwendeten Wörter zu schnell ändern)
Begriffe rund um die Suchmotivation „Information“ („Transaktionale Keywords“, also Shop-Keywords wie „iPhone kaufen“ funktionieren manchmal nicht so gut)
Längere Texte (also z.B. nicht für kurze News)
Bei den meisten anderen Keywords bzw. Seitenarten kann man sich meist die WDF*IDF-Analyse sparen. Entweder kommt dabei eh nur Mist raus oder es ändert sich zu schnell. Am besten schaut man sich vor einer Analyse also die Suchergebnisse an und entscheidet dann, ob sich WDF*IDF lohnt. Denn wenn in den SERPs nur aktuelle News oder gar SEO-Blödsinn geschrieben steht, kann man sich die Arbeit sparen.
Es geht mir also nicht darum, die WDF*IDF-Analyse „schlecht“ zu machen - denn das ist sie gar nicht. Neben der ihr zugeschriebenen und auch vorhandenen Grundfunktion „besseres Ranking“ (für o.g. Seiten/Keywords) gibt es sogar ein paar Neben- und Zusatz-Effekte, die sie ganz besonders nützlich machen.
Also, wenn ich für „Canonical Tag“ eine WDF*IDF-Analyse mache, dann werden die Top-Seiten zum Thema analysiert. Das sieht dann zum Beispiel so aus:
Abbildung 3: Canonical-Tag und semantische Begriffe
Die lilafarbene Balken markieren einen Wiki Artikel aus dem Ryte Wiki. Anhand diesen Linien erkennt man klar, welche Terme innerhalb des Textes häufiger benutzt werden sollten und welche Wörter bereits gut im Text integriert sind. Was bei der Überarbeitung ergänzt werden sollte, zeigt mir glasklar die WDF*IDF-Analyse.
Ich kann also - und das wird zumeist gar nicht so klar gesehen - mit einer WDF*IDF-Analyse sehr schön erkennen, welche Inhalte in einem Beitrag fehlen. Um das entschlüsseln zu können, muss man sich natürlich mit dem Thema beschäftigen und nicht hirnlos die dargestellten Wörter in den Text hinein pfriemeln. Ein guter Inhalt besteht ja nicht aus sortierten Wörtern - sondern idealerweise aus Sinn...
Aber das ist unter uns doch eh klar. Oder?
Ebenso perfekt ist die WDF*IDF-Analyse als Aktualitäts-Messer: Wer sich noch an die Beinahe-Splitterpartei-Partei "FDP" erinnert, und deren Name zum Sommer 2018 durch das Ryte Tool laufen lässt, findet überraschende Nebenkeywords:
Abbildung 4: FDP und die Nebenkeywords
Bei „aktuellen“ Themen ist die WDF*IDF-Analyse also so etwas wie eine inhaltliche Timeline. Nicht schlecht, finde ich.
Klar, was ich damit sagen will, oder? Mit ein bisschen Geschick kann man sich dank der WDF*IDF-Analyse die Arbeit sparen, mehrere Webseiten zu einem aktuellen Thema durchzulesen sondern kann sich die neuesten Entwicklungen über die Nebenkeywords zusammen reimen.
Doch Vorsicht: Damit wird nicht die wahre Welt analysiert sondern der Inhalt der Seiten, die Google für das Thema am wertvollsten hält. Das kann durchaus ein Unterschied sein.
Nun ein etwas skurriles Beispiel zur Verdeutlichung des letzten Punktes. Was sagt die WDF*IDF-Analyse für „Blindtext“?
Abbildung 5: Analyse zum Keyword "Blindtext"
Klar: Ganz vorne steht „Blindtext“. Auf der analysierten Seite (ein Lorem-Ipsum-Generator) ist dieses Wort aber offensichtlich gar nicht zu finden. Trotzdem spielt dieser ganz weit vorne in den Ranking mit. Warum? Sicherlich, weil der Generator gut funktioniert. Aber vermutlich auch, weil der Text viele der passenden Nebenkeywords enthält. Na gut, diese sind lateinischen Ursprungs und ein Teil des Lorem-Ipsums, das wir für Blindtexte verwenden. Aber genau deshalb habe ich dieses Beispiel gebracht: Es zeigt überdeutlich, dass es in WDF*IDF-Zeiten nicht mehr um das dumpfe Wiederholen von Hauptkeywords sondern um die vielen Nebenkeywords im Sinnzusammenhang geht.
Interessant: Offenbar können Seiten auch für Keywords ranken, die auf ihnen gar nicht stehen. Anders herum gedacht: Wenn die Semantik einer Webseite stimmt, kommt es gar nicht mehr darauf an, ob der eigentliche „Term“ darauf zu finden ist. Wir haben diesen Effekt häufiger gefunden bei Begriffen, die sich gewandelt haben. Wenn also aus „Senioren-Handy“ im Sprachgebrauch „Großtastenhandy“ wird. Dann sind die Nebenkeywords nahezu identisch und du kannst ordentlich ranken - auch, wenn du noch von Senioren-Handy schreibst.
Ob man damit auch Marketing-Sprech heilen kann, wäre noch zu prüfen: Wenn etwa der Hersteller von „Anti-Falten-Creme“ seine Kundinnen nicht mit dem hässlichen Wort „Falten“ erschrecken will und drumrum schreibt. Was wäre, wenn er seine WDF*IDF-Optimerung perfekt auf „Anti-Falten-Creme“ ausrichtet - aber stattdessen den Begriff „Frische-Haut-Creme“ der so verwendet? Platz 1 ohne Hauptkeyword auf der Seite? Das wäre interessant, ein Versuch wäre es wert!
Also: Die WDF*IDF-Analyse ist weder ein Breitband-Medikament, mit dem man alles heilen kann noch ein Placebo. Sie ist vielmehr ein sehr hilfreiches Mittel für die Lösung einiger SEO-Probleme - und für kluge Texter ist sie auch eine prima Themenrecherche die Zeit spart und manchmal zu überraschenden Ergebnissen führt.
Veröffentlicht am Jan 15, 2015 von Eric Kubitz