« Zurück zum Magazine

Probleme mit Faceted Search erkennen und beheben

Eine undurchdachte Faceted Navigation kann zum Fluch eines jeden SEOlers werden. Denn wenn diese nicht korrekt umgesetzt ist, kann sie Deiner organischen Performance extrem schaden. Die facettierte Suche kann zwar zu einer Handvoll unique Pages führen, die aber wiederum können unzählige doppelte oder URLs mit wenig Inhalt (thin Content) generieren, die crawl- und indexierbar sind.

Als technical SEOs müssen wir genau darauf achten, dass wichtiger Content von den Suchmaschinen effizient indexiert und priorisiert wird. Deshalb ist Vorsicht geboten, denn Faceted Search kann enorme Auswirkungen v.a. auf Online Shops haben. Stelle also sicher, dass Du aufkommende Probleme korrekt beheben kannst und diese im besten Fall sogar vorab schon vermeidest.

Was ist Faceted Search?

Eine Faceted Search oder auch Faceted Navigation wird sehr häufig in Online Shops verwendet. Diese Methode ermöglicht Website-Besuchern, die angezeigten Ergebnisse durch eine Vielzahl von Spezifikationen wie Sortierungen oder (Produkt-)Details zu filtern – diese werden Facetten genannt.

shop-walmart

Gerade wenn Du eine große Produktauswahl auf einer Kategorieseite darstellst, ist es aus UX-Sicht durchaus sinnvoll, den Usern diese Facetten anzubieten. Dadurch können sie ihre Suchergebnisse eingrenzen und gelangen schneller zu dem von ihnen gewünschten Produkt. Sobald aber ein Filter gesetzt wird, wird an jede Kategorie-URL der dementsprechende Parameter der Facette angehängt. Dadurch wird eine eigenständige URL bzw. Version der Seite generiert. Allein durch diese Parameterkombinationen kann eine eigentlich nur 100 Seiten starke Website tausende oder millionen indexierbare URLs erzeugen.

Ein Beispiel: Meine T-Shirt-Kategorieseite izzishop.com/produkte/tshirts/ bietet den Usern einige Facetten, um die Auswahl einzugrenzen: Farbe, Style, Preis, Marke, mit Katzen-Print, Größe, Material und vieles mehr. Sobald innerhalb einer Facette eine Ausprägung gewählt wird, verändert sich die ursprüngliche URL in viele verschiedene Versionen – jede für sich eine eigenständige, indexierbare URL. Bspw.:

  1. izzishop.com/produkte/tshirts/?groesse=m

  2. izzishop.com/produkte/tshirts/?preis=0-20?katzenprint=ja?farbe=pink

  3. izzishop.com/produkte/tshirts/?style=baseball?preis=20-50?groesse=m

Manchmal kann es durchaus Sinn machen, diese Faceted Search-URLs zu indexieren, allerdings nur dann, wenn auch eine signifikante Nachfrage nach genau dieser Kombination besteht, sie dadurch einen Mehrwert bietet und genügend Produkte vorhanden sind, um diese
Kombination als eigenständige Seite zu rechtfertigen.

Wenn sich herausstellt, dass Longtail-Keywords wie bspw. “weiße sneaker größe 38” ein hohes Suchvolumen aufweisen, wäre es für Deine Domain (sofern Du diese Produkte natürlich anbietest) durchaus empfehlenswert, eine für diese Suchanfrage optimierte – d.h. sprechende – URL zu erstellen.

Aus diesem Grund sollte es Teil Deiner Strategie sein, die Performance von Faceted Search-URLs genau zu analysieren, nützliche Seiten – Longtail-Keyword-Kombinationen mit hohem Suchvolumen – mit einzubeziehen und zu optimieren. Alle anderen Parameter-URL-Kombinationen ohne Mehrwert solltest Du dann vermeiden, denn diese würden die Stärke der gesamten Domain negativ beeinflussen.

Wie beeinflusst Faceted Search Deine SEO?

Auch wenn die facettierte Suche die Benutzerfreundlichkeit für Website-Besucher und diejenigen, die nach Produkten suchen, erhöht, kann sie einige kritische Probleme für Suchmaschinen verursachen.

Eine der meist zitierten Aussagen von Google’s John Müller aus 2018 ist, dass “crawl budget is overrated…” – was (zum größten Teil) wahr ist. Viele Domainbesitzer sind deshalb besorgt und überarbeiten ihre veralteten Inhalte, aber im Großen und Ganzen gibt es nicht viel Grund zur Sorge. Dennoch kann eine Domain mit einer unordentlich aufgesetzten Faceted Search von hunderten zu millionen von URLs führen und somit einige ungewollte Probleme verursachen, wie z.B.:

  • **Duplicate Content:**Wenn Du viele Versionen ähnlicher URLs mit nur geringem Unterschied oder Mehrwert bereitstellst, ist das für Google ein Zeichen, dass Deine Website doppelte Seiten enthält. Dies kann einerseits zu einer manuellen Abstrafung führen, die wiederum drastische Traffic-Einbußen mit sich bringt. Zum anderen kann es zu Penalties durch einen Algorithmus kommen, durch dem Domains mit geringem Mehrwert und Content im Laufe der Zeit allmählich abgestraft werden.Selbst wenn Du also qualitativ hochwertige Seiten erstellst, die gut ranken sollten: Nur durch die erhöhte Anzahl an doppelten URLs, die zusätzlich vorhanden sind, kann Deine gesamte Domain schlecht abschneiden.

  • **Verschwendete Crawling Ressourcen:**Wenn Deine Facetten und ihre Kombinationen eigene URLs generieren, hinderst Du den Googlebot und andere Suchmaschinen-Bots daran, Deine Website effizient zu crawlen und die Inhalte zu priorisieren. Der Bot wird dann seine Crawling Ressourcen bei künftigen Besuchen Deiner Website limitieren. Besonders problematisch ist das für Websites, die darauf angewiesen sind, dass ihre neuen Artikel oder Produkte schnell in den Index gelangen und in den SERPs ranken.

heck-load

  • **Schwache interne Linkpower:**Unser Ziel sollte es immer sein, eine logische und starke interne Linkstruktur aufzusetzen, die die Linkpower effektiv und sinnvoll weitergibt. Faceted Search kann diese Struktur jedoch schwächen: sobald Du unnötig Linkpower an all die facettierten Seiten weitergibst.

Probleme identifizieren

1. Site Search Operator nutzen

Ein schneller Weg, um herauszufinden, ob Deine Faceted Search-URLs en masse indexiert sind, ist die Nutzung des Suchoperators und der “inurl”-Funktion mit Deinen Facettenn. Zum Beispiel:

  • site:domain.com inurl:/filter?

  • site:domain.com inurl:preis=

Falls Du dann feststellst, dann eine unbegründete Anzahl an URLs im Index ist, weißt Du, dass Du auf Deiner Website etwas fixen musst.

Nachfolgender Screenshot zeigt das Ergebnis der Site-Abfrage mit Preis-Filter-URLs der Domain von Walmart mit sagenhaften 14.000 Suchergebnissen! Unabhängig davon, ob Walmart die Indexierung all dieser URLs beabsichtigt hat oder nicht, es sollte ihr Ziel sein, diese unique und wertvoll zu gestalten – bspw. durch Hinzufügen der Filter-Label zu den Seitentiteln.

siteabfrage-walmart

2. Indexierbare Seitenduplikate schnell identifizieren

Die Verwendung von Suchoperatoren ist ein einfacher Weg, um herauszufinden, ob es hinsichtlich Faceted Search Probleme gibt. Um aber größere Probleme zu finden und zu beheben, solltest Du auf die Hilfe von Website-Crawlern wie dem von Ryte zurückgreifen.

Unser Website Success Modul verfügt über einen stabilen Crawler, der Dir durch verschiedenste Reports detaillierte Informationen gibt, damit Du sofort handeln kannst, wenn Probleme auftreten. Zum Beispiel zeigt Dir der Duplicate Content Report alle Fälle, bei denen zwei oder mehrere URLs einen hohen Prozentsatz derselben Inhalte und/oder desselben Codes aufweisen. Im Beispiel unten siehst Du, dass einige der Produkt- und Kategorieseiten von Walmart hunderte Duplikate aufweisen und zugleich indexiert sind.

duplicate-content-report-walmart-ryte

3. Keyword Kannibalisierung checken

Keyword Kannibalisierung tritt auf, sobald zwei oder mehr Seiten einer Domain sich hinsichtlich des Rankings zur selben Suchanfrage konkurrieren. In diesem Fall kann Google nicht bestimmen, welche der Seiten relevant für ein Ranking in den SERPs ist. Keyword Kannibalisierung ist auch ein Beweis dafür, dass Duplikate indexiert sind und Impressions und Klicks erzeugen.
Unser Report zur Keyword Kannibalisierung in Search Success, der die zuverlässigen Daten Deiner Search Console verwendet, gibt Dir direkten Einblick in diese Problematik, bei der eine Suchanfrage in einer hohen Anzahl an konkurrierenden Seiten resultiert. Nutze diesen Report unbedingt, um die Fälle zu identifizieren, bei denen die Seiten Deiner Faceted Search die Performance Deiner optimierten Seiten beeinträchtigen könnten.

keywordkannibalisierung

4. Server Logfiles überprüfen

Server Logfiles geben Dir Insights

  • zu den spezifischen Suchmaschinen-Bots, die Deine Website crawlen

  • welche User Agents verwendet wurden

  • und auf welche URLs zugegriffen wird.

Eine Logfile-Analyse liefert Dir Daten darüber, ob die URLs der Faceted Navigation gecrawlt werden und ob das für Dich ein großes Problem darstellt.
Allerdings ist es nicht so einfach, Logfiles zu analysieren, selbst wenn Du sie von Deinen Webmastern oder Deinem IT-Team bekommst. Bei Ryte haben wir eine fancy Lösung: “BotLogs” – damit kannst Du die Aktivitäten von Suchmaschinen-Bots einfach überwachen, ohne dass Du auf Deine Server-Logfiles zugreifen und sie analysieren musst.

Für den Index relevante Seiten identifizieren

Bevor Du Dich darum kümmerst, die URLs Deiner Faceted Search zu bereinigen, solltest Du überprüfen, ob darunter nicht doch Seiten sind, die auffindbar und indexierbar bleiben sollten. Denn über diese durch ihr hohes Suchvolumen relevanten Suchanfragen kannst Du wertvollen Traffic und Conversions erlangen.

Um im Index zu bleiben, sollten die Seiten die folgenden Anforderungen erfüllen:

  1. Eine angemessene Anzahl an Ergebnissen, die sich durch die Filterung ergeben. Ein Suchergebnis oder eine gefilterte Kategorieseite, die leer ist oder nur wenige Ergebnisse beinhaltet, wird als “thin” bewertet. Ryte Tipp: Nutze die benutzerdefinierten Crawler-Einstellungen, um die Anzahl der einzelnen Produkte pro Seite zu extrahieren und filtere dann die Seiten heraus, die eine nicht-signifikante Menge an Ergebnissen beinhalten.

  2. Die Longtail-Keywords, die die Eigenschaften der Produkte (Kombination der Facetten) enthalten, zeigen ein hohes Suchvolumen. Dies kann durch eine Keywordrecherche und/oder aktuelle Suchanfragen auf die jeweiligen Seiten (dafür kannst Du unser Search Success Modu nutzen) identifiziert werden.

  3. Einzigartig sein. Vermeide mögliche Überkreuzkombinationen (z.B. Größe 38 + rot vs. rot + Größe 38). Definiere, in welcher Reihenfolge die Facetten in der URL immer angezeigt werden sollen. Stelle sicher, dass diese Seiten zusätzlich optimiert sind, um gut zu ranken – bspw. auch durch die Nutzung von beschreibenden Titeln.

Im Idealfall stößt Du bei Deiner Recherche auch auf lukrative, stark nachgefragt Facettenseiten, die eine eigenständige Kategorieseite erhalten sollten. Bsp.: Wenn ich bei meiner Analyse feststellen würde, dass “T-Shirt mit Katzenprint unter 20 €” eine meiner meistbesuchten Facettenseiten ist, könnte ich dafür eine eigene Landingpage erstellen, um ihre interne Power zu maximieren.

Wie Du “schlechte” URLs der Faceted Search entfernst

1. Noindex-Robots Anweisungen

Wenn Du eine Website mit einer facettierten Suche erstellst, stelle sicher, dass die URLs mit angehängten Facetten standardmäßig die Meta Robots Spezifikation “noindex” enthalten. Du kannst die noindex-Anweisung alternativ auch als “x-robots”-Tag im HTTP Response Header angeben.

Hinweis: Verwende für diese Seiten keine „Disallow“-Anweisungen innerhalb der robots.txt, da dies dazu führt, dass der Crawler nicht auf die URLs zugreifen kann, um die „noindex“-Spezifikation zu erkennen. Stelle sicher, dass die noindex-Anweisung auf allen für die Faceted Search relevanten URLs, die indexiert bleiben sollen, ausgeschlossen ist

2. Nutze Canonicals

Die Nutzung eines rel=canonical, das auf die korrekte Version der URL verweist, kann Suchmaschinen-Bots dabei helfen, die richtige URL ranken zu lassen. Canonicals sind allerdings nicht immer zuverlässig bzw. als alleinige Methode nicht stark genug. Sie funktioniert am besten, wenn sie in Kombination mit der noindex-Anweisung verwendet wird.
Wenn einige Faceted Search-URLs extern verlinkt sind oder eine angemessene interne Linkpower erhalten, kann Google den von Dir angegebenen Canonical ignorieren.

Der riesige Fashion Online Shop Zalando konnte Probleme, die hinsichtlich der Facettensuche entstehen könnten, zwar weitgehend umgehen. Richtigerweise wurden die Robots-Anweisungen “noindex, follow” (“follow”, um sicherzustellen, dass die Linkpower weitergegeben wird) und der Canonical auf die Übersichtsseite der Kategorie gesetzt. Allerdings haben sie in den hreflang-Tags auf die facettierten URLs verwiesen. Das ist aus zwei Gründen schlecht: Zum einen wird auf eine nicht-indexierbare URL verwiesen und zum anderen stellen sie eine weitere erreichbare Referenz und ein Signal zu dieser Seite her.

Code-Zalando

3. Vermeide rel=”nofollow” als Vorgehensweise

Nofollow-Links wurden in der Vergangenheit zwar verwendet, um die Linkpower zu steuern, dies ist aber nicht immer eine sonderlich smarte Vorgehensweise v.a. für größere Domains mit einer komplexen Struktur. Nofollow ist in erster Linie ein Hinweis, weniger eine Anweisung. Das bedeutet, dass Google das Attribut ohnehin ignorieren kann. Des Weiteren kann es ein deutliches Zeichen für Google sein, dass die Ziel-URLs nicht vertrauenswürdig sind.
Natürlich wollen wir, dass der Googlebot unseren irrelevanten Seiten der Faceted Search keine Aufmerksamkeit schenkt, aber für Website-Besucher halten wir sie dennoch wertvoll.

Nutze diese Facetten mit Bedacht!

Faceted Search hat die Kraft, eine ausgewählte Menge an URLs zu vervielfachen, was zu manuellen oder Algorithmus-basierten Abstrafungen seitens Google, enormen Rankingverlusten sowie Traffic-Einbußen der gesamten Domain führen kann.

Vergewissere Dich, dass Du richtigen Maßnahmen verwendest, um alle irrelevanten, indexierten Seiten der Faceted Search zu identifizieren und entsprechend zu beseitigen. Damit stellst Du sicher, dass Deine wichtigen Seiten so performen wie sie es auch sollten.

Optimiere Deine SEO-Performance mit Ryte

Veröffentlicht am Mar 20, 2020 von Izzi Smith