“404 - Seite nicht gefunden“ – wer kennt diesen Satz nicht? Man sucht nach einer bestimmten Information und plötzlich erscheint diese Meldung.
Fehlerseiten erzeugen in mehrfacher Hinsicht negative Effekte: Neben hoher Frustration beim User senden sie außerdem schlechte Signale an Suchmaschinenbots. Dieser Artikel zeigt Dir, wie Du 404 Seiten schnell identifizieren und bearbeiten kannst, um Deine Webseite sowohl für Suchmaschinen als auch für Besucher ins rechte Licht zu rücken.
Eine der häufigsten Ursachen für die Nicht-Erreichbarkeit einer Seite ist das Entfernen einer URL seitens des Webseitenbetreibers. Dies passiert in den meisten Fällen sogar ungewollt und unbemerkt. Auch Content Management Systeme sind ein anschauliches Beispiel für das unbewusste Erzeugen von 404 Seiten. In vielen Fällen generieren CMS aus dem Title der Seite automatisch die entsprechende URL. Wird der Title der Seite angepasst, so wird die Änderung auf auf die URL übertragen und es entsteht eine neue URL. Eine 404 Seite wird dann erzeugt, wenn das CMS beim Aufruf der ursprünglichen URL nicht auf die neue URL weiterleitet.
Eine weitere Entstehungsquelle für 404 Seiten ist der Webseiten Relaunch. Hier ist besondere Aufmerksamkeit gefordert, wenn neben den Inhalten und dem Erscheinungsbild der Webseite auch neue URL Strukturen implementiert werden. Fehlerseiten entstehen oft, weil aus Ressourcengründen keine oder nur die wichtigsten Seiten auf die neue URL weitergeleitet werden. Häufig wird im Zuge dessen auch vergessen bereits bestehende Weiterleitungen zu übernehmen. Außerdem geht wertvoller Linkjuice verloren, wenn externe Referenzen auf 404 Seiten verlinken.
Webseiten mit einer hohen Anzahl an 404 Seiten erhöhen den Crawling Aufwand für Suchmaschinenbots und steigern das Risiko, dass wichtige Inhalte durch die interne Linkstruktur nicht mehr erreicht werden können. Ganz abgesehen von der negativen User Experience, die dem Webseitenbesucher dadurch geboten wird.
Abbildung 1: Die Anzahl der Fehlerseiten übersteigt die Anzahl der Index-relevanten URLs
Mithilfe von Ryte Website Success kann man anhand weniger Klicks alle vom Bot gefundenen 404 Seiten der eigenen Webseite identifzieren. Dafür wählt man einfach im Modul Website Success den Report "Indexierbarkeit" → "Status Codes" aus und klickt auf den Bereich 4xx Status Codes.
Abbildung 2: 404 Seiten mit Website Success identifizieren
Möchte man das Problem jedoch an der Wurzel packen, benötigt man die eingehenden Links der 404 Seiten. Diese lassen sich genauso leicht über den Report "Links" → "Link Übersicht" → "Liste aller Links" ausgeben.
Um aus einer Aufzählung aller Links eine Liste der internen 404 Seiten zu erhalten, werden zwei Filter benötigt. Dafür klickt man auf den grünen "Neuer Filter"-Button, wählt die Option "Ist lokale Datei?" aus und setzt die Option auf "lokale Datei".
Abbildung 3: Filter zum Anzeigen von lokalen Dateien erstellen
Das Ergebnis dieses Filters ist eine Liste aller Links auf interne Linkziele. Diese muss nun mithilfe eines weiteren Filters auf die fehlerhaften Seiten beschränkt werden. Über den "neuer Filter"-Button lässt sich dieser einfach hinzufügen. Man wählt hierfür die Option "Header Status (Ziel)" und wählt als Operator "ist" "404" aus.
Abbildung 4: Filter zur Darstellung aller 404 Seiten
Nachdem die beiden Filter erfolgreich erstellt und angewendet wurden, erhält man eine Liste aller internen 404 Seiten inklusive der eingehender Links.
Abbildung 5: Liste aller internen 404 Seiten inklusive deren eingehender Links
Tipp: Verknüpft man Ryte mit Google Analytics, werden zusätzlich alle URLs aus Analytics vom RyteBot geprüft. So hat man die Möglichkeit potentiell mehr 404 Seiten zu identifizieren und erhält eine Übersicht, wie viele Besucher eine URL in den letzten 30 Tagen verzeichnen konnte. Dadurch können 404 Seiten entsprechend ihres Traffics priorisiert und behoben werden.
Die Google Search Console (ehemals Google Webmaster Tools) liefert viele nützliche Daten über die eigene Domain. Unter "Crawling Fehler" (1) → "Nicht gefunden" (2) öffnet sich eine Liste von URLs, die beim Crawl nicht identifiziert wurden. Durch einen Klick auf die entsprechende URL erscheinen weitere Informationen zur Verlinkung der Seite.
Abbildung 6: 404 Seiten in der Google Search Console identifizieren
Tipp: Ein Blick auf die Soft 404 Seiten (3) lohnt sich. Hier handelt es sich um fehlerhafte oder nicht existierende URLs, die jedoch den Status Code "200 OK" oder "302 Found" ausliefern.
Google listet in der Search Console alle 404 Seiten auf, die aktuell existieren oder zu einem früheren Zeitpunkt existiert haben. Bei der Auswertung der 404 Seiten sollte man deshalb vor allem auf das Datum der fehlerhaften Seiten achten und überprüfen, ob die Seite noch existieren.
Um auf Webseitenebene 404 Seiten verwalten zu können, sollte der Server zunächst konfiguriert werden. Dies erreicht man beispielsweise über einen Eintrag in der .htaccess Datei. Dafür wird folgender Inhalt eingefügt:
ErrorDocument 404/404.php
Beachte, dass in dieser .htaccess Zeile der Domainname nicht verwendet werden darf. Suchmaschinen würden dies sonst als Soft 404 Fehler interpretieren.
Nach der erfolgreichen Prüfung der 404 Seiten sollte anschließend entschieden werden, wie mit den entsprechenden Seiten verfahren werden soll.
Eine Weiterleitung bietet sich für diejenigen 404 Seiten an, zu denen es thematisch passende, relevante Seiten gibt, um so dem User ähnliche Informationen anzubieten. Für die interne Verlinkung bedeutet ein Redirect auch die Weitergabe von wertvollem Linkjuice.
Bis vor kurzem haben nur 301 Weiterleitungen Linkjuice weitervererbt. Google hat dies inzwischen geändert und offiziell bestätigt, dass nicht mehr zwischen 302 und 301 Weiterleitungen unterschieden wird und beide Lösungen Linkjuice weitervererben.
Auch wenn die Vererbung von Linkjuice mithilfe einer Weiterleitung verlockend erscheint, gibt es durchaus 404 Seiten, die als solche gekennzeichnet werden sollten. Dies betrifft vor allem Seiten, deren Inhalt dauerhaft entfernt wurde und für welche ein Redirect nicht in Frage kommt, da es keine ähnlichen Seiten zur Weiterleitung gibt.
In diesen Fällen sollten die Seiten den Status Code "404 not found" oder "410 gone" ausspielen um dem User zu signalisieren, dass der gesuchte Inhalt nicht mehr existiert.
Ist die Verwendung einer 404 Seite notwendig, sollte man einige grundlegende Elemente auf der Seite bereitstellen.
Diese umfassen einen Hinweis darauf, dass die ursprüngliche Seite nicht mehr vorhanden ist, sowie die Möglichkeit auf der Webseite weiter navigieren zu können, um den User nicht zu verlieren. Im Optimalfall bietet man dem Besucher direkt Seiten mit ähnlichen Inhalten an, um ihm die Suche nach Informationen zu erleichtern. Gibt es keine ähnlichen Inhalte, kann man den User beim Navigieren durch das Bereitstellen einer Suchfunktion unterstützen.
Abbildung 7: Fehler Seite ohne Navigation und Hilfestellung für den User
Technisch gesehen ist es wichtig, dass diese Seiten den korrekten Status Code 404 oder 410 ausspielen, damit es nicht zur Entstehung von Soft 404 Fehlern kommt.
Abbildung 8: Beispiel einer gut umgesetzten 404 Seite mit weiterführenden Infos für den User
404 Seiten sind aufgrund ihrer negativen Effekte auf Suchmaschinen und User auf ein Minimum zu reduzieren. Sofern ähnliche Inhalte zur fehlerhaften Seite bestehen, empfiehlt sich eine dauerhafte 301-Weiterleitung auf themenrelevante Seiten.
Ist eine 404 Seite jedoch unumgänglich, weil deren Inhalt dauerhaft entfernt wurde, sollte die fehlerhafte Seite einen korrekten Status Code 404 oder 410 zurückliefern. Neben einem Hinweis für den User, weshalb die Seite nicht aufgerufen werden kann, sollten ihm zudem nützliche Informationen und Navigationsmöglichkeiten geboten werden.
Jetzt 404 Seiten identifizieren und bekämpfen mit Ryte FREE
Veröffentlicht am 02.08.2016 von Stephan Walcher.
Stephan Walcher ist seit 2007 im Bereich Online Marketing mit Schwerpunkt SEO aktiv. Nach seinen Stationen als Inhouse SEO Specialist für MSN und Bing, als Head of SEO Consulting bei der Online Marketing Agentur Catbird Seat GmbH, als Senior SEO Manager bei der 1&1 Mail & Media GmbH und als Head of Product Management bei Ryte, verstärkt er seit Januar 2017 als Team-Leader Travel SEO die One Advertising AG.
Sichere Dir 10 Tage lang, kostenfreien und vollen Zugang zur gesamten Ryte Plattform.
Starte Dein Trial