Soft 404-Fehler
Ein Soft 404-Fehler tritt auf, wenn ein Nutzer eine nicht existente oder fehlerhafte Website mit seinem Browser anfordert und der Server fälschlicherweise einen "200 Ok" oder "302 Found" HTTP Status Code an den Klienten (Browser) sendet. Der Nutzer bekommt einen 404 Fehlercode am Bildschirm angezeigt, aber der Server sendet einen anderen Antwortcode bei der Kommunikation zwischen Klient und Webserver. Der Content der Website steht in keinem Zusammenhang mit der HTTP-Antwort des Servers.
Dies kann Auswirkungen auf das Crawling und die Indexierung der angeforderten Website haben. Zudem ist es für den Nutzer mitunter frustrierend, weil die Antwort des Servers nicht zu seiner Suchanfrage passt. Ähnliche Bezeichnungen für einen Soft 404-Fehler sind falscher 404- oder weicher 404-Fehlercode.
Allgemeine Informationen zum Thema
Üblicherweise sendet ein Server immer dann einen "404 Not Found" Fehlercode, wenn eine angeforderte Website nicht oder nicht mehr auf dem Server vorhanden oder die URL fehlerhaft ist. Dies kommt häufig vor, wenn eine Ressource auf dem Server an einem anderem Ort gespeichert wird – die Inhalte also umgezogen wurden – und die internen Links, die auf die Ressource verweisen, nicht geändert wurden. Zeigen externe Links auf eine nicht mehr vorhandene Ressource, kann auch ein 404-Fehlercode dargestellt werden. Man spricht von toten Links. Wurde eine korrekte URL vom Nutzer verändert, sendet der Server ebenfalls einen 404-Fehlercode.
Der Soft 404 unterscheidet sich von diesen Fällen dadurch, dass der Server mit einem HTTP Status Code wie 200 oder 302 antwortet, obwohl die Website nicht mehr vorhanden ist und dementsprechend eigentlich ein 404er die richtige Antwort wäre. Der Server interpretiert eine fehlerhafte oder ungültige URL als korrekte Adresse und leitet beispielsweise auf die Startseite um.
Da der Server nicht nur dem Browser den Status Code schickt, sondern auch den Crawlern von Suchmaschinen, können Komplikationen entstehen. Der Crawler arbeitet die Links, die ihm zur Verfügung stehen, nach und nach ab. Liest er eine Website aus, die nicht mehr vorhanden ist und dennoch einen 200 oder 302-Antwortcode mitgibt, behandelt er diese Ressource als normale Website mit Content. Dies kann dazu führen, dass er andere Websites der gleichen Domain nicht mehr besucht und crawlt, da er für jede Website im World Wide Web nur eine begrenzte Zeit aufwendet. Er crawlt also Ressourcen, die keinen sinnvollen Content bereitstellen – und dem Nutzer wird Content dargestellt, den er nicht angefragt hat.
Soft 404-Fehler beheben
In der Google Search Console, den ehemaligen Google Webmaster Tools, werden sogenannte Crawling-Fehler unter dem Menüpunkt Diagnose aufgelistet. Falls hier Soft 404-Fehler notiert sind, können folgende Schritte unternommen werden.[1]
- Wenn Soft 404 Fehler aufgelistet sind, sollte die entsprechende URL überprüft werden.
- Wenn sie den korrekten Content enthält, sollte die Website einen 200 Ok Code ausgeben.
- Wenn mit einem 301 Fehlercode geantwortet wird, sollte eine Umleitung auf eine besser geeignete Website erfolgen.
- Wenn unter der URL keine Website existiert, sollte ein 404 oder 410 Code im Header der Website ausgegeben werden.
Es ist enorm wichtig, dass der Server den richtigen HTTP Code für eine Anfrage des Nutzers ausgibt. Mitunter kann eine Website deindexiert werden, wenn dies nicht der Fall ist.
Addons wie Firebug oder die Funktion "Abruf wie durch Google" sind ebenfalls nützlich: Auf diese Weise sieht der Webmaster, wie die HTTP-Kommunikation zwischen Klient und Server abläuft und wie der Googlebot die Website ausliest. Bei beiden Varianten werden die HTTP Status Codes angezeigt. Ein Vergleich mit der Website, die durch den Browser aufgerufen wird, offenbart notwendige Veränderungen. Bei den Bing Webmaster Tools kann dieser Vorgang im Index Explorer unter dem Menüpunkt 404 Fehler erfolgen.
Idealerweise wird nur für fehlerhafte URLs oder nicht vorhandene Websites ein 404-Fehlercode ausgegeben. Empfehlenswert sind zudem personalisierte 404-Fehlerseiten, um Nutzern eine Alternative für den angefragten Content anzubieten und sie als Besucher auf der Website zu halten. Eine gute 404-Fehlerseite
- gibt den richtigen Statuscode aus,
- beinhaltet eine kurze Information für den Nutzer,
- bietet dem Nutzer eine Möglichkeit, auf der Website zu navigieren,
- schlägt ihm Seiten mit ähnlichen Inhalten vor,
- und enthält eine Suchfunktion, damit der Nutzer nach Schlagworten suchen kann.[2]
Anstieg von Soft 404 Fehlern im Jahr 2021
Bereits im April 2021 war die Drogeriemarktkette Rossmann betroffen. Nachdem die Website des Unternehmens zuvor starke Zuwächse erfahren hatte, sackten diese nach Ostern unerwartet stark ab. Die Sichtbarkeit ging also aus nicht nachvollziehbaren Gründen zurück.
Seit dem 15. April ging die Sichtbarkeit wieder hoch, Google hatte das Problem der Soft 404 Fehlern untersucht und zeitnah behoben. Was genau Google zur Problembehebung getan hatte, wollte das Unternehmen nicht kommunizieren, da laut eigener Aussage nur wenige Websites davon betroffen waren.
Im Jahr 2021 gab es allerdings vermehrte Meldungen über Soft 404 Fehler. Google räumte damals ein, dass dies auch passieren könnte, wenn Hinweise im Quellcode von Websites, die auf Ergebnisse schließen lassen, die nicht verfügbar sind, auf den entsprechenden Websites nicht angezeigt wurden.
Nachdem eine Kalkulator-Seite, die durch einen Hinweis auf nicht verfügbare Ergebnisse hingewiesen hatte, betroffen war, entschied Google, einer der zuvor genutzten Klassifikatoren zu deaktivieren.
404 Fehler nach Seitenumzug
Sollte eine bisher bestehende Seite entfernt worden bzw. umgezogen sein, ist es ratsam, den Status-Cod „404“ (Seite nicht gefunden) oder „410“ (Seite nicht mehr vorhanden) anzugeben. So wird den Suchmaschinen mitgeteilt, dass es die Seite in dieser Form nicht mehr gibt und der Inhalt deindexiert werden soll.
Sofern ein Zugriff auf den Server besteht, kann die Fehlerseite so angepasst werden, dass Sie Nutzern, die den Fehlercode erhalten, weitere Informationen liefert. Folgende Punkte sollten dabei beachtet werden:
- Den Seitenbesuchern sollte mitgeteilt werden, dass die gewünschte Seite nicht gefunden wurde. Dabei sollten freundliche und lösungsorientierte Formulierungen verwendet werden.
- Die 404-Seite sollte sich vom Rest der Website nicht unterscheiden, also dasselbe Design und dieselbe Bedienung enthalten.
- Unbedingt sollte ein Link zur Startseite hinzugefügt werden, um den Besucher zu halten. *Sinnvoll können unter Umständen auch meistgelesene Beiträge sein.
Um die Beziehung zum Nutzer zu erhalten, kann man die Möglichkeit bieten, fehlerhafte links zu melden.
Bedeutung für die Suchmaschinenoptimierung
Beim Redesign einer Website, bei der Content Migration oder bei saisonalen Aktionen können verschiedene Fehlercodes auftreten. Insbesondere bei großen Projekten können Tausende Fehlercodes entstehen. Doch auch nicht mehr verfügbare Produkte und sogar Websites mit sehr wenig Content (Thin Content) können zu weichen 404-Fehlercodes führen.[6] Die Auswirkungen sind enorm: Suchmaschinen können die betroffenen Websites aus dem Index nehmen, wodurch bei kommerziellen Projekten Umsatzrückgänge verzeichnet werden können. Nutzer sind mitunter frustriert und die Kosten für die Behebung der Probleme sind umso größer, desto mehr Fehlercodes ausgegeben werden.
Empfehlenswert ist eine regelmäßige Kontrolle von eventuellen Fehlermeldungen. Sie lassen sich zwar nicht ganz vermeiden, aber zumindest in ihrer Anzahl gering halten. Sobald die Fehlermeldungen behoben wurden, sollte dies der jeweiligen Suchmaschine in den Webmaster Tools mitgeteilt werden, damit der Crawler die Website mit dem korrigierten Fehlercode zeitnah auslesen kann. Die Ergebnisse solcher Änderungen können sich indirekt auf den Traffic auswirken, wenn Google bestimmte Websites mit Soft 404-Fehlern entweder deindexiert oder im Ranking herunterstuft. Dies kann geschehen, wenn das Verhältnis zwischen Soft 404-Fehlern und indexierten Websites außerordentlich hoch ist. Das zeitliche Budget für den Crawler wird dann durch die Soft 404er Websites zu einem großen Teil aufgebraucht.[7]
Einzelnachweise
- ↑ Webmaster-Tools: Crawling-Probleme auf Grund von "weichen 404s" vermeiden googlewebmastercentral-de.blogspot.de. Abgerufen am 02.06.2015
- ↑ 404 und Soft-404: Wirklich alles was du über den Fehler-Statuscode wissen musst seo-book.de. Abgerufen am 02.06.2015
- ↑ deutliche rankingverluste durch soft 404 fehler bei google fallbeispiel seo-suedwest.de. Abgerufen am 17.09.2021
- ↑ anstieg von soft 404 fehlern google hat einen klassifikator deaktiviert seo-suedwest.de. Abgerufen am 17.09.2021
- ↑ soft 404 errors developers.google.com. Abgerufen am 17.09.2021
- ↑ Über Thin Content und Soft-404 in den Webmaster Tools mindshape.de. Abgerufen am 02.06.2015
- ↑ What Are ‘Soft’ 404 Errors and Will They Affect My Rankings? hallaminternet.com. Abgerufen am 02.06.2015
Weblinks
- Definition Soft 404-Fehler
- Was ist ein Soft 404-Fehler?
- Soft 404er einfach erklärt
- Falsche 404-Fehler
- 404 Errors: Soft vs. Hard