Logfile Analyse


Die Logfile Analyse ist Bestandteil von Technical SEO. Mit ihrer Hilfe lassen sich Statistiken über Seitenzugriffe oder Kennzahlen über die Nutzung einer Website bzw. eines Webservers erheben. Als Basis für die Logfile Analyse dienen die sogenannten Logfiles, die ausgelesen werden. Heute hat das von Analyse-Tools verwendete, JavaScript-basierte sogenannte Page Tagging in vielen Fällen die herkömmliche Analyse der Logfiles abgelöst.

Funktionsweise von Logfile Analysen

Bei der Logfile Analyse werden Logs (Aufzeichnungen) von Webservern dazu benutzt, das Crawling-Verhalten von Suchmaschinen zu messen und so potentielle SEO-Probleme und -Optimierungsmöglichkeiten aufzudecken. Mit jeder HTTP-Anfrage an eine Website oder eine Datei (zum Beispiel ein JPEG, eine CSS oder JavaScript-File), werden Request-Header an den Client-Server oder Browser geschickt, der die Website anfordert. Darin ist auch der HTTP Status Code enthalten. Diese Request-Logs werden auf den meisten Webservern aufgezeichnet und eine Zeit lang gespeichert – wie lange hängt in der Regel davon ab, wie viel Traffic der Server verzeichnet und wie schnell sich Log-Daten ansammeln. Diese Header weisen den User Agent aus, der den Content anfordert und beinhalten Details über dessen Eigenschaften. Diese wiederum nutzen Server, um den passenden Code und Content an den Client oder Browser zu schicken. Suchmaschinen benutzen automatische Crawler (auch: Bots), um Content zu entdecken, zu rendern und zu indexieren. Die dazu gehörigen User Agents (Google User Agent, Bing User Agent) können die Crawler identifizieren.

Logfile Analysen für SEO konzentrieren sich vorrangig auf das Crawling-Verhalten der Suchmaschinen-Bots und schließen andere User Agents üblicher Weise aus.

Auswertung von Logfiles

Jedes Mal, wenn ein User oder ein Crawler eine Website aufruft, wird für jedes Element, das geladen wird, in den Logfiles ein Eintrag gemacht. In den Logfiles wird registriert, wie genau User, Suchmaschinen- und andere Crawler mit der Website interagieren.

Die Logfile Analyse ist grundsätzlich manuell durchführbar. Bei umfangreichen Websites ist sie jedoch sehr zeitintensiv.

Bevor man die Logfiles einer Website analysieren kann, muss man zunächst eine Kopie davon vom Webserver herunterladen. Üblicher Weise erhält man über einen sogenannten FTP-Client Zugriff auf die gespeicherten Logfiles.

In-Depth-Analysen von Logfiles, speziell bei umfangreichen und Traffic-starken Webseiten, sind sehr aufwändig und setzen fundierte Technical SEO-Kenntnisse voraus. Schneller funktioniert die Logfile Analyse mit dezidierten Tools oder Softwares.

Diese Tools erfordern maximal den Upload der Logfile-Kopie. Sie geben dann Reports mit zum Beispiel folgenden Insights aus:

  • Wie viele Requests verschiedene Suchmaschinen-Bots jeden Tag an die Website schicken.
  • Die verschiedenen HTTP-Status Codes pro Tag.
  • Welche Datei-Arten jeden Tag gecrawlt werden.

Diese Informationen können sowohl seitenweit, als auch für einzelnen URLs abgerufen werden.[1]

Bestandteile der Logfile Analyse

Die Logfile Analyse kann grundlegende Kennzahlen über die Nutzer einer Website aufschlüsseln:

  • IP-Adresse und Hostname
  • Herkunftsland, -region
  • Verwendeter Browser und verwendetes Betriebssystem
  • Direkter Zugriff des Nutzers oder Verweis von anderer Website oder Werbemaßnahme
  • Art der Suchmaschine und eingegebenes Suchwort
  • Verweildauer und Anzahl der Seiten, die der Nutzer aufgerufen hat
  • Seite, auf der der Nutzer die Website wieder verlassen hat

Vorteile und Nachteile der Logfile Analyse

So wie jede Art des Trackings, hat auch die Logfile Analyse ihre Vor- und Nachteile.

Vorteile einer Logfile Analyse gegenüber JavaScript: Logfiles sind von vornherein verfügbar. Es ist also sinnvoll, diese Informationen direkt zu nutzen. Logfiles beinhalten sowohl Informationen über Suchmaschinen-Crawler und Spam-Bots, als auch statische Informationen über Bilder oder CSS. Außerdem geben sie Aufschluss über Requests von Usern, die zum Beispiel Adblocker nutzen. Eine Logfile Analyse erlaubt auch dann das Speichern von Daten, wenn Besucher JavaScripts nicht ausführen oder wenn in bestimmten Website-Bereichen JavaScript nicht unterstützt wird.

Vorteile von JavaScript Tracking gegenüber Logfile Analysen: Javascript Tracking ist hoch individualisierbar. Es wird nur einmalig pro Seite ausgeführt. So wird gewährleistet, dass die Daten so genau wie möglich sind. Zudem ist das Setup oftmals einfacher als eine Logfile Analyse. Kommen zusätzlich Cookies zum Einsatz, ist eine detailliertere Analyse, etwa von Unique Visitor Metriken, möglich und JavaScript erlaubt die Analyse personalisierter Events, E-Commerce-Tracking, Heatmaps, Sitzungsaufzeichnungen, Medien-Analyse usw.

Im Idealfall ergänzen sich beide Analyse-Methoden, sodass die Daten aus den Logfiles die Daten aus dem JavaScript Tracking anreichern.

Vorteile der Logfile Analyse

Eine Analyse von Logfiles bietet folgende Vorzüge[2]:

  • die Neuordnung von historischen Daten
  • Zugriffszahlen bleiben innerhalb des eigenen Netzwerks
  • Messung abgebrochener Downloads
  • Firewalls behindern das Protokoll nicht
  • automatische Protokollierung von Crawlern
  • kein JavaScript oder Cookies notwendig
  • einfache Aufbereitung mit herkömmlichen Datenverarbeitungsprogrammen wie Excel

Nachteile der Logfile Analyse

Die Nachteile der Logfile Analyse[3]:

  • Caching und Proxys
  • regelmäßige Updates nötig
  • zusätzlicher Speicheraufwand
  • aufwändige Datenaufbereitung bei großen Datenmengen
  • kein Tracking von Widgets oder AJAX
  • ungenaue Zuordnung von Visits wenn User eine dynamische IP-Vergabe beim Surfen verwendet
  • weniger Daten im Vergleich zu Webanalysetools

Praktischer Nutzen für SEO

Mit Hilfe der Logfile Analyse haben SEOs die Möglichkeit, relevante Besucherdaten selbst auszuwerten und aufzubereiten. Die serverseitige Speicherung grundlegender Daten gewährleistet, dass keine Daten an externe Dienstleister übergeben werden. So können Datenschutzprobleme umgangen werden.

Allerdings sind die Möglichkeiten zur Analyse beschränkt, weshalb die Logfile Analyse nicht als alleinige Methode zur Besucheranalyse, sondern als Ergänzung bzw. als Prüfinstrument zu gängigen Analyse-Tools wie Google Analytics verwendet werden sollte.[4]

Bei größeren Websites ist die Analyse von Logfiles zudem mit der Verarbeitung sehr großer Datenmengen verbunden, was langfristig eine leistungsfähige IT-Infrastruktur erforderlich macht.

Einzelnachweise

  1. Logfiles analysieren mit den Tools von Elastic Stack Adacor Blog. Abgerufen am 26. November 2021
  2. Logfile-Analyse – Auswerten was Google wirklich crawlt OnlineMarketing.de. Abgerufen am 26. November 2021
  3. Nachteile von serverseitigen Logfileanalysen Blog „Markt- und Mediaforschung der FH St. Pölten. Abgerufen am 26. November 2021
  4. Logfile-Analyse: So werten Sie aus, was Google crawlt Hubspot. Abgerufen am 26. November 2021

Weblinks