User Agent
Der User Agent oder auch Agent ist die Kennung bzw. der Name, mit dem sich ein Programm beim Webserver anmeldet, um ein Dokument anzufordern. Der Name wird durch den HTTP-Header übermittelt. Software-Programme und Suchmaschinen-Robots können durch diesen Namen identifiziert werden.
Mithilfe des User Agents kann man genau erkennen, wann ein Suchmaschinen-Robot die Webseite besucht hat, kann es hilfreich für die Auswertung von Logfiles sein. Dadurch, dass der Name frei gewählt werden kann, ergibt sich das Problem, dass sich Robots auch als andere User Agents tarnen können. Das ermöglicht dem Roboter beispielsweise das Identifizieren von Spam-Webseiten. Ein Bot mit falscher Kennung kann eine Webseite inkognito überprüfen, da der Webserver diesen nicht als Suchmaschinen-Bot, sondern als normalen Browser identifiziert.
Funktionsweise
Möchte ein Browser auf eine Webseite zugreifen, teilt das Programm dem Dokument bei der Anfrage mit, welcher User Agent dabei verwendet wird (Agent Name Delivery). Die Kennung des User Agents besteht aus einer Zeichenkette verschiedener Informationen. Diese enthalten das Betriebssystem sowie die Version des Betriebssystems oder den Produktnamen.
Wird während diesem Prozess vom Programm zum Beispiel die Identifikation
Mozilla/5.0 (Windows;U;Windows NT 5.1;de-DE; rv; 1.7.6) Gecko/20050226 Firefox/1.0.1
angegeben, bedeutet das, dass der User einen Mozilla Firefox der Version 1.0.1 unter dem Betriebssystem Windows XP mit deutschem Sprachpaket verwendet. Man kann zudem herauslesen, dass der Anwender den Render-Engine Gecko der Version 1.7.6, welcher am 26. Februar 2005 veröffentlicht wurde, benutzt.
Arten der User Agents
- Webbrowser: Webbrowser sind Programme die man verwendet, um im Internet zu surfen. Sie ermöglichen das Betrachten und Ausführen von Webseiten, Grafiken oder Applets. Beispiele für Webbrowser sind der Internet Explorer, Safari, Mozilla Firefox oder Opera.
- Webapplications: Hierbei handelt es sich um Programme, die zur Content-Pflege, Kommunikation oder Ausführung von Dateien benutzt werden, wie zum Beispiel Streaming- (Beispiel: Spotify) und Videoclients, der Flash-Player oder der Adobe Acrobat Reader.
- Spider (Crawler): Bezeichnet Programme von Suchmaschinen, die dazu dienen das Internet regelmäßig nach neuen Informationen und Änderungen von Dokumenten zu durchsuchen.
Fazit
Damit Suchmaschinen einem User Suchergebnisse anzeigen können, muss das Web täglich nach Inhalten durchsucht werden. Die Webserver können jedoch nicht unterscheiden, ob ein Mensch oder ein Suchmaschinen-Robot eine Webseite besucht. User Agents helfen dem Webserver zwischen menschlichem Benutzer und Suchmaschinen-Robot zu unterscheiden.
Weblinks