Google Data Center


Die Google Data Centers sind die wichtigsten Teile der Infrastruktur von Google. Die Rechenzentren geben täglich Milliarden von Webseiten aus und ebenso viele Antworten auf Suchanfragen aus allen Teilen der Welt.

Jede Suchanfrage auf der Google Startseite verwendet Daten, die in mindestens einem der vielen Rechenzentren gespeichert sind. Gibt ein Nutzer einen Begriff in die Google-Suche ein, erhält er binnen weniger Sekunden eine Suchergebnisliste. Die Webadressen, Beschreibungen und letztendlich auch die Reihenfolge der Webadressen, die hier angezeigt werden, sind in den Rechenzentren von Google hinterlegt und strukturiert.

GoogleDataCenter.png

Google Data Centers verteilen sich über den gesamten Globus. Bestätigte Standorte sind beispielsweise Lenoir (North Carolina, USA), Mountain View (California, USA) oder Dublin (Irland). Aktuell investiert der Konzern in den Bau und Ausbau internationaler Standorte wie Berlin, Paris, London oder Tokyo. Dennoch hält sich das Unternehmen bedeckt, wenn es um tiefer gehende Informationen zu den Data Centers geht. Lediglich Fotos von den offiziellen Rechenzentren werden veröffentlicht. Der Grund ist darin auszumachen, dass Google die eigene Infrastruktur als Wettbewerbsvorteil gegenüber Konkurrenten sieht.[1]

Funktionen

Meist werden die internationalen Data Centers dazu verwendet, die länderspezifischen Versionen von Google bereitzustellen oder neue Kapazitäten durch Network Peering zu schaffen. Beim Network Peering werden Rechenzentren verbunden, um einen Datenaustausch von gleichwertigen Netzwerken zu ermöglichen. Prinzipiell ist es wenig sinnvoll, eine Suchanfrage aus Deutschland in die USA weiterzuleiten.

Gemäß einer CDN-Architektur (content delivery network; deutsch: Netzwerk zur Zustellung von Inhalten) können solche Suchanfragen schneller und zuverlässiger beantwortet werden, wenn die beteiligten Server sich im gleichen Land befinden. Es ist wahrscheinlich, dass Google seine internationalen Rechenzentren auf regionale Suchanfragen aus spezifischen Ländern ausgelegt hat. Dafür spricht auch der seit 2012 von Google verwendete regionale Index, der bei Suchanfragen aus einer bestimmten Stadt in einer spezifischen Sprache vermehrt Websites aus dieser Region anzeigt.

Die Technik, die zum Einsatz kommt, ist von Google selbst entwickelt worden. So verwendet Google spezielle Netzgeräte, welche die Effizienz steigern und mit einer Batterie kombiniert sind, um die ständige Erreichbarkeit der Server sicherzustellen. Die Stromversorgung geschieht mitunter über erneuerbare Energien, die Google massiv fördert. Darüber hinaus nutzt Google verschiedene Software-Lösungen, welche die riesigen Massen an Daten verarbeiten sollen. Zu nennen wären hier das Google File System und BigTable, die eigens für große Datensätze optimiert wurden und die Ressourcen von mehreren Rechenzentren nutzen können. Auch Google Web Server (GWS) und Google Front End (GFE) sind auf Google Data Centers eingebunden. Genauso wie MapReduce, ein Programmiermodell, das parallele Berechnungen für extrem große Datenströme durchführen kann. Alle Programme und Systeme, die in Google Data Centers verwendet werden, sind proprietär, also urheberrechtlich geschützt.

Bedeutung für SEO

In der Suchmaschinenoptimierungen kursieren des öfteren Listen mit den IP-Adressen der Google-Server. Gerade wenn eine Aktualisierung des Indexes ansteht, ist die Bestimmung der Position einer Website sinnvoll. So können SEOs abschätzen, an welcher Stelle ihre Website im Suchindex nach der Aktualisierung zu finden ist. Dafür muss allerdings der Weg einer Suchanfrage bis hin zum Server verfolgt werden, was mit einigem technischen Aufwand verbunden ist. Mehr noch: Google ändert regelmäßig die Adressen der Server. Eine aktuelle Liste kann nach einigen Wochen schon veraltet sein.

Zudem kommt es oft vor, dass eine bestimmte Website plus Keyword bei verschiedenen Rechenzentren einen unterschiedlichen PageRank zugeordnet bekommt. Bei der Analyse von Daten ist es von Interesse zu wissen, von welchem Data Center welcher PageRank ist. Meist sind die IP-Adressen nach sogenannten Clustern bzw. C-Class Netzwerken sortiert. Sowohl Websiten von Anwendern als auch Googles Seiten können innerhalb (und außerhalb) eines C-Class Netzwerkes eingehender auf ihren PageRank hin analysiert werden. So erhalten SEOs wertvolle Daten über die Position eines Keywords und der entsprechenden Domain im Suchindex eines spezifischen Rechenzentrums von Google.

Einzelnachweise

  1. Google Data Center FAQ. Data Center Knowledge. Abgerufen am 21. November 2013.

Weblinks