« Zurück zum Magazine

Entitäten verstehen – mit der Knowledge Graph Search API

Entitäten. Zugegeben, ein schwer greifbares Thema, das jedoch jedem SEO ein Begriff sein sollte. Aber was verbirgt sich dahinter? Genau darum geht es in diesem Artikel: mit welchen Updates die Entitäten ihren Einzug in die SEO-Welt fanden und wie jeder sie über die sogenannte Knowledge Graph Search API ganz einfach abrufen kann.

Wie so oft hilft ein Blick in die Vergangenheit, um die Bedeutung der Entitäten für die Suchmaschinenoptimierung von heute und morgen zu verstehen. SEO ist eine vergleichsweise junge Disziplin. Über 20 Jahre sind vergangen, seitdem Google im Jahr 1998 an den Start ging. Der Erfolg war rasant. Zu rasant, um mit einer findigen SEO-Szene mitzuhalten, die schnell passende Hebel für die gewünschten Rankings fand.

Links sind das wichtigste Signal? Kein Problem, dafür gab es ja Linkfarmen. Keyword-Stuffing und eine Landing Page pro Longtail-Keyword funktioniert? Wunderbar, denn günstiger Content mit der gewünschten Keyword-Dichte ist leicht zu besorgen.

Das war einmal. Die Zeiten sind vorbei, in denen Webseiten für die Suchmaschine – und nicht für den Nutzer – erstellt wurden. Google hat die großen Baustellen also mittlerweile unter Kontrolle und kann sich nun um das Fine-Tuning des Suchalgorithmus kümmern. Hierbei spielt das Verständnis von menschlicher Sprache und ihrem Kontext eine entscheidende Rolle – und somit auch Entitäten.

Google auf dem Weg zur Antwortmaschine

Google versteht die menschliche Sprache und ihre Konzepte besser als je zuvor und nutzt diese Fähigkeiten, um langsam, aber stetig den Weg von einer reinen Suchmaschine zu einer vollumfänglichen Antwortmaschine zu bestreiten.

Schon heute ist es oft nicht mehr nötig, die Suchergebnisseite zu verlassen, zum Beispiel da die gesuchte Antwort bereits in einer eingeblendeten Infobox zu finden ist. Möglich machten das folgende Updates des Suchalgorithmus, mit denen Google bereits entscheidende Schritte auf dem Weg zur Antwortmaschine zurücklegen konnte.

Things, not strings: Startschuss für den Knowledge Graph

Things, not strings. So lautet das Motto des Knowledge Graphs bei seiner Einführung im Jahr 2012. Wortwörtlich bedeutet es „Dinge, nicht Zeichenfolgen“ oder etwas freier übersetzt „Entitäten, nicht Suchbegriffe“.

Definition Entitäten: Aber was genau versteht man nun unter einer Entität? Bevor wir tiefer ins Thema einsteigen, sollten wir diese Frage erst einmal klären.

Wer bereits mit dem Thema Datenmodellierung vertraut ist, hört von Entitäten sicher nicht zum ersten Mal. In der Informatik sind Entitäten einzelne, eindeutig zu bestimmende Informationsobjekte. Eine Entität kann ein konkreter materieller Gegenstand sein, eine Person oder auch ein immaterieller, abstrakter Zustand. Zu jeder Entität werden weitere Informationen gespeichert wie ihre Eigenschaften (Attribute) sowie ihre Beziehungen zu anderen Entitäten.

Ein Beispiel: Zur Entität der Person Joe Biden werden Attribute wie Alter oder Geburtsort gespeichert. Zudem wird eine Beziehung zur eher abstrakten Entität des Amts des US-Präsidenten hergestellt.

entität-joe-biden

Abbildung 1: Entität von Joe Biden mit Attributen und Beziehung zur Entität des US-Präsidenten

Zurück zur Einführung des Knowledge Graphs und dem Motto „Things, not strings“ oder „Entitäten, nicht Suchbegriffe“. Entscheidend für relevante Suchergebnisse sind also nicht die eingetippten Buchstaben an sich, sondern dass Google versteht, was wir als Suchende damit meinen.

Als Beispiel ein Begriff, den Olaf Kopp in seinem ausführlichen Beitrag zur Entitäten-basierten Suche
bereits genauer unter die Lupe genommen hat: „jaguar“. Autoliebhaber denken hier zuerst an die Sportwagenmarke, Dschungelfans eher an das Tier und New-Wave-of-British-Heavy-Metal-Fans an die gleichnamige Band aus Bristol.

google-jaguar-cars

Abbildung 2: Suchergebnisse und Knowledge Panel von Jaguar Cars

google-jaguar-tier

Abbildung 3: Suchergebnisse und Knowledge Panel vom Tier Jaguar

google-jaguar-band

Abbildung 4: Suchergebnisse und Knowledge Panel der Band Jaguar

Alle drei sind eine eigenständige Entität und jede ist im Knowledge Graph mit ihren individuellen Eigenschaften (Attributen) gespeichert: z.B. Hauptsitz (Attribut von Jaguar Cars) – Lebenserwartung (Attribut vom Tier) – Mitglieder (Attribut der Band). Diese Eigenschaften helfen nicht nur bei der Abgrenzung der sonst gleichnamigen Entitäten, sondern werden auch in den Suchergebnissen ausgespielt, zum Beispiel in Form eines großen seitlichen Knowledge Panels.

Außerdem spielen die Beziehungen zwischen den Entitäten eine wichtige Rolle. Wie im obigen Beispiel erwähnt, ist der Amtstitel „Präsident der Vereinigten Staaten“ in sich eine Entität, die mit mehreren Personen-Entitäten in Verbindung gebracht wird. Über diese Beziehung zeigt das Knowledge Panel des US-Präsidenten Abraham Lincoln logischerweise weitere Präsidenten der Vereinigten Staaten im Bereich „Wird auch oft gesucht“ an.

entität-Abraham-Lincoln

Abbildung 5: Knowledge Panel von Abraham Lincoln sowie in Beziehung stehende Entitäten anderer US-Präsidenten

Diese Verbindungen zeigen auch, wo sich sogenannte Graphdatenbanken – diese speichern die Informationen aus dem Knowledge Graph – von traditionellen, sogenannten relationalen Datenbanken unterscheiden. Nehmen wir als Beispiel eine relationale Datenbank, die eine Tabelle mit allen ehemaligen Gouverneuren des Bundesstaates Kalifornien enthält, eine weitere Tabelle mit der Filmographie aller bekannten Hollywood-Stars sowie eine dritte Tabelle mit allen österreichischen Staatsbürgern.

Um nun die Eigenschaften der Entität von Arnold Schwarzenegger abzufragen, müssen Informationen aus drei verschiedenen Tabellen zusammengeführt werden. Mit einer Graphdatenbank dagegen reicht eine Abfrage der Entität von Arnold Schwarzenegger, um alle relevanten Eigenschaften und Beziehungen zu erhalten.

entität-arnold-schwarzenegger

Abbildung 6: Suchergebnisse und Knowledge Panel von Arnold Schwarzenegger

Entitäten mit unregelmäßigen, komplexen Informationen und Beziehungen – wie Arnold Schwarzenegger – können so also einfacher dargestellt und schneller abgerufen werden. Da Geschwindigkeit bei der Websuche das A und O ist, leuchtet es ein, dass sich Google mit dem Knowledge Graph für diese Art der Datenaufbewahrung entschieden hat.

Wie kann Google unsere Sprache verstehen?

Entitäten und ihre Beziehungen sind für Google zudem ein Werkzeug, um den Kontext unserer Sprache zu verstehen. Hier kommen Hummingbird und Rankbrain ins Spiel. Gerade das Rankbrain-Update von 2015 ermöglichte es Google auch solche Suchanfragen zu verarbeiten, denen der Algorithmus bis dato noch nicht begegnet ist. Somit ist es gleich, ob der Nutzer „wo gibt es pizza in berlin“, „pizza in berlin“ oder „pizza berlin“ in den Suchschlitz eingibt. Google ist in der Lage, die beiden entscheidenden Entitäten zu erkennen:

  • Pizza mit der Knowledge Graph ID /m/0663v

  • Berlin mit der Knowledge Graph ID /m/0156q

So wird die menschliche Sprache in ein für Maschinen verständliches Format heruntergebrochen. Da die lokalen Pizza-Restaurants in Berlin sicherlich mit beiden Entitäten in Verbindung stehen, werden sie in den Suchergebnissen ausgespielt.

Doch wie kommen die Entitäten, ihre Eigenschaften und ihre Beziehungen überhaupt in den Knowledge Graph? Dafür setzt Google Machine Learning und Natural Language Processing ein. Hier werden die im World Wide Web vorhandenen Texte und Datenbanken (z.B. aus Wikipedia oder Wikidata) analysiert, um darin Entitäten zu identifizieren. Wie das Ganze aussehen kann, zeigt eine Demo der Natural Language API von Google.

Abbildung-7-Demo-der-Natural-Language-API

Abbildung 7: Demo der Natural Language API mit Identifizierung von Entitäten im Text über Arnold Schwarzenegger

Natural Language Processing war auch das zentrale Thema des BERT-Updates im Jahr 2019. Durch das BERT-Modell kann der Kontext von Texten noch besser eingeordnet werden. Das hilft Google einerseits bei der Erkennung der wahren Nutzerintention hinter Suchanfragen und andererseits auch bei der Befüllung des Knowledge Graphs mit extrahierten Informationen aus dem Textkorpus im World Wide Web.

Ein Blick unter die Haube mit der Knowledge Graph Search API

Eine Frage haben wir noch nicht geklärt: Warum wird für den Suchbegriff „jaguar“ nun zuerst der Autohersteller im Knowledge Panel angezeigt und nicht das Tier? Für eine Antwort werfen wir einen Blick unter die Haube des Knowledge Graphs: in die Knowledge Graph Search API.

In der offiziellen Dokumentation kann man nämlich ganz einfach ausprobieren, welche Entitäten im Knowledge Graph für welche Suchbegriffe gespeichert sind. Das klappt im Bereich „Reference“ im seitlichen Fenster „Try this API“.

Den gewünschten Suchbegriff geben wir im Feld „query“ ein und zusätzlich ist es sinnvoll, die Sprache im Feld „languages“ festzulegen („de“ für Deutsch). Mit einem Klick auf „Execute“ erhalten wir die gewünschten Daten im sogenannten JSON-Format.

Abbildung-8-Demo-der-Knowledge-Graph-Search-API

Abbildung 8: Demo der Knowledge Graph Search API mit dem Begriff „jaguar“

JSON-LD (JavaScript Object Notation for Linking Data) ist ein gängiges Datenformat, über welches Daten in einer einfachen Textform zwischen verschiedenen Anwendungen ausgetauscht werden können. Für die SEO-Welt spielt JSON vor allem bei der Auszeichnung von strukturierten Daten via Schema.org eine Rolle, da es das von Google empfohlene Format ist. Ein Vorteil: Man kann die strukturierten Daten im JSON-Format in einer getrennten Datei auszeichnen und muss diese, wie beispielsweise beim Microdata-Format, nicht einzeln im HTML-Markup hinzufügen.

Im JSON-Output der Knowledge Graph Search API sehen wir dann, wenn auch etwas versteckt, die Einträge der einzelnen Entitäten. Hier kann man auch erkennen, dass jede Entität eine einzigartige ID besitzt (s. Pfeile).

Abbildung-9-JSON-Output-der-Knowledge-Graph-Search-API-

Abbildung 9: JSON-Output der Knowledge Graph Search API für den Begriff „jaguar“

Über diese IDs können wir die URL einer jeden Entität abrufen, selbst wenn für diese in den Suchergebnissen aktuell kein Knowledge Panel angezeigt wird. Dazu muss die ID lediglich an folgenden URL-Pfad angehängt werden: https://www.google.de/search?kgmid=

Ein genauer Blick in die Daten zeigt auch, dass der Automobilhersteller Jaguar Cars für die Anfrage „jaguar“ an erster Stelle (resultScore = 6677) vorkommt, während die Entität des Jaguars als Tier erst weiter unten folgt (resultScore = 4569). Wie genau Google diese Bewertung vornimmt, ist nicht ganz klar. Aber man kann annehmen, dass für den Suchbegriff „jaguar“ mehr Nutzer Informationen über das Auto erwarten als über das Tier.

Gleichzeitig gibt es auch keine Garantie, dass der Eintrag mit dem höchsten Result Score als Knowledge Panel in den Suchergebnissen angezeigt wird. Das gilt zum Beispiel für den Begriff „essen“. So hat die Entität für Essen im Sinne von Lebensmittel im Output der API zwar den höchsten Result Score, dennoch zeigen die Suchergebnisse das Knowledge Panel der Stadt Essen.

Scheinbar werden lokale Ergebnisse bei der Ausspielung des Knowledge Panels bevorzugt. Dafür spricht auch das Suchergebnis für „essen“ bei www.google.at: In Österreich hat die deutsche Stadt Essen weniger Relevanz, weshalb Google den Nutzer entscheiden lässt, welche Entität angezeigt werden soll.

Abbildung-10-JSON-Output-der-Knowledge-Graph-Search-API-fÅr-den-Begriff-essen

Abbildung 10: JSON-Output der Knowledge Graph Search API für den Begriff „essen

Abbildung-11-Deutsche-Suchergebnisse-und-Knowledge-Panel-fÅr-den-Begriff-essen

Abbildung 11: Deutsche Suchergebnisse und Knowledge Panel für den Begriff „essen“

Abbildung-12-ôsterreichische-Suchergebnisse-und-Knowledge-Panel-Auswahl-fÅr-den-Begriff-essen

Abbildung 12: Österreichische Suchergebnisse und Knowledge Panel Auswahl für den Begriff „essen“

Nicht verwechseln: Knowledge Panel vs. Google My Business

An dieser Stelle sollten wir noch eine wichtige Unterscheidung klären. Denn beim Knowledge Panel besteht Verwechslungsgefahr, und zwar mit dem Google My Business Panel. Nehmen wir „Dept“ als Beispiel.

Das Knowledge Panel von Dept wird in Deutschland aktuell nur für die spezifische Suchanfrage „dept agency“ ausgespielt, aber nicht für den Begriff „dept“ allein. Wenn die Suche „dept“ allerdings in Berlin stattfindet, wird der örtlich relevante Google My Business Eintrag prominent als Panel platziert. Gut zu sehen ist der Unterschied dann auch bei den Berliner Suchergebnissen zu „dept agency“. Hier erscheint sowohl das Knowledge Panel wie auch der Google My Business Eintrag.

Abbildung-13-Suchergebnisse-mit-Standort-MÅnchen-fÅr-den-Begriff-dept

Abbildung 13: Suchergebnisse mit Standort München für den Begriff „dept“

Abbildung-14-Suchergebnisse-mit-Standort-Berlin-fÅr-den-Begriff-dept

Abbildung 14: Suchergebnisse mit Standort Berlin für den Begriff „dept“

Abbildung-15-Suchergebnisse-mit-Standort-MÅnchen-fÅr-den-Begriff-dept-agency

Abbildung 15: Suchergebnisse mit Standort München für den Begriff „dept agency“

Abbildung-16-Suchergebnisse-mit-Standort-Berlin-fÅr-den-Begriff-dept-agency

Abbildung 16: Suchergebnisse mit Standort Berlin für den Begriff „dept agency“

Das Knowledge Panel ist übrigens oft an dem eigebauten Link-Symbol erkennbar. Darüber kann man die Inhalte schnell teilen und wird auf die oben bereits angesprochene URL der Entität weitergeleitet.

Relevanz von Entitäten für unseren SEO-Alltag

Entitäten sind schwer greifbar, auch weil das Thema im SEO-Alltag selten Priorität hat. Trotzdem ist klar: Google befindet sich auf dem Weg zu einer Antwortmaschine und Entitäten sind ein Grundbaustein für unser zukünftiges Sucherlebnis. Daher helfen uns Entitäten heute schon zu verstehen, wie Google denkt und weshalb die Suchergebnisse so aussehen, wie sie aussehen.

Keyword-Recherche mit Entitäten

Gleichzeitig können wir diese Informationen auch in die alltägliche Keyword-Recherche einfließen lassen. Man sollte sich nämlich durchaus überlegen, ob ein Targeting sinnvoll ist, wenn sich hinter dem Keyword eine starke Entität verbirgt. Googles Ziel ist es in solchen Fällen, die wichtigsten Informationen direkt in den Suchergebnissen zu liefern – also ohne, dass der Nutzer eine bestimmte Website anklicken muss.

Zur Veranschaulichung können wir hier ein Beispiel aus dem Sport nehmen, und zwar mit dem Suchbegriff „jaguars“ (Achtung: Hier im Plural!). Dieser wird nämlich der Entität des Football Teams der Jacksonville Jaguars zugeordnet: https://www.google.de/search?kgmid=/m/043vc

Abbildung-17-Suchergebnisse-fÅr-den-Begriff-jaguars-und-der-EntitÑt-Jacksonville-Jaguars

Abbildung 17: Suchergebnisse für den Begriff „jaguars“ und der Entität Jacksonville Jaguars

Wichtige Fakten zum Team, die letzten Spielergebnisse, der aktuelle Kader und die Platzierung in der Tabelle erhält der Nutzer direkt im Knowledge Panel und einer zusätzlichen Infobox. Unter den „normalen“ zehn blauen Links befinden sich Sport-Webseiten mit den gleichen Informationen, die jedoch sehr wahrscheinlich eher selten geklickt werden.

Übrigens: Der Screenshot wurde vor dem Superbowl am 8. Februar 2021 (also vor Saisonende) aufgenommen. Zu diesem Zeitpunkt hatten die aktuellen Spielstände eine besondere Relevanz. Nach dem Saisonende wird die prominente Infobox aktuell nicht mehr ausgespielt.

Markenaufbau mit Entitäten

Darüber hinaus dürften jede Marke und jedes Unternehmen ein Interesse daran haben, sich eine eigene Entität aufzubauen. Bei vielen großen Marken ist dies bereits geschafft und ein Knowledge Panel erscheint in den Suchergebnissen.

Gut zu wissen: Man kann als Person oder Markeninhaber auch Anspruch auf das eigene Knowledge Panel erheben und die Informationen selbst bearbeiten. Dazu ist ähnlich wie in Google My Business eine kurze Verifizierung notwendig, zum Beispiel über die Google Search Console oder einen verknüpften Social Media Account.

Abbildung-18-Knowledge-Panel-von-Jaguar-Cars-mit-Anspruch-Button

Abbildung 18: Knowledge Panel von Jaguar Cars mit Anspruch-Button

Wird für eine Marke noch kein Knowledge Panel angezeigt, könnten Einträge in Wikipedia und Wikidata weiterhelfen, vorausgesetzt natürlich, dass diese von den Moderatoren akzeptiert werden. Dabei ist zu beachten, dass Entitäten aus der Sicht von Google eine gesellschaftliche Relevanz haben sollten. Erst wenn dieses Kriterium erfüllt wird, besteht die Chance auf ein eigenes Knowledge Panel in den Suchergebnissen. Ein guter Weg dorthin, sind die bekannten Maßnahmen zum Aufbau einer Marke wie PR-Arbeit oder Publikationen. Diese untermauern die eigene Expertise und Autorität. Somit gilt also auch hier: Eine starke Marke ist der Schlüssel zum Erfolg.

Optimiere Deine Website mit Ryte!

Veröffentlicht am Apr 29, 2021 von Johanna Maier