Adjacency

Adjacency beschreibt allgemein die Nähe oder Nachbarschaft von Dingen, Orten und anderen Entitäten. Der Begriff wird in unterschiedlichen Kontexten verwendet. In der Suchmaschinenoptimierung wird mit Adjacency, auch Keyword Adjacency, die räumliche Nähe zwischen zwei Suchbegriffen auf einer Website bezeichnet. Der Abstand der Suchbegriffe in einem Dokument kann sequentiell in Zeichen erfasst werden, um die Relevanz einer Website anhand dieses Zeichenabstands zu bestimmen. Dazu werden Begriffe und ihre Positionen in einer Liste oder komplexen Matrix gespeichert und mit Werten versehen.

Befinden sich zwei Suchbegriffe in direkter Nachbarschaft, ist die Relevanz aufgrund der entsprechenden Werte hoch. Je größer der Abstand zwischen den Begriffen ist, desto geringer ist die Relevanz der Suchwort-Kombination für die Website beziehungsweise für die Crawler der Suchmaschinen, die die Adjacency-Technik verwenden. Häufig wird in diesem Kontext auch von Keyword Proximity gesprochen, wobei Adjacency das grundlegendere, mathematische Konzept für die Nähe von Suchbegriffen darstellt, das mit der Keyword Proximity anschließend erweitert wird.

Allgemeine Informationen zum Thema

Das Konzept der Adjacency stammt aus der Informationstechnologie und speziell aus der Computer Linguistik. Adjacency kann sich aber auch auf andere Anwendungen wie LAN-Netzwerke (Router), Datenstrukturen (Graphen), Frequenzbänder in Mobilfunknetzen oder die Nähe von Daten in physischen Speichermedien beziehen.[1] Router können zum Beispiel bestimmte Netzsegmente gemeinsam nutzen, wenn sie Routing-Tabellen austauschen. Signalverstärker, die die Reichweite eines WLAN-Netzes erweitern, teilen sich ein Netzsegment mit dem Router, der das Netz bereitstellt.[2] Auch in größeren Netzwerken und Intranets kommt die Adjacency zum Einsatz, um die Wege zwischen verschiedenen Teilen eines Netzwerkes zu verkürzen.

Diese Nähe von Sender und Empfänger wird bei anderen Anwendungen auf das jeweilige Fachgebiet und den Gegenstandsbereich übertragen: In der Graphentheorie beschreibt Adjacency die direkte Nachbarschaft zweier Knoten (zum Beispiel Hyperlinks in einem HTML-Dokument). Das Konzept erlaubt es, die Strukturen von Graphen in bestimmten Formaten wie Listen und Matrizen darzustellen. Das vereinfacht die Suche und erlaubt eine Speicherung der Daten, die nur wenige Bits erfordert und weiterverarbeitet werden kann – zum Beispiel bei Suchvorgängen in großen Datenmengen per Algorithmus.[3]

Funktionsweise

Die Frage, wie Daten gespeichert und repräsentiert werden, ist zentral für die Zeit, die eine Suche in diesen Daten beansprucht. Dies gilt insbesondere für Indexstrukturen von Suchmaschinen, die einerseits schnelle und andererseits relevante Ergebnisse liefern sollen. Beim Crawlen einer Website und der späteren Indexerstellung kann die Adjacency folgendermaßen eingesetzt werden:

  • Der Crawler erstellt eine Liste mit allen Wörtern, die er auf einer Website findet, und gibt diese Daten an die Suchmaschine weiter.
  • Die Suchmaschine berechnet verschiedene Werte wie die Termfrequenz und die Keyword Adjacency Frequency.
  • Die Nachbarschaft von Suchwörtern wird dazu verwendet, die Relevanz der Ergebnisse zu erhöhen, indem Suchphrasen mit mehreren, nahen Begriffen als wertvoller für eine bestimmte Website oder Domain erachtet werden – und dementsprechend auch wertvoller für eine Suchanfrage, die diese Begriffe enthält.
  • Mit Stemming, Lemmatisierung, Trunkierung und verschiedenen Termfrequenzen (zum Beispiel Keyword Fokus, Keyworddichte, Keyword Adjacency Frequenz, Keyword Proximity) wird untersucht, inwiefern die Inhalte einer Website für bestimmte Suchanfragen ein Ergebnis darstellen.
  • Nicht relevante Begriffe werden in Stoppwortlisten eingetragen und in dem Dokumentkorpus abgewertet. Begriffe wie 'und', 'oder', 'sowie' oder Artikel und weitere Füllwörter werden auf ihren Bezug zu den Kewords geprüft. Wenn sie nicht wichtig für die Hauptkeywords der Suchanfrage sind, müssen sie in der Analyse des Contents auch keine allzu große Rolle spielen.

Keyword Proximity und Keyword Adjacency werden jedoch gemeinsam mit anderen Methoden und Techniken benutzt, um die Positionen von Wörtern in HMTL-, PDF- oder Text-Dokumenten zu erfassen und die Relevanz für verschiedene Suchanfragen einschätzen zu können.[4] Der Unterschied besteht darin, dass Adjacency eine direkte Nachbarschaft von Begriffen in Suchanfragen meint, während Proximity auch größere Distanzen zwischen Suchwörtern auf Websites berücksichtigt und gewichtet. Die Bezugsgröße kann also die Suchanfrage oder die Distanz zwischen Suchbegriffen auf einer Website sein.

Beispiel

Ein Nutzer gibt die Suchanfrage 'Keyword Adjacency Frequency' in die Suchmaske einer Suchmaschine ein. Die Suchmaschine hat bereits vorher Websites gecrawlt und indexiert, die diese Begriffe im Content enthalten. Die Suchmaschine weiß, wie häufig und an welchen Stellen die einzelnen Begriffe im Content der Website vorkommen. Anhand der Keyword Adjacency, Keyword Proximity und den Termfrequenzen auf der Website kann die Suchmaschine nun die Relevanz für die anfangs eingegebene Suchanfrage bewerten und das entsprechende Ergebnis in den SERPs anzeigen. Wahrscheinlich wird die Suchmaschine eher Websites ausgeben, die die oben genannten Begriffe in direkter oder naher Nachbarschaft aufweisen.

Bedeutung für die Suchmaschinenoptimierung

Die Adjacency-Technik wird vermutlich von verschiedenen Suchmaschinen verwendet, um ihre Suchergebnisse zu optimieren. Insbesondere bei der Erzeugung von Stoppwortlisten in Information Retrieval und Text Mining kann davon ausgegangen werden, dass die Keyword Adjacency Frequency zusammen mit anderen Konzepten aus der Computer Linguistik zum Einsatz kommt. Google meldete zu diesem Thema bereits im Jahr 2009 ein Patent an, das Stoppwortlisten automatisch erzeugt und die Analyse von Dokument-Sammlungen (Korpus) vereinfacht.[5]

Für Online Marketer bedeutet das im Umkehrschluss, dass die Positionen von Keywords ein Rolle bei der Erstellung der SERPs spielen – und somit vermutlich für das Ranking relevant sind. Ein Keyword in der Überschrift eines Dokuments wird zwar schon durch die Auszeichnung als Überschrift höher gewichtet, doch im Longtail-Bereich mit mehreren Begriffen zeigen Proximity und Adjacency ihre Stärken: Füllwörter werden als Stoppwörter behandelt und die Distanzen zwischen allen relevanten Keywords dienen als Grundlage für Werte, die die Auslieferung der Ergebnisse in den SERPs beeinflussen. Ähnliches gilt mit wenigen Ausnahmen wie den Metakeywords für die Metadaten. Demnach ist es empfehlenswert, auf die Positionen von Keywords und ihren Keyword-Nachbarn zu achten, ohne aber den Lesefluss zu beeinträchtigen. Dabei ist es zweitrangig, ob es sich um den eigentlichen Inhalt einer Website oder dessen Metadaten handelt.[6]

Einzelnachweise

  1. adjacent it-administrator.de. Abgerufen am 31.10.2016
  2. adjacency it-administrator.de. Abgerufen am 31.10.2016
  3. Representing graphs khanacademy.org. Abgerufen am 31.10.2016
  4. Adjacency suchhelden.de. Abgerufen am 31.10.2016
  5. Automatic Generation of Stop Word Lists for Information Retrieval and Analysis google.com. Abgerufen am 31.10.2016
  6. Keyword Proximity searchmetrics.com. Abgerufen am 31.10.2016

Weblinks

Kategorie