Gephi ist ein sehr mächtiges Tool für SEO, insofern es richtig eingesetzt wird. Neben der Visualisierung der Verlinkung bietet es weitere Features. So können Sie mit dem non-profit Tool tolle Dinge wie den internen Linkjuice mit PageRank oder auch die Betweenness-Zentralität berechnen. Zum Abschluss des Vortrags auf der Campixx gab es noch ein kleines SEO-Experiment, welche Metrik denn nun am besten funktioniert und das wir Ihnen ebenfalls vorstellen.
Gephi ist ein sehr mächtiges Tool für SEO, insofern es richtig eingesetzt wird. Neben der Visualisierung der Verlinkung bietet es weitere Featuers. So kann man den internen Linkjuice mit PageRank oder auch der Betweenness-Zentralität berechnen. Zum Abschluss des Vortrags gab es noch ein kleines SEO-Experiment, welche Metrik denn nun am besten funktioniert. Mehr Details gibt es in den Folien.
Generell wird im Rahmen der Suchmaschinenoptimierung die interne Verlinkung in zwei Bereiche eingeteilt. Zu den qualitativen Faktoren zählen der Anchortext, die Platzierung des Links (z. B. im Fließtext, Kopf- oder Fußbereich) sowie die thematische Nähe des Linkziels. Unter die quantitativen Faktoren fällt auf URL-Basis die Anzahl eingehender sowie ausgehender Links und der „Flow“, d. h. die Verteilung von Linkjuice. Zur Verbesserung der internen Verlinkung – in der Hoffnung auf einen Rankingboost für eine Seite – greifen viele SEOs jedoch nur darauf zurück, die Seite stärker zu verlinken.
Aber sehen das die Suchmaschinen genauso?
Nach einem kurzen Exkurs zur Graphentheorie und Gephi verdeutlichen wir diese Frage mit einem kleinen SEO-Experiment aus dem Jahr 2016.
Die Graphentheorie ist eine Möglichkeit, Strukturen zwischen mehreren Objekten zu repräsentieren. Typische Beispiele dafür sind U-Bahn Pläne, Familienstammbäume… oder eben Websites. Zur Abbildung der Struktur in einem Graphen werden dann sogenannte Knoten (Haltestellen, Familienmitglieder, URLs) und Kanten (Linien, Verwandtschaftsbeziehungen, Verlinkungen) genutzt.
Wichtig ist, dass die Kanten nicht notwendigerweise reziprok oder gleichwertig sind. Sie können sowohl gerichtet als auch gewichtet sein:
Gerichtet bedeutet beispielsweise, dass – um bei einer Website zu bleiben – Knoten A auf B verlinkt, B jedoch nicht zurück auf A. Mit der Gewichtung wiederum kann vor allem Wichtigkeit dargestellt werden. Gibt es auf A beispielsweise mehrere Links zu B, ist die Kante potentiell stärker bzw. „wichtiger“. Das wird das auch Mehrfachkante bezeichnet, der gesamte Graph dann als sogenannter Multigraph:
Alles zusammen ergibt dann sehr schnell ein Netzwerk, in dem Sie weitere Eigenschaften wie die Nachbarschaft von Knoten und unterschiedliche Pfade erkennen können:
Ausgehend von Knoten B können A, C und D als Nachbarn bezeichnet werden. E ist nur indirekt über C mit ihm verbunden und daher kein Nachbar.
Möchten Sie nun den Pfad von C nach D untersuchen, gibt es mehrere Routen: p(C,D) (das heißt, der Pfad C → D) oder p(C,B,D) (der Pfad C → B → D). Die Route über A ist nicht möglich – achten Sie auf die gerichtete Kante, die nur von A nach B zeigt. Sie fahren ja auch nicht falschherum in Einbahnstraßen, oder?
Mit den nun vorliegenden Daten können Sie einige wichtige Berechnungen zur Lage, Wichtigkeit oder Zentralität von Knoten durchführen und daraus Schlüsse über die interne Verlinkung Ihrer Website ziehen:
Indegree Zentralität: Bezeichnet die Anzahl der eingehenden Kanten und das, was viele SEOs (wenig erschöpfend) als Referenz für den Grad der internen Verlinkung sehen. Wie oft wird eine Seite verlinkt?
Outdegree Zentralität: Bezeichnet analog zur Indegree Zentralität die Anzahl der ausgehenden Kanten. Wie viele Seiten werden verlinkt?
Eigenvektorzentralität: Hebt bekannte und beliebte Knoten hervor, wie es beispielsweise bei der Berechnung von PageRank oder CheiRank der Fall ist. Ein Knoten ist umso wertiger, je stärker die ihn umgebenden Knoten sind.
Betweenness Zentralität: Berücksichtigt das gesamte Netzwerk, nicht nur die unmittelbaren Kanten und Nachbarn. Wie wichtig ist dieser Knoten als Verteiler oder Durchlaufpunkt? Am einfachsten zu beschreiben mit der Frage: „Welche Auswirkungen hat es, wenn dieser Knoten wegfällt?“
Das müssen Sie natürlich nicht selbst machen. Lassen Sie Gephi die Rechenarbeit machen!
Gephi ist ein kostenloses, aber auch recht komplexes Programm, das die Visualisierung von Netzwerken ermöglicht. Im Rahmen der internen Verlinkungsanalyse ist es vor allem praktisch, da Sie die entsprechenden Daten einfach aus anderen Crawlingtools wie beispielsweise dem Screaming Frog SEO Spider ziehen können.
Crawlen Sie Ihre Seite, exportieren Sie alle internen Links und bereiten Sie sie in Excel für die Darstellung im Tool vor. Nutzen Sie dafür das folgende Schema (Attribute sind optional und können fast beliebig erweitert werden):
SOURCE | TARGET | ATTRIBUT1 | ATTRIBUT2 | … |
Quelle | Linkziel | Anchortext | Meta-Robots | … |
url1 | url2 | hier | follow | … |
Speichern Sie die Tabelle im CSV-Format (achten Sie auf leere Zellen ohne Inhalt!) und importieren Sie sie in das Programm. Wählen Sie Ihre CSV-Datei und setzen Sie, sofern nicht voreingestellt, das passende Trennzeichen, die Tabelle als Kanten-Tabelle und den Zeichensatz auf UTF-8.
Nachdem die Daten durch das Programm verarbeitet wurden, erscheint Ihnen im Reiter Übersicht oft ein zuerst unübersichtlicher und schwer zu lesender Block. Herzlichen Glückwunsch – das ist der Graph Ihrer internen Verlinkung. Sie wurde natürlich noch nicht eingestellt. Nutzen Sie jetzt die Funktion Layout [A] im Reiter Übersicht, um die Daten zu ordnen. Geeignete Algorithmen sind der Force Atlas, ForceAtlas 2 sowie der nach einer Apfelsorte klingende Fruchtermann Reingold. Versuchen Sie sich aber ruhig an verschiedenen Algorithmen und suchen Sie den, der für Sie am übersichtlichsten erscheint.
In der Praxis hat es sich bewährt, in der Funktion Ausgestaltung [B] die Größe sowie die Farbe der Knoten anzupassen, um auch visuell die unterschiedlich starken Knoten darzustellen. Probieren Sie sich ruhig etwas aus, und schalten Sie auch die ID [C1] hinzu und lassen Sie sich zur schnellen Identifizierung die URL als Knotenbeschriftung [C2] anzeigen!
Im rechten Rand können Sie unter Statistiken [D] auch die bereits genannten Berechnungen stattfinden lassen. Hinter Mittlerer Grad bzw. Mittlerer gewichteter Grad verbergen sich die Indegree sowie die Outdegree Zentralität, unter Netzwerk-Durchmesser die Betweenness Zentralität und die Option Eigenvektorzentralität erklärt sich quasi von selbst. Vergessen Sie den PageRank nicht!
Alle Daten können Sie dann auch im Datenlabor entsprechend einsehen, wenn Sie Zahlen lieber als Graphen mögen:
Schauen Sie auch auf Youtube vorbei – es gibt zahlreiche Tutorials zur Visualisierung mit Gephi. Außerdem widmete sich die Zeitschrift Website Boosting in Ausgabe 44 dem Thema PageRank-Visualisierung in einem Leitartikel.
Jetzt haben Sie viele Daten, und nach einiger Einarbeitung in Gephi auch einen netten Graphen. Aber welche Metrik interessiert die Suchmaschine denn nun?
Anmerkung: Die Ergebnisse basieren auf dem Experiment im Rahmen der Campixx 2016.
Stellen Sie sich vor, Sie haben ein Schwellenkeyword und Ihre Optimierungsmaßnahmen helfen einfach nicht. Mehr guter Text – keine Änderung. Externe Links – keine Änderung. Aber sobald Sie thematisch passende Unterseiten aufbauen und diese vom Hauptknoten aus verlinken: besseres Ranking.
Dafür wurde ein Testgraph ohne externe Links konzipiert, der das erfundene Keyword „Brusemuckel“ in einigen Permutationen bespielt. Die Keywords befanden sich auf allen Seiten immer an der gleichen Stelle. Verlinkungen innerhalb der Seiten wurden über Zahlen im ersten Satz eingefügt und stellten so eine Gewichtung der verschiedenen Seiten gemäß der unterschiedlichen Zentralitäten sicher.
Das Experiment zeigte, dass vor allem die Betweenness-Zentralität für das Ranking der Experiment-Seiten relevant wurde. Mit anderen Worten: Die Relevanz des Knotens im Gesamtgraphen ist ein entscheidendes Kriterium, damit er zu einem bestimmten Keyword ranken kann.
Gephi ist ein mächtiges Tool, um die interne Verlinkung Ihrer Website zu analysieren. Durch einen Crawl einer Website können Sie SEO-relevante Strukturen und Cluster identifizieren und gezielt optimieren. In gleichem Maße können Sie natürlich auch die Verlinkung Ihrer Konkurrenz visualisieren. Die Einarbeitung ins Tool erfordert aber viel Zeit und ein Verständnis für Zahlen, wodurch die Integration in laufende Prozesse gehemmt wird. Wenn Sie die Zeit aufwenden können, ist die grafische Darstellung der Verlinkungsstruktur Ihrer Website dennoch eine große Hilfe bei der Optimierung. Beachten Sie jedoch, dass das Tool an einigen (SEO-)Stellen schnell an seine Grenzen stößt:
Zum einen berücksichtigt das Tool nicht direkt die Position. Bekanntermaßen werden Links im Main Content und im sofort sichtbaren Bereich einer Seite höher gewichtet als jene in der Menüstruktur oder im Footer. Und gerade bei sehr großen Seiten mit mehreren Hunderttausend oder Millionen internen Links wird eine übersichtliche Darstellung der einzelnen Knoten fast unmöglich. In diesem Fall untersucht man eher Netzwerke über einzelne Segmente.
Und letztlich bleibt noch eine wichtige Sache auf der Strecke: Durch den Crawl bedingt können Sie die interne Verlinkung zunächst nur in einer isolierten Testumgebung betrachten. Externe Einflüsse, vor allem durch Backlinks, berücksichtigt das Tool nicht. Gerade diese sind jedoch nach wie vor hochrelevant für SEO, lassen sich aber nur durch die Zuhilfenahme weiterer Tools näherungsweise in die Grafik integrieren.
Wenn Sie sich den kompletten Vortrag der SEO-Campixx ansehen möchten, habe Sie hier die Möglichkeit dazu: