Netzwerkanalyse: Wer retweetet wen?

Soziale Netzwerke wie Twitter, Facebook, Google+ oder Xing sind eine spannende Sache. Nicht nur für die Forschung. Aus sozialen Netzwerken lassen sich mit Hilfe statistischer Methoden Meinungsführer und Multiplikatoren identifizieren. Diese können für die Verbreitung von Informationen und Innovationen äußerst wichtig sein und sie für Marketing, Öffentlichkeitsarbeit und Innovationsmanagement sehr interessant machen. Man muss dabei kein Statistik-As sein, um die Netzwerkanalyse für sich zu nutzen. Allein die grafische Darstellung eines Netzwerkes gibt meist schon erste Aufschlüsse über seine Struktur. In diesem Beitrag geht es um die Visualisierung zweier Tweet-Retweet-Netzwerke, die ich auf Grundlage der Hashtags #wirhabenessatt und #wirmacheneuchsatt erstellt habe.

Die Netzwerkanalyse beschäftigt sich mit Interaktionen und Beziehungen zwischen Menschen, Gruppen oder anderen sozialen Einheiten. Der Statistiker und Blogger Tobias Wolfanger hat beispielsweise mit Hilfe einer Netzwerkvisualisierung die Punktevergaben des European Song Contests (ESC) der Jahre 2004 bis 2013 veranschaulicht. Das Ergebnis zeigt deutlich: Einige Länder sind besonders intensiv miteinander verbunden, wenn es um die Verteilung der Punkte geht.

Ein weiteres Beispiel für eine grafische Darstellung eines sozialen Netzwerkes liefert die österreichische Zeitung „Der Standdard“. Die Datenanalytiker haben aus der Anzahl gespielter Pässe und dem jeweiligen Passpartner u. a. das Fußball-Endspiel der WM 2014 in Brasilien als interaktives soziales Netzwerk abgebildet. Die Schlagzeile dazu: „Sich ankündigende Weltfußballdominanz“.

Aber auch mit den Daten aus der Twitter-Api lässt sich etwas anstellen. Über eine Abfrage der Twitter-Api im Januar habe ich ca. 3.850 Tweets mit den Hashtags „#wirhabenessatt (3.753) und #wirmacheneuchsatt (96) zu Tage gefördert. Was die beiden Hashtags bedeuten und welche Analysen ich bereits exemplarisch durchgeführt habe, dazu habe ich bereits im ersten Teil dieser kleinen Serie über die Hashtag-Analyse und im  zweiten Teil über die Wordclouds etwas geschrieben.

Von Knoten und Kanten – Hintergrund der Netzwerkanalyse

Ein soziales Netzwerk besteht aus Akteuren (sogenannte Knoten) und ihren Beziehungen zueinander (sogenannte Kanten). In der grafischen Darstellung sind zwei Knoten durch eine Kante verbunden, wenn sie eine Beziehung zueinander haben. Wie diese Beziehung definiert ist, hängt wie so oft von der Forschungsfrage ab: Bevorzugen sich beim ESC Länder bei der Punktevergabe? Wer versorgt wen mit Pässen im Fußball? Wer schickt E-Mail an welche Kollegen im Büro? Ich frage hier, wer bekommt die meisten Retweets?

Ein Retweet entsteht, indem eine Nutzerin oder ein Nutzer von Twitter einen Tweet eines anderen liest, und diesen an das eigene Netzwerk weiterleitet. Retweets sind in den Twitter-Daten mit den Buchstaben RT in Verbindung mit dem @Namen des ursprünglich Tweetenden gekennzeichnet. Außerdem liefert Twitter noch den @Namen des Retweetenden.

Bei der Darstellung des Tweet-Retweet-Netzwerkes am 16.01.2016 stehen die Beziehungen zweier Twitter-Konten im Mittelpunkt, die durch einen Tweet und einen Retweet verbunden sind. Dabei liegt die Annahme zugrunde, dass Menschen die Tweets retweeten, sich mit dem Inhalt oder dem Urheber bzw. der Urheberin des Tweets in einen gewissen Maße verbunden fühlen.

Aus den Twitter-Namen der Beteiligten lässt sich somit zusammenstellen, was für die Darstellung des Netzwerk-Graphen gebraucht wird. Die Knoten sind die Twitter-Akteure, ihre (sozialen) Beziehungen sind die Kanten. Sie werden in einer sogenannten Adjazenz-Liste, die alle Namenspaare (Tweet-Retweet) enthält, zusammengestellt.

Für die Analyse bzw. Darstellung des Graphen habe ich die Software R benutzt und für die Visualisierung das R-Ergänzungspaket igraph.

Netzwerkanalyse der #wirhabenessatt-Tweets

Nun zur Netzwerkanalyse: Für die 3.753 Tweets mit dem #wirhabenessatt-Hashtag sind 1.692 Twitter-Nutzende verantwortlich. Davon kann man einige auch Heavy-User bezeichnen. Vier von ihnen tauchen in der Ur-Liste mit mehr als 50 Tweets auf.

Tweet-Retweet-Netzwerk: #wirhabenessatt (Netzwerkanalyse)
Tweet-Retweet-Netzwerk: #wirhabenessatt (Netzwerkanalyse)

Insgesamt sind 2.711 Tweets als Retweet gekennzeichnet (rund 72 Prozent). Sie stammen von 1.344 Twitternden. Diese haben die Tweets von 246 Twitter-Konten mit ihrem Netzwerk geteilt. Um die Darstellung des Graphen nicht zu unübersichtlich zu machen sind nur Tweets berücksichtigt, die wenigstens 30 mal retweetet wurden.

Herausgekommen ist ein besonders schönes Tweet-Retweet-Feuerwerk (siehe Abbildung). Jeder Kreis in steht dabei für einen Knoten. Jede Linie für eine Kante. Einige Knoten sind mit besonders vielen anderen verbunden: Das sind die Twitter-Konten, die besonders häufig retweetet wurden, zum Beispiel @campact (285 RTs), @greenpeace_de (131 RTs) oder @WirHabenEsSatt2 (102 RTs).

Die Tweet-Retweet-Sträuße in der Abbildung oben oder rechts am Bildrand sind durch einige wenige Knoten miteinander verbunden. Diese Knoten spielen in der Theorie eine wesentliche Rolle. Über sie können Informationen aus einem Netzwerk in ein anderes gelangen. Ohne sie wäre die Leitung wie gekappt und man müsste nach anderen Verbindungen suchen oder sie erst schaffen.

Netzwerk der #wirmacheneuchsatt-Tweets

Ganz anders sieht das Netzwerk mit dem Hashtag #wirmacheneuchsatt aus. Insgesamt listet Twitter 53 Nutzende, die den Hashtag am 16.01. benutzt oder retweetet haben. Zu den Heavy-Usern hier gehören neben dem @Bauern_Verband auch @LHVOstfriesland und @WmEuchsatt. Alle sind sechsmal mit Tweets in den Daten vertreten. Von den insgesamt 96 Tweets sind 56 RTs (rund 58 Prozent).

Da das Tweet-Retweet-Netztwerk recht überschaubar ist, bilde ich es hier vollständig ab. Auch hier stelle ich es in (fast) anonymisierter Form dar.

Retweet-Netzwerk: #wirmacheneuchsatt (Netzwerkanalyse)
Tweet-Retweet-Netzwerk: #wirmacheneuchsatt (Netzwerkanalyse)

Es fällt auf, dass es sich bei der Darstellung eigentlich um vier unverbundene Netzwerke handelt. Das Netzwerk unten rechts am Rand besteht dabei lediglich aus zwei Knoten und einer Kante.

Durchaus komplexer ist das Netzwerk auf der linken Seite. Zu diesem gehören unter zum Beispiel der @Bauern_Verband (s. blauer Punkt) und andere Akteure der #wirmacheneuchsatt-Aktion. Es fällt auf, dass die Netzwerkmitglieder hier untereinander stärker verbunden sind. Ein Grund dafür könnte sein, dass sich die Beteiligten kennen und im „richtigen Leben“ oder in anderen Online-Netzwerken schon begegnet sind.

Das Netzwerk oben auf der rechten Seite ist ein sternförmiges Netzwerk, in dem der grünen Knoten – in der Sprache der Netzwerkanalyse – der zentrale Akteur ist. Dieser Punkt repräsentiert den niedersächsischen Agrarminister Christian Meyer, der trotz der Namensgleichheit nicht mit mir verwandt oder verschwägert ist ;-). Zwischen ihm und den Bäuerinnen und Bauern gibt es in dem hier dargestellten Tweet-Retweet-Netzwerk keine Verbindung. Aber in einem seiner Tweets hat er den Hashtag #wirmacheneuchsatt benutzt. Dieser ist dann zehnmal geteilt worden (Stand: 17.01.2016).

Fazit

In diesem Beitrag habe ich auf Grundlage von Tweets und Retweets ein soziales Netzwerk konstruiert. Für die hier vorgesellte Netzwerkanalyse lieferte Twitter brauchbare Daten, die ich mit der Software R und dem igraph-Paket entsprechend ausgewertet und visualisiert habe.

Mein Ziel war es, zu zeigen, wie eine simple Netzwerkanalyse mit Hilfe grafischer Darstellungen funktionieren kann. Da große soziale Netzwerke oft mehrere tausend Knoten umfassen können, wird die Aussagekraft solcher Darstellungen natürlich immer kleiner, hier helfen dann mathematische Methoden bei der Netzwerkanalyse weiter.

In kleineren Netzwerken dagegen lassen sich die Verbindungen – wie hier gezeigt – jedoch ganz gut veranschaulichen und interpretieren. Über das Tweet-und Reweetverhalten der Twitter-Nutzer lassen sich die jeweiligen Verbindungen untereinander recht gut veranschaulichen.

Die Netzwerkanalyse lässt sich übrigens auch im Coaching oder in der Analyse von Organisationsstrukturen anwenden, wenn analysiert werden soll, welche Akteure aus dem sozialen Umfeld eine herausragende Rolle spielen. Eine entsprechende Datenerhebung muss allerdings dafür durchgeführt werden.

Christian H. Meyer
Ich bin Christian H. Meyer. Hier im Blog schreibe ich über Themen und Ideen aus den Bereichen Innovation, Coaching und Forschung. Und außerdem über das, was mich sonst noch interessiert. Wenn Ihnen dieser Beitrag gefällt, zögern Sie nicht, ihn zu teilen oder zu kommentieren. Fragen dazu beantworte ich gerne.

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.