Als Ingrid Brodnig und ich den ersten Digitalreport über die politische Debatte auf Facebook, in Wien präsentiert haben, gab es eine Frage, ob wir uns auch die Genderverteilung angeschaut haben. Also wie viele Frauen, Männer und andere Gender an der Diskussion beteiligt sind. Das haben wir nicht getan. Jedenfalls nicht quantitativ. Ich habe jedoch angekündigt, dass ich mich damit beschäftigen werde.
Direkt zum Tool.
Ein Problem ist der Datenzugriff. Während es schon lange nicht mehr möglich ist auf die Daten von einzelnen Personen zuzugreifen, sind inzwischen auch die Namen von Personen, die auf Pages kommentieren nicht mehr über die API abrufbar. Nur noch der Kommentarinhalt. Auch ist es sehr schwer geworden überhaupt Zugriff auf die API zu bekommen. Bei privaten Inhalten kann ich das gut nachvollziehen, bei Dingen, die Teil der öffentlichen Debatte sind, und das sind Kommentare auf Pages, halte ich es für falsch. Sowohl von Wissenschaft als auch Journalismus gibt es Beschwerden.
Nicht ideal, aber eine Lösung
Ich habe eine mittelmäßige Lösung im Nutzungsbedingungengraubereich gefunden. Facebook verbietet eine automatisierte Sammlung von Daten, wenn sie es nicht erlauben. Damit fallen Scraper weg, die sich einloggen und Daten sammeln. Aber wenn ich mich als Nutzer_in einlogge und Inhalte kopiere, sollte das nicht unter automatisiert fallen. Vor allem wenn es nicht massenhaft passieren kann, sondern auf einzelne Beiträge beschränkt ist. Statt hundert Mal ctrl+c, ctrl+v zu drücken, habe ich etwas JavaScript erstellt, das zugleich verhindert, dass man mehr Daten als nötig sammelt und die Arbeit erleichtert. Die Daten wirft man dann in ein Formular und bekommt eine Auswertung zurück. Für die Nutzung ist jede_r selbst verantwortlich.
Inspiriert ist das Ganze von proporti.onl welches mithilfe eines ähnlichen Mechanismus Twitter-Follower und Followings auswertet.
Bookmarklets und Microsite
Tatsächlich sind es zwei Bookmarklets. Eines, das alle Kommentare ausklappt, und eines, das die Vornamen der Kommentierenden kopiert. Das Erste ist nicht von mir, aber ich weiß derzeit nicht mehr, wo ich es gefunden habe. Ich glaube in einem Github Gist.
Die Microsite ist auf Glitch gehostet, weil es derzeit wahrscheinlich die einfachste und angenehmste Art ist, solche Mini-Projekte zu entwickeln und anderen zur Verfügung zu stellen. Sourcecode ist öffentlich und jede_r kann es mit einem Klick Duplizieren und verändern. Oder Remixen wie wir früher gesagt haben.
Entweder per Get-Request als URL-Parameter (wenn es unter 100 sind) oder per copy&paste werden die Vornamen an die Microsite übergeben. Diese schaut dann für jeden Namen in einer Liste nach, ob er eher als weiblich, männlich oder unisex eingestuft wird. Oder ob er unbekannt ist. Das ganze passiert mithilfe des Node Packages Gender-Detection. Schließlich wird ein einfaches Diagramm ausgegeben, das Anzahl und Verhältnis der Namen nach Gender ausgibt.
Aufgrund dieser Funktionsteilung, einmal Sammeln, einmal Auswerten, ist es auch möglich Namen aus jeglichen anderen Bereichen in das Tool zu werfen, um eine Auswertung zu bekommen.
Ungenauigkeit
Natürlich ist eine Auswertung auf Basis von Vornamen ungenau. Es wäre fatal eine solche Methode zu nutzen, um auf das Gender einer einzelnen Person zu schließen. Um ein grobes Verhältnis zu bekommen, wer bei unterschiedlichen Beiträgen kommentiert, funktioniert es. Auch beim manuellen Überprüfen der Zuordnungen im Testlauf hat sich gezeigt, dass es nur wenige Fehler gibt. Besser als auf Twitter, weil dort öfter und oder wildere Pseudonyme genutzt werden.
Eine weitere Ungenauigkeit kommt von Facebook, das nicht immer alle Kommentare lädt, dafür aber oft einzelne Kommentare des nächsten Beitrags anzeigt. Auch das ändert am Gesamtverhältnis nur wenig, wenn ausreichend Kommentare analysiert werden.
Anleitung
Ihr findet Bookmarklets und Microsite unter genderratio.glitch.me.
- Zuerst zieht ihr einfach beide oder alle drei Bookmarklets in eure Browserbookmarks. Am Handy funktioniert das alles leider nicht.
- Dann ruft ihr einen beliebigen Facebookbeitrag auf. Möglicherweise müsst ihr ihn in einem neuen Tab öffnen.
- Zuerst mit dem Expand All Bookmarklet die Kommentare ausklappen
- Dann entweder mit dem CommGendRatio die Namen direkt an das Tool schicken, falls es unter etwa 100 sind, oder mit NamesToClipboard die Namen in die Zwischenablage kopieren und dann selbst in das Tool einfügen
- Fertig.