Wahldaten analysieren - Rückblick zu unseren Workshops mit Abgeordnetenwatch

CC-BY 3.0, Data Pipeline, Foto: Jasmin Helm

Bei der Datenschule wollen wir Diskussionen um die Digitalisierung in gemeinnützigen Organisation fördern und Teams dabei unterstützen, die Chancen von Daten für ihre Anliegen aktiv zu nutzen. Aktuell arbeiten wir mit Abgeordnetenwatch.de zusammen- einer NGO, die öffentliche Bürgeranfragen an Abgeordnete ermöglicht und so mehr Transparenz und Beteiligungsmöglichkeiten schafft.

Jede Organisation hat andere Bedarfe, wenn es um den Einsatz von Daten geht. Um zielgerichtet unterstützen zu können, wollen wir zunächst verstehen, wo eine Organisation steht und wie bereits mit Daten gearbeitet wird. Im Laufe des letzten halben Jahres haben wir hierfür einen Fragebogen entwickelt, mit dem Organisationen einen Eindruck über ihre Fähigkeiten im Umgang mit Daten erhalten können. In unserem zweitägigen Workshop legten wir den Fokus auf das Finden und die Säuberung, Analyse und Visualisierung von Daten, das Abgeordnetenwatch direkt in ihre alltägliche Arbeit einbinden kann.

Wahldaten recherchieren - Wo gibt es sie und wie kann ich sie nutzen?

Da die Recherche oft sehr umfangreich und schwierig ist, haben wir uns zunächst einige interessante Datenquellen genauer angesehen. Die Plattform Govdata stellt beispielsweise deutschlandweit Daten von Städten und Open Data Portalen gesammelt zur Verfügung. Auf Every Politican gibt es Informationen zu vielen Politiker/innen weltweit, auf Open Sanctions ist sichtbar, welche Staaten gegeneinander Sanktionen verhängen und die Webseite Lobbyfacts informiert über die Lobbyorganisationen in der EU. Ein Problem bei der Weiternutzung der Daten ist oft, dass sie nicht in maschinenlesbarem Format heruntergeladen werden können - so auch bei Informationen zu Abgeordneten und Kandidierenden. Das Scrapen von Abgeordnetenlisten auf Parteienwebseiten kann daher eine Arbeitserleichterung sein. Dies geht beispielsweise durch den IMPORT-Befehl in Excel oder Google Sheets. PDFs lassen sich dagegen gut mit dem Tool Tabula scrapen.

Gute Rechercheergebnisse und verlässliche Informationen sind wichtig, um sie später weiter nutzen und evidenzbasiert argumentieren zu können. Vorher müssen die Daten aber in gesäuberter Form vorliegen. Ein gutes Tool zur Datenbereinigung ist z.B. Open Refine. Genauso wichtig ist eine gute Begleitrecherche, um Informationen in den Daten richtig einordnen und bewerten zu können.

Analyse und Visualisierung von Wahldaten - am Beispiel der Nebentätigkeiten von Parteien

Welche/r Abgeordnete hat welche Nebentätigkeiten? Gibt es mögliche Abhängigkeiten zwischen Abgeordnet/innen und Unternehmen? Und wie verteilt sich die Zahl der Nebentätigkeiten auf die Parteien? Um diese Fragen analysieren zu können, nutzten wir die Pivot-Funktion in Google Sheets. Damit lassen sich einzelne Spalten schnell und einfach miteinander in Verbindung setzen. Bei der Analyse fielen uns einige Besonderheiten im Datensatz auf, z.B. dass es unterschiedliche Angaben zu einmaligen, monatlichen und jährlichen Beiträgen gibt oder ehrenamtliche Tätigkeiten teilweise als vergütet angegeben werden. Hier ist Hintergrundwissen und eine gute begleitende Recherche nötig.

Für die Präsentation der Ergebnisse aus der Datenanalyse erfüllen bereits einfache Datenvisualisierungen ihren Zweck: Sie können auf der Webseite, in Berichten oder im Blog eingebunden werden. Ein hilfreiches Tool hierfür ist z.B. Datawrapper.

Materialien

-PDFs scrapen mit Tabula
-Analyse mit Excel und Pivot-Tabellen
-Datenvisualisierung mit Datawrapper


  • Vorheriger Beitrag

    The Story Hunt: Das waren die Workshops! The Story Hunt: Das waren die Workshops!

    Morgen startet "The Story Hunt" - unsere Data Expedition, bei der wir ein Wochenende lang gemeinsam...

  • Nächster Beitrag

    The Story Hunt: Das war die Data Expedition! The Story Hunt: Das war die Data Expedition!...

    Zusammen mit OpenBudgets.eu, Journalist/innen, Aktivist/innen, NGO-Vertreter/innen und Entwickler/innen aus aller Welt sind wir ein Wochenende lang...