Bei der Datenschule wollen wir Diskussionen um die Digitalisierung in gemeinnützigen Organisation fördern und Teams dabei unterstützen, die Chancen von Daten für ihre Anliegen aktiv zu nutzen. Aktuell arbeiten wir mit Abgeordnetenwatch.de zusammen- einer NGO, die öffentliche Bürgeranfragen an Abgeordnete ermöglicht und so mehr Transparenz und Beteiligungsmöglichkeiten schafft.
Jede Organisation hat andere Bedarfe, wenn es um den Einsatz von Daten geht. Um zielgerichtet unterstützen zu können, wollen wir zunächst verstehen, wo eine Organisation steht und wie bereits mit Daten gearbeitet wird. Im Laufe des letzten halben Jahres haben wir hierfür einen Fragebogen entwickelt, mit dem Organisationen einen Eindruck über ihre Fähigkeiten im Umgang mit Daten erhalten können. In unserem zweitägigen Workshop legten wir den Fokus auf das Finden und die Säuberung, Analyse und Visualisierung von Daten, das Abgeordnetenwatch direkt in ihre alltägliche Arbeit einbinden kann.
Da die Recherche oft sehr umfangreich und schwierig ist, haben wir uns zunächst einige interessante Datenquellen genauer angesehen. Die Plattform Govdata stellt beispielsweise deutschlandweit Daten von Städten und Open Data Portalen gesammelt zur Verfügung. Auf Every Politican gibt es Informationen zu vielen Politiker/innen weltweit, auf Open Sanctions ist sichtbar, welche Staaten gegeneinander Sanktionen verhängen und die Webseite Lobbyfacts informiert über die Lobbyorganisationen in der EU. Ein Problem bei der Weiternutzung der Daten ist oft, dass sie nicht in maschinenlesbarem Format heruntergeladen werden können - so auch bei Informationen zu Abgeordneten und Kandidierenden. Das Scrapen von Abgeordnetenlisten auf Parteienwebseiten kann daher eine Arbeitserleichterung sein. Dies geht beispielsweise durch den IMPORT-Befehl in Excel oder Google Sheets. PDFs lassen sich dagegen gut mit dem Tool Tabula scrapen.
Gute Rechercheergebnisse und verlässliche Informationen sind wichtig, um sie später weiter nutzen und evidenzbasiert argumentieren zu können. Vorher müssen die Daten aber in gesäuberter Form vorliegen. Ein gutes Tool zur Datenbereinigung ist z.B. Open Refine. Genauso wichtig ist eine gute Begleitrecherche, um Informationen in den Daten richtig einordnen und bewerten zu können.
Welche/r Abgeordnete hat welche Nebentätigkeiten? Gibt es mögliche Abhängigkeiten zwischen Abgeordnet/innen und Unternehmen? Und wie verteilt sich die Zahl der Nebentätigkeiten auf die Parteien? Um diese Fragen analysieren zu können, nutzten wir die Pivot-Funktion in Google Sheets. Damit lassen sich einzelne Spalten schnell und einfach miteinander in Verbindung setzen. Bei der Analyse fielen uns einige Besonderheiten im Datensatz auf, z.B. dass es unterschiedliche Angaben zu einmaligen, monatlichen und jährlichen Beiträgen gibt oder ehrenamtliche Tätigkeiten teilweise als vergütet angegeben werden. Hier ist Hintergrundwissen und eine gute begleitende Recherche nötig.
Für die Präsentation der Ergebnisse aus der Datenanalyse erfüllen bereits einfache Datenvisualisierungen ihren Zweck: Sie können auf der Webseite, in Berichten oder im Blog eingebunden werden. Ein hilfreiches Tool hierfür ist z.B. Datawrapper.
-PDFs scrapen mit Tabula
-Analyse mit Excel und Pivot-Tabellen
-Datenvisualisierung mit Datawrapper
Melde dich bei unserem Newsletter an und erhalte monatlich Informationen über unsere Aktivitäten und Workshops.
Morgen startet “The Story Hunt” - unsere Data Expedition, bei der wir ein Wochenende lang gemeinsam...
Zusammen mit OpenBudgets.eu, Journalist/innen, Aktivist/innen, NGO-Vertreter/innen und Entwickler/innen aus aller Welt sind wir ein Wochenende lang...