
Ziele
- Effiziente, automatisierte Analyse großer Datensätze
- Erstellen aussagekräftiger wissenschaftlicher Abbildungen
- Sicherer Umgang mit grundlegender deskriptiver und Inferenzstatistik
- Sichere Entwicklung von wiederverwendbarer wissenschaftlicher Software
- Verarbeitung (Analyse und Darstellung) von Vektor- und Rastergeodaten
Der Kurs beginnt mit einer kurzen Wiederholung grundlegender Konzepte der Programmiersprache Python und wichtiger Data-Science Bibliotheken wie z.B. pandas. Außerdem wird die Versionsverwaltung git eingeführt und im Verlauf des Kurses genutzt.
Im weiteren Verlauf werden komplexe Visualisierungen erstellt (matplotlib, seaborn) und parametrische und nicht-parametrische statistische Tests angewendet (scipy).
Im letzten Drittel liegt der Fokus auf der Verarbeitung und Visualisierung von Geodaten im Vektor- und Rasterformat (geopandas, rasterio, …).
Eine weitere Sitzung wird sich mit „Code Quality“ beschäftigen und Konzepten für „maintainability“ von Python Code sowie automatisierte Tests zur Sicherstellung der gewünschten Funktionalität mit pytest
- Kursleiter/in: Jonas Kittner