Tutorial: COVID-19 Datenanalyse mit CSV-Tools (Johns Hopkins Dataset)
Lernen Sie praktische Datenanalysetechniken anhand realer COVID-19-Daten von der Johns Hopkins University. Dieses praktische Tutorial zeigt Ihnen, wie Sie einen echten öffentlichen Datensatz bereinigen, analysieren und Erkenntnisse daraus gewinnen können, ohne dass Programmierung erforderlich ist.
Datensatz: COVID-19 Data Repository von CSSE an der Johns Hopkins University
Lizenz: Public Domain
Größe: ~50 MB
Zeilen: Über 200.000 Zeitreihendatensätze
Schwierigkeitsgrad: Anfänger bis Mittelstufe
Was Sie lernen werden
Am Ende dieses Tutorials wissen Sie, wie Sie:
- ✅ Bereinigen Sie unordentliche Daten aus der realen Welt
- ✅ Umfangreiche Daten in ein analysebereites Format umwandeln
- ✅ Berechnen Sie tägliche Veränderungen und Trends
- ✅ Glatte verrauschte Daten mit gleitenden Durchschnittswerten
- ✅ Finden Sie Muster und Spitzentermine
- ✅ Erstellen Sie länderspezifische Analysen
- ✅ Ergebnisse für Präsentationen exportieren
Keine Programmierung erforderlich, einfach zeigen, klicken und analysieren!
Abrufen der Daten
Schritt 1: Laden Sie den Datensatz herunter
- Besuchen Sie das Johns Hopkins COVID-19-Repository
- Navigieren Sie zu: „csse_covid_19_data/csse_covid_19_time_series/“.
- Herunterladen: „time_series_covid19_confirmed_global.csv“.
Was diese Daten enthalten: Bestätigte COVID-19-Fälle für jedes Land, täglich aktualisiert ab Januar 2020.
Schritt 2: Verstehen Sie die Datenstruktur
Die Datei sieht (vereinfacht) so aus:
| Provinz/Bundesstaat | Land/Region | Lat | Lang | 22.01.20 | 23.01.20 | 24.01.20 | ... |
|---|---|---|---|---|---|---|---|
| Afghanistan | 33,93 | 67,71 | 0 | 0 | 0 | ... | |
| Albanien | 41,15 | 20.17 | 0 | 0 | 0 | ... |
Herausforderungen bei diesem Format:
- ❌ Eine Spalte für JEDES Datum (Hunderte von Spalten!)
- ❌ Schwer nach Datum zu sortieren
- ❌ Datumsbereiche können nicht einfach gefiltert werden
- ❌ Kumulierte Gesamtzahlen (nicht täglich neue Fälle)
Machen Sie sich keine Sorgen, wir regeln das alles!
