Tutorial: Analisi dei Dati COVID-19 con Strumenti CSV (Dataset Johns Hopkins)
Impara le tecniche pratiche di analisi dei dati utilizzando i dati reali sul COVID-19 della Johns Hopkins University. Questo tutorial pratico mostra come pulire, analizzare e ottenere informazioni approfondite da un set di dati pubblico reale, senza necessità di programmazione.
Set di dati: Archivio dati COVID-19 di CSSE presso la Johns Hopkins University
Licenza: dominio pubblico
Dimensione: ~50MB
Righe: oltre 200.000 record di serie temporali
Difficoltà: da principiante a intermedio
Cosa imparerai
Al termine di questo tutorial, saprai come:
- ✅ Pulisci i dati disordinati del mondo reale
- ✅ Trasforma i dati di grandi dimensioni in un formato pronto per l'analisi
- ✅ Calcola i cambiamenti e le tendenze giornaliere
- ✅ Dati rumorosi uniformi con medie mobili
- ✅ Trova modelli e date di punta
- ✅ Creare analisi specifiche per paese
- ✅ Esporta i risultati per le presentazioni
Non è richiesta alcuna codifica: basta puntare, fare clic e analizzare!
Ottenere i dati
Passaggio 1: scarica il set di dati
- Visita l'archivio COVID-19 di Johns Hopkins
- Vai a:
csse_covid_19_data/csse_covid_19_time_series/ - Scarica:
time_series_covid19_confirmed_global.csv
Cosa contengono questi dati: casi confermati di COVID-19 per ogni Paese, aggiornati quotidianamente da gennaio 2020 in poi.
Passaggio 2: comprendere la struttura dei dati
Il file si presenta così (semplificato):
| Provincia/Stato | Paese/regione | Lat | Lungo | 22/01/20 | 23/01/20 | 24/01/20 | ... |
|---|---|---|---|---|---|---|---|
| Afghanistan | 33,93 | 67.71 | 0 | 0 | 0 | ... | |
| Albania | 41.15 | 20.17 | 0 | 0 | 0 | ... |
Sfide con questo formato:
- ❌ Una colonna per OGNI data (centinaia di colonne!)
- ❌ Difficile ordinare per data
- ❌ Impossibile filtrare facilmente gli intervalli di date
- ❌ Totali cumulativi (non nuovi casi giornalieri)
Non preoccuparti: sistemeremo tutto questo!
