Tutorial: Análise de Dados COVID-19 com Ferramentas CSV (Dataset Johns Hopkins)
Aprenda técnicas práticas de análise de dados usando dados reais do COVID-19 da Universidade Johns Hopkins. Este tutorial prático mostra como limpar, analisar e obter insights de um conjunto de dados público real, sem necessidade de programação.
Conjunto de dados: Repositório de dados COVID-19 da CSSE na Universidade Johns Hopkins
Licença: Domínio público
Tamanho: ~50 MB
Linhas: mais de 200.000 registros de série temporal
Dificuldade: Iniciante ao Intermediário
O que você aprenderá
Ao final deste tutorial, você saberá como:
- ✅ Limpe dados confusos do mundo real
- ✅ Transforme dados amplos em formato pronto para análise
- ✅ Calcule mudanças e tendências diárias
- ✅ Dados suaves e ruidosos com médias móveis
- ✅ Encontre padrões e datas de pico
- ✅ Crie análises específicas do país
- ✅ Exportar resultados para apresentações
Não é necessária codificação, basta apontar, clicar e analisar!
Obtendo os dados
Etapa 1: Baixe o conjunto de dados
- Visite o repositório Johns Hopkins COVID-19
- Navegue para:
csse_covid_19_data/csse_covid_19_time_series/ - Baixe:
time_series_covid19_confirmed_global.csv
O que estes dados contêm: Casos confirmados de COVID-19 para cada país, atualizados diariamente a partir de janeiro de 2020.
Etapa 2: Compreenda a estrutura de dados
O arquivo fica assim (simplificado):
| Província/Estado | País/Região | Lat | Longo | 22/01/20 | 23/01/20 | 24/01/20 | ... |
|---|---|---|---|---|---|---|---|
| Afeganistão | 33,93 | 67,71 | 0 | 0 | 0 | ... | |
| Albânia | 41,15 | 20h17 | 0 | 0 | 0 | ... |
Desafios com este formato:
- ❌ Uma coluna para CADA data (centenas de colunas!)
- ❌ Difícil classificar por data
- ❌ Não é possível filtrar facilmente os intervalos de datas
- ❌ Totais acumulados (não novos casos diários)
Não se preocupe, nós resolveremos tudo isso!
