Distribuição dos votos para presidente em São Paulo – 2010/2014 (R + Mapbox + Dimple.js)

O período eleitoral é sempre um momento frutífero para coleta de dados e visualizações interessantes. Primeiro, porque o assunto desperta curiosidade de quase todo mundo e pelo fato que os determinantes dos fenômenos eleitorais são extremamente complexos. Segundo, pelo fato do TSE disponibilizar os dados de uma maneira bem estruturada e de fácil acesso; o Repositório de Dados Eleitorais reúne as principais estatísticas das últimas eleições tão organizada que é possível automatizar toda a coleta de dados (fiz a automatização no R, mas vou deixar o código para um post mais adiante).

Oportunamente, a disponibilidade dos dados eleitorais coincidiu com um projeto pessoal de produzir um mapa semelhante a esse: Poverty and Race in America, Then and Now. Trata-se de um Dot Density Map que retrata a distribuição espacial de pessoas que vivem abaixo da linha da pobreza e a raça declarada. A parte interessante do mapa é que ele permite comparar épocas distintas arrastando a barra que divide o mapa entre dois momentos.

É uma maneira bastante elegante de disponibilizar informações georreferenciadas e temporais, mas que não necessariamente traz grandes insights sobre os dados visualizados. Feita essa ressalva, utilizei os dados eleitorais e a solução estética para retratar a distribuição de votos no primeiro turno das eleições presidenciais de 2010 e 2014 no município de São Paulo (clique na imagem para acessar o mapa completo):

Eleição presidencial 2010/2014 (SP)

Continuar lendo

Publicado em Dados Públicos, Data Scrapping, Eleições, Mapas, R, São Paulo | Deixe um comentário

Paulinho ou Fernandinho?

A Copa do Mundo atrapalhou um pouco as publicações, mas nada como aproveitar o evento para retornar com uma análise bastante simples do último jogo do Brasil. Uma rápida busca no Google revela a importância da discussão sobre o meio-campo da seleção, mais especificamente se devemos manter o Paulinho para os próximos jogos ou se o Fernandinho deve ser o titular.

Passes realizados e percentual de acerto

Passes realizados e percentual de acerto | Brasil vs Camarões – Copa 2014 (o círculo indica o final do passe)

 

 

 

 

 

 

 

 

 

 

Continuar lendo

Publicado em Futebol, Infográfico | Deixe um comentário

Eleições (SP) + Mapas + R (ggmap)

A distribuição geográfica dos votos de São Paulo é pauta comum dos mais diversos jornais, mobilizando a equipe de infográficos e análise de dados. Por um lado, dados eleitorais são atrativos naturais de análises estatíticas, potencializados pela sua disponibilização organizada e de fácil acesso. Por outro, existe uma fixação por parte das análises em revelar a existência de um correlação entre a distribuição geográfica dos votos com a divisão heterogênea de fatores socioeconômicos em um determinado lugar. No caso de São Paulo, a análise visual dos dados eleitorais invariavelmente resulta em alguma afirmação pouco elaborada de que a periferia vota de determinada maneira em oposição ao centro (aqui, aqui e aqui). Continuar lendo

Publicado em Dados Públicos, Eleições, Mapas, R, São Paulo | 2 Comentários

Data Scrapping + rCharts + Energia

Dois temas recentes (e bastante correlacionados) devem permear a agenda política, dado o calendário eleitoral: a situação energética do país e o abastecimento de água no Estado de São Paulo. Porém, confesso que é um pouco difícil formar qualquer opinião sobre os temas dado o tom alarmista de quase todos os veículos de comunicação e a quantidade de especialistas dos setores que aparecem nos momentos mais críticos. Afinal, estamos vivendo um período crítico de desabastecimento de água e energia? Em caso afirmativo: i) Qual a principal razão?; ii) As medidas possíveis para evitar essa situação foram tomadas? Já adianto que não vou conseguir responder nenhuma dessas questões. Mas trago aqui alguns dados que tangenciam as questões, começando pelo setor elétrico (tentarei explicar em uma próxima publicação o passo-a-passo para criação desse post). Continuar lendo

Publicado em Dados Públicos, Data Scrapping, R | Deixe um comentário

Foreign key [2]

Em sequência à série que criei há quase 1 mês, recomendo a leitura do artigo abaixo que traz uma discussão sobre a relação entre disseminação de ideias/estratégias de argumentação e o display visual das informações.

http://pubs.aeaweb.org/doi/pdfplus/10.1257/jep.28.1.209

Publicado em Uncategorized | Deixe um comentário

Passo-a-Passo: Data Scraping – Aliceweb

Na publicação sobre os dados de atrasos nos aeroportos tangenciei um tema que é recorrentemente o principal obstáculo na análise de algum fenômeno relevante a partir de um conjunto de dados: a dificuldade associada à extração de bases de dados consistentes e organizadas, mesmo que disponibilizadas de forma padronizada. Para os que não ouviram falar, Data scraping (ou raspagem de dados) é nome que se dá à técnica através da qual procura-se extrair dados proveniente de algum programa para algum outro programa de computador, de uma maneira legível; web scraping nada mais é que um subgrupo para o qual a técnica consiste em extrair dados disponíveis em websites. Continuar lendo

Publicado em Dados Públicos, Data Scrapping, Passo-a-Passo | Marcado com , | Deixe um comentário