Introdução

A disputa presidencial de 2022 entre o ex-presidente Luis Inácio Lula da Silva (PT) e o atual presidente Jair Messais Bolsonaro (PL) foi a mais acirrada da história do Brasil. Lula venceu a disputa com 50,9% dos votos válidos e uma vantagem de pouco mais de 2 milhões de votos. Porém, desde o anúncio oficial do resultado pelo TSE, surgiram na internet inúmeros questionamentos, feitos pelos apoiadores do candidato derrotado Jair Bolsonaro, sobre a legitimidade das eleições.

Não é a primeira vez que os apoiadores de Bolsonaro levantam dúvidas sobre a segurança das urnas eletrônicas. O próprio presidente recorrentemente insufla seus eleitores com acusações de fraudes no sistema eleitoral brasileiro e chegou a dizer, em 2021, que apresentaria provas sobre suas alegações - porém nunca o fez.

Na semana posterior ao segundo turno das eleições presidenciais uma live no YouTube, do canal argentino La Derecha Diario, apresentou uma série de análise sobre os dados das eleições no Brasil, apontando supostas anomalias e dando a entender que eram indícios de fraudes nas eleições. A live atingiu a marca de 300 mil espectadores simultâneos e seu conteúdo passou a ser utilizado por Bolsonaristas como argumento de que houve interferências nas eleições. Além da live, uma apresentação de slides foi divulgada pelos autores.

A conteúdo do material se sustenta na tese de que o comportamento dos votos nos novos modelos de urnas eletrônicas (UE 2020) é diferente dos demais modelos utilizados (UE 2015, UE 2013, UE 2011, UE 2010 e UE 2009) nas eleições, dando a entender que as urnas antigas favoreciam o candidato do PT.

Neste trabalho vou contrapor as informações apresentadas pelo dossiê argentino, evidenciando os erros e vieses estatísticos explorados na apresentação. Para isto, farei análises a partir dos dados das eleições, que são públicos e estão disponíveis no Portal de Dados Abertos do TSE.

"Os fatos são teimosos, mas as estatísticas são mais maleáveis."

Mark Twain

Auditorias em urnas

Antes de analisar os dados é importante destacar que todo o relatório é elaborado a partir de uma premissa falsa. O autor destaca na página 9 que "As urnas de modelo anterior a 2020 não têm qualquer documentação de auditoria recente" e a partir dali toda a comparação feita trata o modelo 2020 como auditado e os modelos antigos como não auditados.

Sobre o assunto o TSE emitiu a seguinte nota de esclarecimento:

"Não é verdade que os modelos anteriores das urnas eletrônicas não passaram por procedimentos de auditoria e fiscalização. Os equipamentos antigos já estão em uso desde 2010 (para as urnas modelo 2009 e 2010) e todos foram utilizadas nas Eleições 2018. Nesse período, esses modelos de urna já foram submetidos a diversas análises e auditorias, tais como a Auditoria Especial do PSDB em 2015 e cinco edições do Teste Público de Segurança (2012, 2016, 2017, 2019 e 2021)."
As urnas eletrônicas começaram a ser utilizadas no Brasil em 1996 e, desde então, nunca foi provado nenhum tipo de fraude no sistema. Os procedimentos de fiscalização e auditoria do sistema eletrônico de votação são regidos pela Resolução Nº 23.673, de 14 de Dezembro de 2021 do TSE. A fiscalização dos sistemas eleitorais ocorrem em oito diferentes momentos, a saber:

  • Durante o desenvolvimento, a compilação, a assinatura digital, e a lacração dos sistemas eleitorais;
  • Durante as cerimônias destinadas à geração de mídias e preparação das urnas eletrônicas;
  • Durante a cerimônia destinada à verificação da integridade e autenticidade dos sistemas eleitorais instalados no TSE;
  • Na audiência destinada à verificação dos sistemas destinados à transmissão de BUs;
  • Durante os procedimentos preparatórios para realização de teste de integridade e no dia da votação;
  • Durante o Teste de Integridade das Urnas Eletrônicas;
  • Durante o Teste de Autenticidade dos Sistemas Eleitorais;
  • Após os procedimentos de totalização das eleições.

Participam do processo de fiscalização as seguintes entidades fiscalizadoras: Partidos políticos, OAB, Ministério Público, Congresso, STF, CGU, Polícia Federal, Sociedade Brasileira de Computação, CREA, CNJ, Conselho Nacional do Ministério Público, TCU, Forças Armadas, Confederação Nacional da Indústria, demais integrantes do Sistema Indústria e entidades corporativas pertencentes ao Sistema S, Entidades privadas brasileiras, sem fins lucrativos, com notória atuação em fiscalização e transparência da gestão pública, credenciadas junto ao TSE e Departamentos de tecnologia da informação de universidades credenciadas junto ao TSE.

Além disso, o TSE prevê, por meio da Resolução nº 23.444 de 30 de abril de 2015, a realização de Teste Público de Segurança (TPS) no ciclo de desenvolvimento dos sistemas de votação e apuração. Nestes testes qualquer brasileiro pode apresentar um plano de ataque aos sistemas eleitorais envolvidos na geração de mídias, votação, apuração, transmissão e recebimento de arquivos.

Até o momento já foram realizadas seis edições do TPS, nos anos de 2009, 2012, 2016, 2017, 2019 e 2021.

Para maiores esclarecimentos sobre a segurança do sistema eleitoral brasileiro, recomento os materiais:

Votação por tipo de urna

O relatório apresentado pelo canal La Derecha Diário alega que o candidato Lula teve mais votos nos modelos antigos de Urna Eletrônica. Quando analisamos a totalização de votos no Brasil no segundo turno percebemos que, de fato, Jair Bolsonaro foi mais votado nas urnas eletrônicas novas, enquanto Lula foi mais votado nas urnas eletrônicas antigas. A diferença entre os modelos de urna é de 3,5 pontos percentuais, conforme apresentado na tabela abaixo.

Candidato UE antigas UE 2020 Total
Lula (PT)
35.234.449 (52,4%)
25.111.550 (49,9%)
60.345.999 (50,9%)
Jair Bolsonaro (PL)
32.016.633 (47,6%)
26.189.721 (51,1%)
58.206.354 (49,1%)
Votação por candidato e por tipo de urna eletrônica no segundo turno das eleições.

Ao analisarmos estado por estado, percebemos que este comportamento de mais votos para o candidato Jair Bolsonaro nas urnas eletrônicas 2020 é predominante. Nos estados do Amazonas e Alagoas a diferença no resultado do candidato Bolsonaro entre os modelos de urna supera 20 pontos percentuais. O gráfico "Percentual de votos do Bolsonaro no segundo turno por estado por modelo de urna eletrônica" compara os resultados obtidos pelo candidato Bolsonaro em cada estado nos dois modelos de urnas eletrônicas. Cada marcador no gráfico representa uma unidade federativa, sendo dimensionados de acordo com o número total de eleitores aptos à votar no estado. A linha que divide diagonalmente o gráfico indica a simetria entre os diferentes modelos de urnas. Ou seja, quanto mais próximo da simetria, menor a diferença entre do resultado do candidato de acordo com o modelo de urna eletrônica. Quanto mais o marcador estiver à esquerda da linha (área branca), melhor o candidato Bolsonaro foi nas urnas antigas. Da mesma forma, quando mais à direita da referência (área azul), maior a diferença favorável à UE 2020 em relação aos modelos antigos.

Mas afinal, se a diferença do resultado do mesmo candidato em um mesmo estado é tão grande de acordo com o modelo de urna, seria isso uma evidência de fraude nas eleições?

Antes de demonstrar o viés por trás de tal resultado, preciso explicar um fenômeno estatístico conhecido como Paradoxo de Simpson.

Paradoxo de Simpson

Segundo Joel Grus, em seu livro Data Science do Zero, o paradoxo de Simpson é um fenômeno em que correlações estatísticas podem ser enganosas quando as variáveis de confusão são ignoradas.

Imagine o seguinte cenário: Eduardo, Analista de Recursos Humanos da Bolsolula company, empresa sediada em São Paulo, resolveu analisar a remuneração dos colabores da companhia. Desconfiado que os funcionários mineiros estavam sendo mais bem remunerados do que os paulistas, Eduardo calculou a média de salário dos funcionários por estado, obtendo o seguinte resultado:

Origem Remuneração média
Mineiros R$ 5.900,00
Paulistas R$ 4.300,00
Remuneração média dos funcionários da Bolsolula company por estado.

Eduardo ficou revoltado com o resultado. Afinal, por que os forasteiros, funcionários mineiros, recebiam um salário 37% maior do que os paulistas? Como podia a companhia valorizar tão mais os colabores de outro estado?

Rapidamente Eduardo espalhou sua descoberta entre os demais funcionários paulistas, que passaram a reivindicar aumento salarial para que fossem equiparados aos mineiros.

O presidente da companhia, Alberto, se surpreendeu com o resultado da análise de Eduardo. Afinal, Alberto nunca havia levado em conta o estado de origem do funcionário para determinar seu salário. Ao constatar que, de fato, o salário dos mineiros era maior do que o dos paulistas, Alberto decidiu que iria equiparar o salário entre mineiros e paulistas para todos os cargos da companhia.

Porém, ao olhar os dados cargo por cargo, Alberto percebeu que, na verdade, para todos os cargos da companhia, os paulistas é que tinham médias salariais maiores do que os mineiros.

Cargo Remuneração média mineiros Remuneração média paulistas
Diretor R$ 12.000,00 R$ 14.000,00
Engenheiro R$ 8.000,00 R$ 8.400,00
Analista R$ 4.000,00 R$ 4.200,00
Estagiário R$ 1.500,00 R$ 1.600,00
Remuneração média dos funcionários da Bolsolula company por cargo e por estado.

Como pode os mineiros terem uma média salarial tão superior aos paulistas se, em todos os cargos, os paulistas têm média salarial maior?

Para entender o que estava acontecendo, Alberto resolveu se debruçar mais sobre os dados, e fez a relação de quantos funcionários de cada cargo vinham de cada estado.

Cargo Número de funcionários mineiros Número de funcionários paulistas
Diretor 1 1
Engenheiro 4 3
Analista 3 4
Estagiário 2 8
Número de funcionários da Bolsolula company por cargo e por estado.

Alberto logo percebeu que a média salarial mais baixa dos funcionários paulistas se deu principalmente porque nos cargos de menor remuneração, como analistas e estagiários, havia uma maior quantidade de funcionários de São Paulo. Os estagiários eram predominantemente paulistas pois era mais difícil trazer estagiários de outros estados, já que estagiários normalmente ainda possuem vínculo com a faculdade que está cursando.

Após suas conclusões, Alberto resolveu, ao contrário do que foi reivindicado por Eduardo e pelos funcionários paulistas, aumentar o salário dos funcionários mineiros, para que assim, em todos os cargos, os salários fossem equiparados.

Ou seja, quando Eduardo analisou o salário dos funcionários por estado, ignorando os cargos, teve a sensação de que os funcionários mineiros eram mais bem remunerados. Quando Alberto fez a análise considerando os cargos que cada funcionário ocupava, constatou que, na verdade, eram os paulistas que recebiam melhores salários.

Resultado por modelo de urna - Distribuição espacial das novas urnas

Agora que o paradoxo de Simpson foi exemplificado, qual sua relação com as estatísticas de votação por modelos de urnas eletrônicas?

As análises feitas no relatório argentino, seja pelo país como um todo ou por estado, ignoram que a distribuição das novas urnas eletrônicas não ocorreu de forma homogênea, mas se concentrou nas regiões metropolitanas. No dia 06 de Novembro, o cientista de dados Tiago Batalhão chamou a atenção para este fator no Twitter.

Segundo o IBGE, atualmente existem 84 unidades territoriais urbanas no Brasil, sendo 76 regiões metropolitanas (RMs), 3 regiões integradas de desenvolvimento (RIDES) e 5 aglomerações urbanas (AUs), onde um total de 1.432 municípios estão localizados. Quando olhamos para o número de eleitores que votaram em cada modelo de urna e separamos os municípios que estão dentro de unidades territoriais urbanas com os municípios do interior, fica evidente que as novas urnas eletrônicas foram preferencialmente distribuídas em áreas urbanizadas. Enquanto nas unidades territoriais urbanas 58,7% do eleitorado utilizou as novas versões da urna eletrônica, no interior este número foi de apenas 21,5%.

Unidades territoriais urbanas Interior Fora do país Total
UE antigas
36.897.031 (41,3%)
52.148.859 (78,5%)
694.930 (100,0%)
89.740.820 (57,4%)
UE 2020
52.411.300 (58,7%)
14.301.159 (21,5%)
0 (0,0%)
66.712.459 (42,6%)
Número de eleitores por tipo de urna por tipo de localidade.

Ainda em Fevereiro o TRE-PE informou que, em Pernambuco, as urnas modelo 2020 seriam utilizadas preferencialmente na grande Recife por questões de logística. Comportamento similar foi observado na maioria dos estados.

No mapa abaixo, cada marcador indica um município brasileiro. A cor em que o município é representado no mapa indica a razão de cada modelo de UE utilizada, partindo no laranja claro, nos municípios que usaram apenas o modelo antigo, para o vermelho, que representa os municípios que usaram apenas as UE 2020. O tamanho em que cada município é representado no mapa corresponde ao número total de eleitores aptos. As áreas em cinza escuro são as regiões metropolitanas.

É possível interagir com o mapa com o cursor, e ver detalhes sobre cada município clicando sobre o marcador.

100% UE Antiga 50%/50% 100% UE 2020

O mapa deixa visível que fora das regiões metropolitanas, as urnas eletrônicas de modelo antigo (pontos laranjas) predominam, enquanto nas regiões metropolitanas, os novos modelos de urna eletrônica passam a ser mais frequentes.

No relatório apresentado pelo canal argentino, o autor chega a fazer comparações dentro de um mesmo estado de cidades com população abaixo de 50 mil ou 100 mil habitantes, alegando que, desta forma estaria comparando a "mesmíssima população", o que não é verdade. Tomando como exemplo os estados que apresentaram maior diferença entre o percentual de votos do Bolsonaro pra cada modelo de urna, Amazonas, Alagoas e Paraíba, observamos que:

  • No estado do Amazonas, apenas a cidade de Manaus recebeu o novo modelo de urna eletrônica. Todas as cidades do interior utilizaram os modelos antigos de urna.
  • No Alagoas, apenas Maceió e cidades próximas utilizaram o novo modelo de urna eletrônica. Os municípios do sertão alagoano utilizaram os modelos antigos de urna.
  • Na Paraíba, os novos modelos de urna eletrônica foram utilizados nos municípios que partem do litoral, até aproximadamente Campina Grande, pegando a região mais desenvolvida do estado. Entre Campina Grande, e o extremo oeste do estado, na região do sertão, todos os municípios utilizaram o modelo antigo de urna eletrônica.

A forma como os novos modelos de urna eletrônica foram distribuídos fez com que cidades com diferentes padrões socioeconômicos tivessem diferentes modelos de UE para votar. Uma outra forma de evidenciar isso, é cruzar os dados com outros indicadores, como o IDH-M, que mede o desenvolvimento de um município. O IDH-M é um indicador que varia em uma escala de zero até um, sendo que, quanto mais próximo de zero, menos desenvolvido é o município, e quanto mais próximo de um, mais desenvolvido é o município. O gráfico cruza nos dois eixos o IDH-M de cada município com o percentual de votos do candidato Bolsonaro. A nível nacional é possível ver que existe uma correlação positiva forte (0,776) entre o IDH-M e a proporção de votos que o Bolsonaro recebeu . Ou seja, quanto maior o IDH-M do município, maior a tendência de votação no Bolsonaro. Uma correlação positiva também é vista em quase todos os estados, quando olhados individualmente.

As cores, seguindo a mesma escala do mapa, representam os modelos de urna eletrônica utilizadas no município. Olhando principalmente nos estados onde houve maior discrepância entre o resultado do Bolsonaro por modelo de urna, é possível perceber que os pontos vermelhos estão majoritariamente do lado direito do gráfico, ou seja, em municípios com maior IDH-M. Por outro lado, se olharmos para a parte esquerda do gráfico, predominam os pontos laranjas.

Tomando novamente o estado de Alagoas como exemplo, na região do gráfico correspondente ao IDH-M abaixo de 0,600 há uma predominância de pontos laranja. A partir de 0,600, porém, existem mais pontos vermelhos.

O gráfico é dinâmico, e a unidade federativa pode ser alterada no selecionador abaixo.

100% UE Antiga 50%/50% 100% UE 2020

Para ter uma noção mais geral, por estado, é possível comparar o IDH-M entre os locais com UE 2020 e os locais com UE antigas. Para isso, é possível calcular um indicador de tendência central, como a média do IDH-M dos municípios de cada estado ponderada pela quantidade de eleitores aptos a votar, separando por modelo de urna eletrônica. Por exemplo, para calcular o IDH-M médio da UE 2020 em um estado, devemos, para cada município, calcular o produto do IDH-M municipal pela quantidade de eleitores que votam em urnas 2020 e depois somar o valor obtido em todos os municípios e então dividir pelo número total de eleitores da UE 2020 no estado. O mesmo cálculo é feito para as UE antigas.

Os resultados obtidos foram plotados no gráfico abaixo. A divisão entre as áreas azul e branca é a linha de simetria. Quanto mais os marcadores estão dentro da área azul, mais o estado priorizou municípios mais desenvolvidos para distribuir os novos modelos de urnas eletrônicas.

Em todos os estados, o IDH-M médio dos locais com UE 2020 foi superior ao IDH-M dos locais com UE antigas . O Distrito Federal foi a única unidade federativa que o resultado foi o mesmo para os dois modelos de urna, e isso ocorreu porque é uma unidade formada por apenas um único município (Brasília).

A diferença foi especialmente grande entre os estados do Norte e Nordeste, como Amazonas (IDH-M UE 2020: 0,737; IDH-M UE antiga: 0,606), Pernambuco (IDH-M UE 2020: 0,730; IDH-M UE antiga: 0,610), Roraima (IDH-M UE 2020: 0,719; IDH-M UE antiga: 0,590) e Alagoas (IDH-M UE 2020: 0,690; IDH-M UE antiga: 0,574), evidenciando a falta de homogeneidade na distribuição das novas urnas.

Uma outra forma de evidenciar que não houve anomalias no comportamento da votação de acordo com o modelo de urna é comparar os resultados das eleições deste ano com as de 2018. O coeficiente de pearson entre o percentual de votação de Bolsonaro nos municípios nas eleições de 2018 e 2022 é de 0,975, indicando uma correlação positiva muito forte. Em todos os estados foi observado um coeficiente de correlação acima de 0,850, e em 24 dos 26 estados foi observado uma correlação acima de 0,900. O candidato Bolsonaro foi eleito em 2018 com 55,1% dos votos válidos, enquanto em 2022 teve 49,10% dos votos. A distribuição do seu eleitorado se manteve similar pelo país, tendo uma maior proporção de votos no Sul, Sudeste e Centro-Oeste, ganhando por uma margem pequena no Norte e perdendo no Nordeste por uma margem grande. É de se esperar, de forma geral, uma pequena oscilação para baixo nos percentuais recebidos em cada município, se comparado com 2018.

Novamente, a divisão entre cores no gráfico abaixo representa a linha de simetria. Na região azul ficam os municípios onde o Bolsonaro foi melhor em 2022 e na área branca onde ele foi melhor em 2018. Dado que em 2018 ainda não havia os novos modelos de urna eletrônica, para que a tese de que o modelo de urna interfere no resultado das eleições faça sentido, os pontos vermelhos deveriam ficar nas área azul (ou seja, representaria que o Bolsonaro ganhou votos nos municípios que usaram as novas urnas) e os pontos amarelos na área branca (mostrando que a votação perdeu voto onde, em 2022, usaram as urnas antigas).

O gráfico é dinâmico, e a unidade federativa pode ser alterada no selecionador abaixo.

100% UE Antiga 50%/50% 100% UE 2020

Olhando o país como um todo, não existe um padrão entre a distribuição dos pontos amarelos e vermelhos no gráfico, demostrando as seções que usaram ambos os modelos de urna tiveram comportamento similar este ano em relação à 2018. Não evidenciando, portanto, interferência na votação por modelo de urna.

Em alguns estados do Norte e Nordeste, como Alagoas, Ceará, Maranhão, Pará e Pernambuco, o que se observou foi justamente o contrário do que era esperado caso os indícios do relatório argentino fossem corretos. Em relação à 2018, Bolsonaro ganhou votos nos municípios em que em 2022 utilizou os modelos antigos de urna e perdeu votos nos municípios que usaram o novo modelo de urna.

Este comportamento é reflexo de algo que pode ser visto à nível nacional: Ainda que o desempenho de Bolsonaro seja melhor nas regiões mais desenvolvidas, ele se saiu pior, se comparado à 2018, no Sul e Sudeste, enquanto se manteve estável no Nordeste. Embora entre o eleitorado de regiões menos desenvolvidas os votos terem sidos majoritariamente para o Lula, o Bolsonaro se saiu melhor do que em 2018 neste público. E embora o Bolsonaro tenha melhor desempenho em regiões mais desenvolvidas, ele se saiu pior do que em 2018 neste eleitorado.

Ou seja, quando o autor diz que, por filtrar municípios com menos de 100 mil habitantes em um mesmo estado está comparando a "mesmíssima população", não é o que acontece, dado a maneira como as urnas foram distribuídas.

Entre os slides 19 e 36, há comparações entre os estados nordestinos utilizando os seguintes critérios:

  • Alagoas, cidades com menos de 50.000 habitantes
  • Ceará, cidades com menos de 50.000 habitantes
  • Paraíba, cidades com menos de 100.000 habitantes
  • Pernambuco, cidades com menos de 100.000 habitantes

Os gráficos abaixo mostram: A) Quais municípios estão em cada grupo de análise; B) O IDH-M dos municípios dos 4 estados; C) Votação do Bolsonaro na região em 2018; D) Votação do Bolsonaro na região em 2022.

Pelos gráficos é possível perceber que os municípios que receberam as novas urnas estão concentrados próximo ao litoral, que estes municípios, em geral, tem maior IDH-M e que a votação de Bolsonaro na região pouco mudou de 2018 para 2022, independente se em 2022 foi utilizado a nova urna ou não.

Finalmente, uma última forma de demonstrar que há viés na categorização feita pelo autor é reduzir a análise ao menor nível de granularidade possível: em vez de comparar mesmos estados, comparar mesmas zonas eleitorais e municípios.

Ao todo, apenas 461 zonas / municípios receberam, ao mesmo tempo, ambos os modelos de urnas eletrônicas. Isto ocorreu pois na maioria dos casos uma zona eleitoral esteve com um único modelo - seja o novo ou o antigo.

Os marcadores no gráfico passam a acompanhar bem mais o eixo de simetria do que quando o agrupamento era apenas por estado. É importante destacar que, mesmo em um mesmo município, o comportamento dos votos pode variar muito de uma região pra outra (regiões centrais X zonas periféricas/rurais), e isso pode se refletir no resultado por modelo de urna, caso a distribuição das urnas não seja homogênea.

Os mapas abaixo apresentam os locais de votação com cada tipo de urna em Macapá/AP (Zona 02), Pacaraima/RR (Zona 07), Bonfim/RR (Zona 05) e Porto Velho/RO (Zona 20), as quatro cidades que apresentaram maior diferença na votação do Bolsonaro nos dois modelos de urna. Os locais de votação foram levantados por Marcelo Oliveira.

Em Macapá, na Zona 02, Bolsonaro teve 55,5% dos votos nas urnas modelo 2020 e apenas 22,8% nas urnas antigas. Porém, todas as seções que recebram as novas urnas ficam na sede do município. As seções no Arquipélogo do Jurupari, Ilha do Curuá e Ilha do Franco usaram urnas antigas.
Em Pacaraima, na Zona 07, Bolsonaro teve 76,2% dos votos nas urnas modelo 2020 e apenas 48,7% nas urnas antigas. Porém, todas as seções que recebram as novas urnas ficam na sede do município. As seções povoados e aldeias indígenas utilizaram urnas antigas.
Em Bonfim, an Zona 05, Bolsonaro teve 83,3% dos votos nas urnas modelo 2020 e apenas 58,1% nas urnas antigas. Porém, todas as seções que recebram as novas urnas ficam na sede do município. As seções povoados e aldeias indígenas utilizaram urnas antigas.
Em Porto Velho, na Zona 20, Bolsonaro teve 65,8% dos votos nas urnas modelo 2020 e apenas 41,0% nas urnas antigas. Porém, todas as seções que recebram as novas urnas ficam na sede do município. As seções povoados e aldeias indígenas, além de algumas seções na periferia da cidade, utilizaram urnas antigas.

Comportamento de gráficos

A partir do slide 8 do relatório, é feito uma outra alegação que ganha destaque: de que existiria, nas urnas antigas, uma reta "artificial" limitando os votos ao se plotar o gráfico do votos do Lula x votos do Bolsonaro por seção, comportamento não observado no mesmo gráfico das urnas modelo 2020.

Antes de explicar a reta em si, vale observar que o autor se utilizou de escalas diferentes nos gráficos comparados, uma técnica para distorcer e evidenciar seu ponto na apresentação dos dados. Enquanto no gráfico das UE 2020 os eixos do gráfico vão até 350 e 400 votos, no gráfico das UE antigas, esse valor atinge 600.

Isso quer dizer que, no gráfico das novas urnas, o autor se aproximou mais dos pontos, deixando mais evidentes os detalhes e micro comportamentos, enquanto no gráfico das urnas antigas, por usar um eixo mais abrangente, os pontos ficaram "amassados" em uma região menor do gráfico, ficando mais evidente o comportamento geral e disfarçando os detalhes.

Mas e a "reta artificial"? Bom, primeiro precisamos entender o que ela significa. Como no gráfico, no eixo x, temos os votos de Bolsonaro e, no eixo Y, temos os votos do Lula em uma mesma urna, uma reta paralela à bissetriz dos quadrantes pares significa que a soma dos votos do Bolsonaro e Lula são iguais em todos os pontos da reta.

Como exemplo, na tabela abaixo são apresentados 4 conjuntos de dados, em cada um a somatória dos votos do Bolsonaro e Lula é constante em todas as urnas.

Grupo 1
Soma: 100 votos
Grupo 2
Soma: 200 votos
Grupo 3
Soma: 300 votos
Grupo 4
Soma: 400 votos
Urna 1 Bolsonaro: 50
Lula: 50
Bolsonaro: 90
Lula: 110
Bolsonaro: 190
Lula: 110
Bolsonaro: 200
Lula: 200
Urna 2 Bolsonaro: 70
Lula: 30
Bolsonaro: 60
Lula: 140
Bolsonaro: 230
Lula: 70
Bolsonaro: 300
Lula: 100
Urna 3 Bolsonaro: 25
Lula: 75
Bolsonaro: 120
Lula: 80
Bolsonaro: 250
Lula: 50
Bolsonaro: 150
Lula: 250
Urna 4 Bolsonaro: 40
Lula: 60
Bolsonaro: 130
Lula: 70
Bolsonaro: 75
Lula: 225
Bolsonaro: 175
Lula: 225
Simulação de votos com o mesmo número de votos válidos por grupo.

Ao plotarmos no gráfico, percebemos que para cada conjunto de pontos, onde todas as urnas têm o mesmo somatório de votos de Lula e Bolsonaro, uma reta paralela à bissetriz dos quadrantes pares é formada

Explicado o que significa uma reta no gráfico, foram reproduzidos abaixo, para o segundo tuno, os gráficos com os dados reais. Foram utilizadas as mesmas escalas nos eixos de ambos os gráficos. O gráfico é dinâmico, é possível mover e alterar as escalas com o cursor (ou touch) e, dessa forma, explorar os dados em diferentes perspectivas.

Algumas observações que podemos fazer:

  • Com as escalas iguais, a diferença de comportamento dos gráficos é reduzida;
  • A partir da faixa de aproximadamente 350 votos, os pontos se tornam bem menos frequentes no gráfico das urnas antigas, embora ainda tenham diversos pontos após esta faixa;
  • Já no gráfico das UE 2020 ainda é perceptível uma quantidade significativa de urnas entre 350 e 450 votos válidos.

No primeiro turno das eleições, Lula e Bolsonaro foram quase unânimes: obtiveram juntos 91,6% dos votos. Logo é esperado que quanto mais votos um deles tenham em uma seção específica, menos votos o outro terá. Eles concorrem diretamente entre si pelos votos. Desta forma, faz sentido de que a somatória dos votos de ambos os candidatos seja limitada a partir de um ponto?

Olhando para cada urna em específico, a soma de votos de Lula e Bolsonaro representa o total de eleitores naquela urna, subtraídos dos votos em branco e nulo, das abstenções e dos votos nos demais candidatos (no caso do primeiro turno). Ou seja, a soma dos votos de Lula e Bolsonaro é diretamente relacionada com a quantidade de eleitores em uma urna.

É natural que, para evitar filas longas e para que todos os eleitores possam votar no intervalo estabelecido (entre 8:00 e 17:00), haja um limite de eleitores por urna determinado pelo TSE, conforme também explicou Tiago Batalhão.

Para verificar isso, é possível plotar um histograma de frequências de número de eleitores por seção eleitoral.

É possível perceber que, para ambos os modelos, a frequência do número de eleitores por urna é crescente até a marca de aproximadamente 350 eleitores. Depois disso, tem uma pequena queda na frequência, na faixa entre 350 e 380 eleitores. Porém, a partir de 380 um novo pico, ainda maior, é observado um pouco antes da marca de 400 eleitores.

Isso significa que provavelmente algumas zonas eleitorais trabalham com um máximo de 350 eleitores por seção, enquanto a maioria tenta limitar o número de eleitores à 400.

A partir de 400 eleitores, há uma queda brusca nas frequências. Tanto nas UE antigas quanto nas UE novas, a marca de 400 eleitores é bem visível no histograma.

Porém o comportamento dos gráficos a partir daí passa a ser bem diferente: Enquanto quase não há seções com mais de 400 eleitores utilizando as urnas antigas, ainda existe uma quantidade significativa de seções entre 400 e 500 eleitores utilizando as UE 2020.

A explicação para isso se dá pelo fato de que as novas urnas eletrônicas são mais rápidas. Aparentemente, o TSE testou expandir a quantidade de eleitores utilizando o novo equipamento de votação.

Ainda existem urnas acima dessa faixa de eleitores, mas estão concentradas principalmente no exterior, onde é possível colocar até 800 eleitores por seção. No exterior, o nível de abstenção costuma ser mais alto e os eleitores precisam votar apenas para o cargo de presidente. Assim, é possível colocar mais eleitores por seção.

Dado que existe um limite na quantidade de eleitores por urna, é completamente esperado de que haja a "reta diagonal" o gráfico de dispersão. E esta reta é menos visível nos modelos novos de urna eletrônica devido ao fato de que houve um número significativo de seções entre 400 e 500 eleitores utilizando a nova urna.

Urnas unâmines

Entre os slides 50 e 63, são questionadas as urnas unânimes. Ao todo, no segundo turno, 147 urnas tiveram 100% dos votos para um candidato, sendo 143 para o Lula e 4 para o Bolsonaro.

A maioria das urnas unânimes ocorreram em locais isolados, como comunidades indígenas e quilombolas e assentamentos do MST (nestes locais, é comum que os votos sejam bastante concentrados entre a comunidade: os mesmos candidatos tendem a ter o voto da maioria dos eleitores.). Ainda houve urnas unânimes em centros de detenção provisória, em seções com baixa quantidade de eleitores e em povoados rurais.

O candidato Bolsonaro já fez diversos pronunciamentos públicos criticando a demarcação de terras indígenas, povos quilombolas e assentamentos do MST ([1], [2], [3], [4]), desta forma é lógico que ele obtenha poucos votos nesse eleitorado.

O autor ainda sugere, de forma inverídica, que seções adjacentes aos locais com urnas unânimes tiveram votações completamente diferentes. Como exemplo, o autor cita a seção 158 da zona 28 do MT, na cidade de Confresa, comparando com as seções 156, 159 e 160, dizendo que são adjacentes. Mapeando as seções, podemos perceber que enquanto a seção 158, que teve votação unânime para o candidato Lula fica nas terras indígenas de Urubu Branco, as demais seções ficam em distritos ou na sede do município, conforme mostrado abaixo.

Ainda sobre a seção de Urubu Branco, os indígenas Apyãwa-Tapirapé que residem no local divulgaram uma nota pública, confirmando o voto no candidato Lula.

A lista de todas as seções unânimes com seus respectivos endereços é apresentada abaixo:

Código-fonte urnas

Um outro ponto que é questionado na apresentação é a possibilidade de existirem dois códigos-fontes diferentes em diferentes modelos de urnas eletrônicas. O autor se utiliza do registro de log ao inicializar a urna para levantar esta suspeita.

Ao apresentar o log de inicialização de duas diferentes urnas, o autor destaca que uma linha de log que aparece em uma urna, não aparece na outra e diz que, por ser antes das eleições, isto jamais deveria poder ocorrer.

Porém, mesmo antes de se inicializar a votação, quando um operador está carregando as informações das eleições no aparelho, é necessário realizar procedimentos que envolvem a interação com a urna. É possível que log diferentes sejam gerados caso as interações ocorram de formas diferentes. Por exemplo, um operador pode digitar uma tecla de forma inesperado em um momento que a urna está carregando informações.

Desta forma, a simples diferença no registro de log não é uma evidência de códigos-fonte diferentes.

Os dados foram alterados após a live?

O portal de dados abertos do TSE ficou inoperante momentos após a live apresentada no dia 04 de Novembro, e isso também se tornou motivo de questionamento por parte dos Bolsonaristas. No dia seguinte, quando o portal voltou ao ar, chamou a atenção que alguns arquivos de dados estavam com data de modificação recente.

Mas afinal, é possível que o TSE altere os dados de votação 5 dias após as eleições?

Primeiro, é bom lembrar que os dados já estavam disponíveis anteriormente para qualquer pessoa baixar. Qualquer alteração poderia ser verificada por alguém que já tinha feito o download anterior à live. Além disso, não houve alteração nos arquivos de Boletins de Urna, que é de onde os dados brutos são coletados. Os arquivos que apareceram com nova data de modificação eram arquivos de totalização, que apenas sumarizam os resultados.

A única mudança notada entre os arquivos é na ordem em que os dados das seções são apresentados (ordem das linhas na planilha), não causando nenhum impacto na apuração.

Cabe destacar que, em cada seção, ao encerrar as eleições, são impressas entre 5 e 10 vias dos Boletins de Urna, que são assinados por todos os mesários e fiscais dos partidos presentes. Os Boletins de Urna mostram a votação individual de cada candidato que concorreu naquela eleição e recebeu votos naquela seção específica, os votos para cada partido político, os votos nulos e os votos em branco, além da soma geral dos votos

Duas dessas vias ficam com o TSE, uma fica o presidente da mesa, uma é afixada na porta da seção, para que assim qualquer pessoa possa conferir o resultado daquela urna. As demais vias ficam com fiscais de partido, caso solicitem.

É uma prática comum entre os fiscais de partidos, após o término das eleições, fotografar todos os boletins de urna do local de votação onde ele está trabalhando. Qualquer divergência entre os boletins de urna impressos e o divulgado na internet indicaria uma falha no sistema eleitoral.

Ou seja, uma vez que o boletim de urna foi impresso, os dados apresentados pelo TSE na apuração devem, necessariamente, condizer com o boletim de urna.

Sendo assim, é impossível que a votação de uma urna seja alterada após a apuração.

Conclusão

As informações apresentadas no relatório e na live publicados pelo canal La Derecha Diario se baseiam em vieses estatísticos direcionados para apoiar seus argumentos. São escolhidas estratificações específicas dos dados para realizar as comparações, sem analisar as variáveis das informações como um todo. De forma proposital, o autor desconsiderou o padrão de distribuição das urnas eletrônicas e utilizou-se de informações inverídicas em sua apresentação para levar o leitor à conclusões enganosas. Ao fazer a análise de forma completa e considerar todos os fatores relevantes envolvidos, não há nenhuma anomalia nos dados ou evidência de fraude nas eleições.