Archivo por meses: Agosto 2015

Análisis de Irregularidades en el Escrutinio Provisorio – PASO Presidenciales 2015

Desde OpenDataCórdoba nos propusimos analizar los datos del escrutinio provisorio de las PASO Presidenciales 2015 realizadas el pasado Domingo 9 de Agosto. Cabe destacar que el analisis fue acotado en el tiempo y de continuarse es probable que se encuentren más observaciones. Los resultados no son exhaustivos ni pretenden abarcar el 100% de las irregularidades, se entiende que los datos entregados son provisorios y pueden variar de los definitivos. Igualmente se ejecutó el análisis de manera tal que se pueda repetir nuevamente con los datos finales de las elecciones.

Objetivo del Análisis

Analizar los resultados provisorios de las Elecciones PASO Presidenciales de todas las mesas del territorio Argentino en busca de posibles irregularidades en el proceso de conteo y carga de datos.

Se buscó analizar de manera explorativa tanto los datos presentes en el telegrama como posibles errores en el ingreso de datos al sistema de recuento que generen discrepancias entre lo que dice el papel y lo que quedó registrado en el sistema.

Para cada análisis se detallan las mesas encontradas para que los lectores puedan consultar en www.resultados.gob.ar por dichos telegramas para aportar comentarios y sumar información.

El tiempo invertido en el análisis quedó delimitado por una tarde de mates. (Aproximadamente 2.5 termos.)

Hallazgos

  1. Se encontraron y analizaron un total de 62 mesas con irregularidades que representan aprox un 0.007% del total de mesas.
  2. Las Irregularidades que se encontraron fueron:
    1. Mesas en las cuales, en el telegrama, el Total De Votos es Mayor al total de Votantes en Dicha Mesa y por ende, en los datos registrados en el sistema se transporta el error.
      1. Ejemplo: Buenos Aires – Moron – 0669 – 364
    2. Mesas en las cuales, en el telegrama, los números escritos eran ilegibles o “confusos” y por ende, los datos ingresados al sistema difieren al del telegrama.
      1. Buenos Aires – Almirante Brown – 0018A – 169
    3. Mesas en las cuales, en el telegrama, se observaba una coherencia en los datos pero la cantidad de votos resulta sospechosa dado que se aleja a los valores normales de las restantes mesas de dicho circuito.
    4. Mesas en las cuales, en el sistema, aparecía cargado para la Alianza UNA, la Cantidad Total de Votos de la mesa en vez de los votos correspondientes al Candidato. Esta fue la irregularidad más extraña que se encontró dado que es un error sistemático y que se repite en varias mesas. Este es un error en la carga de datos, dado que en el telegrama los casilleros de dicho candidato estaban vacios o eran menores.
      1. Ejemplo: Buenos Aires – Vicente Lopez – 1000 – 516

Procedimiento

1) Se buscó y verificó manualmente las mesas donde más votos se obtuvieron por partido. Una vez identificadas, se contrastó una por una en la página web www.resultados.gob.ar. Se llegó a analizar las primeras 35 mesas, y en todas se encontraron alguna de las irregularidades antes mencionadas.

Se adjunta listado y detalle:

top 35 mesas mas votadas

2) Se calculó por Provincia, Municipio, y Circuito, el promedio y desviación estándar de los votos de cada Alianza. Se identificó luego, aquellos circuitos con mesas donde la cantidad de votos para la alianza difiere en mas de 7 Desviaciones Estandar de la media. (valores estadísticamente menos probables donde se podría inferir una mayor probabilidad de irregularidad). La cantidad 7  fue definida en base a obtener una submuestra lo suficientemente chica como para poder revisarlo a mano en una hora.

Se adjunta listado:

conteos_sospechosos_completo

 

Conclusiones

Las mesas con irregularidades encontradas al día de la fecha representan aproximadamente un 0.01% de las mesas escrutadas, por lo que las posibilidades de que representen un cambio en las tendencias nacionales es poca. (Desde la opinión de quien escribe)

El objetivo de este artículo no apunta a identificar la posibilidad o no de un fraude electoral sino a demostrar cómo una política de Datos Abierta (que promovemos desde OpenDataCórdoba) puede ayudar a transparentar y mejorar el procedimiento electoral al permitir que el ciudadanos participe activamente controlando el proceso de ingreso y recuento de votos.

En algún momento las elecciones deberán pasar por procesos de evaluación más complejos. Desde los padrones hasta los resultados tenemos mucho para hacer. Este tipo de análisis es una forma de mostrar que lo que tenemos hoy en día en cuanto a transparencia electoral es limitado.

Detalles

Los detalles del análisis pueden encontrarse en esta página web. El análisis se continua haciendo por lo que el link puede contener material incompleto. Se reciben comentarios, sugerencias y correcciones.

 

¿Cuantas personas votan por cada domicilio?

En este momento, en la televisión, un funcionario de la Justicia Electoral de la Provincia de Córdoba indica que el método de control de los padrones previo a las elecciones es la publicación en papel de los mismos. Estos padrones se exponen en todas las comisarías de la provincia y es responsabilidad de los partidos políticos y los ciudadanos hacer el control y denuncias si fuera necesario.

Año 2015, parece mucho. Va de nuevo:

El control de los padrones electorales es responsabilidad de los partidos políticos y los ciudadanos y se hace en papel.

Hace algunos días llegó a nuestras manos una versión digital (una planilla de Excel, debería ser abierta y accesible para todos) del padrón usado para las últimas elecciones a intendente en la ciudad de Villa Allende.

Este set de datos es bastante simple y no permite demasiados análisis. Sólo incluye los nombres, apellidos, domicilios y escuela de votación de cada ciudadano.

Un problema con estos datos es el nombre de las calles. Por ejemplo la misma calle Duarte Quiros puede aparecer tambien como D. Quiros u otras variantes. Esta dificultad puede resolverse parcialmente (y así lo hicimos) usando herramientas como OpenRefine. Al momento de hacer un análisis estricto basado en los domicilios esta es un dificultad importante. La existencia nombres de calles duplicadas también lo es.

A pesar de estas dificultades hicimos un análisis simple preguntándonos.

¿Cuantos votantes hay en cada domicilio? 

Antes de liberar este estudio quitamos los nombres, apellidos y DNIs del set de datos inicial. Intentamos con esto anonimizar los datos y centrarnos en los domicilios y no en las personas.
Estos datos y el procesamiento pueden verse aquí. Usamos GitHub como plataforma ya que permite a otros rehacer el proceso, mejorarlo, proponer cambios, validarlo, etc.

Los resultados finales deben analizarse cuidadosamente. El primer domicilio -por ejemplo- corresponde al Hogar Padre Lucchese.
Los datos están disponibles aquí:

domicilio votantes
jeronimo-luis-de-cabrera 256 140
chacabuco 201 67
paso-de-los-andes 501 43
paso-de-los-andes 0 43
jeronimo-luis-de-cabrera 0 29
barcelona 2084 25
duarte-quiros 434 20
san-clemente 1614 20
elpidio-gonzalez 1500 19

 

Andres Snitcofsky (@rusosnith) tomo estos datos y los puso en interesante mapa (lo hizo antes de refinarse con OpenRefine).

Villa allende votacion

El equipo periodístico de los SRT tomo estos datos e hizo avances interesantes en CBA24N.  Lo mismo hicieron en La Voz del Interior en este informe. Son buenos ejemplos de como las comunidades de programadores y periodistas podemos complementarnos e interactuar.