La mesa más predictiva

4 minutos de lectura

Actualizado:

Hace algún tiempo me surgió la duda de si existía algún estudio académico o político que identificara el local más predictivo de resultados electorales en Chile. Mi impresión era que sí, pues cómo si no se fundamentaba el envío de reporteros y consultores a ciertos locales a hacer sus sondeos a boca de urna para los días de las elecciones (típicamente en el Estadio Nacional). Sin embargo, después de averiguar con algunos colegas, y preguntar en twitter, me enteré que no había nada. Al menos nada público. Por eso decidí mirar elecciones anteriores para tratar de decifrar cuál de las más de 42 mil mesas en Chile proyecta el resultado con menor error.

Este artículo es parte de un proyecto de Tresquintos que busca resolver preguntas de investigación relacionadas a elecciones mediante metodologías creativas.

¿Cuál es la mesa que proyecta resultados electorales con menor error? Esta pregunta es relevante por al menos dos razones. Primero, porque la respuesta contribuye directamente a los votantes. Si los medios de comunicación invirtieran más en estudios sobre comportamiento electoral, y con esos datos en mano mandarán a sus reporteros a “la mesa más predictiva” a hacer los sondeos a boca de urna, podrían entregarle a los votantes información de mejor calidad. (Obviamente si la mesa está en cabo de Hornos, se vuelve más difícil).

Pero la respuesta también contribuye a la literatura especializada. Si académicos entendieran de mejor manera el comportamiento de los chilenos cuando ingresan a las urnas, presumiblemente podrían construir mejores sistemas electorales. Entre otras cosas, podrían mirar composiciones para entender dónde están los clusters. Pero si identificaran “la mesa más predictiva”, también podrían hacer una mejor radiografía del electorado chileno, sus características, y sus motivos de votar. (Naturalmente esto solo funciona si la mesa es constante a través del tiempo).

Preliminares

Demás está decir que encontré la mesa. Lamentablemente, sin embargo, solo para una elección. La razón es sencilla. Dado estoy trabajando con scripts que hacen todo el trabajo de un click, tengo que pensar en todos las potenciales combinaciones que pueden generar problemas. Y dado que los datos para 1989-2017 vienen en un formato excepcionalmente desordenado (mesas sin indicadores únicos; formatos diferentes para distintas elecciones), solo hice el trabajo para la elección presidencial de 2017. Lo bueno es que el camino está pavimentado para hacerlo con el resto de las elecciones.

Métodos

Si solamente te interesa ver los resultados del trabajo, puedes ir direcatamente a la siguiente sección. Si en cambio te interesa conocer los métodos, quedáte aquí. Los describo brevemente en lo que sigue. Los pasos enumerados abajo describen la sequencia limpia que seguí para producir el script para el ranking de “la mesa más predictiva”. En resumen, elegí una elección, busqué los datos, los ordené en un formato leíble-para-máquinas, opté por una definción de “mejor pronóstico”, computé el indicador y ordené las mesas de más a menos predicitiva. Esta es la sequencia:

  1. Definir la elección: elección presidencial de 2017;
  2. Formular la pregunta: ¿cuál fue la mesa con el mejor pronóstico?;
  3. Definir “mejor pronóstico”: menor error promedio (MEP; e.g., la mesa que tuvo menor error promedio considerando los ocho candidatos);
  4. Buscar datos: Servel – descargar aquí;
  5. Revisar formato: lista de variables;
  6. Formatear datos: de largo a ancho (i.e., melt; reshape);
  7. Ingresar retorno electoral del paso 1: resultados para cada uno de los 8 candidatos;
  8. Computar el MEP;
  9. Ordenarlas mesas.

Resultados

Después de armar el puzzle logístico, de varios loops, y de no pocas correcciones, pude usar los datos de Servel para ordenar las 42,890 mesas que recibieron votos para las presidenciales 2017, e identificar el error promedio de cada una de ellas. Cómo escribí aquí, quizás el MEP no es el mejor indicador, pero es un indicador. Y no es un indicador malo. De hecho, revisando los casos uno a uno, constaté que estuvieron bastante cerca de cada uno de los candidatos. Las mejores cinco tuvieron un error promedio de 1.8%. Las peores cinco tuvieron un error de 13%.

Las 5 mesas con los mejores pronósticos fueron (en orden de mejor a peor) [comuna, local, mesa]:

  1. Yumbel, Escuela Heroes de Chile, Mesa 11;
  2. Rancagua, Liceo Oscar Castro, Mesa 1;
  3. San Pedro de la Paz, Escuela Sargento Candelaria Pérez, Mesa 63;
  4. Florida, Liceo Luis de Alava, Mesa 10;
  5. Concepción, Liceo España, Mesa 189.

Las 5 mesas con los peores pronósticos fueron (en orden de mejor a peor) [comuna, local, mesa]:

  1. Canela, Escuela Municipal Canela Baja, Mesa 1;
  2. Huara, Liceo de Huara, Mesa 14;
  3. Santiago, Escuela República de Panama, Mesa 219;
  4. Recoleta, José Miguel Carrera B-36, Mesa 140;
  5. San Clemente, Liceo San Clemente Entre Ríos, Mesa 5.

Interpretación

El gráfico de abajo muesta un box plot, con las 42 mil mesas distribuidas en 15 regiones: con región en el eje horizontal, y error promedio en el eje vertical. En general, muestra que el MEP está distribuido de forma uniforme a través del país. En lo particular, es interesante que la Región Metropolitana tenga la mayor cantidad de outliers. Es interesante porque es allí donde normalmente se hacen los sondeos a boca de urna.

bp

El gráfico de abajo muesta un scatter plot, con las 42 mil mesas distribuidas de acorde a su número de votos válidos sobre el total: con participación en el eje horizontal, y error promedio en el eje vertical. La tendencia muestra que por cada 1% que aumenta la participación, el error promedio cae por 0.02%. Es decir, una mesa con 70% de participación va tener un error promedio 4% menor que una mesa con 50% de participación.

ep

Nota final

La invitación está hecha. Ahora hay repetir el mismo proceso para el resto de las elecciones. Si te interesa hacerlo, no dudes en contactarme. Por ahora, dejo los datos computados para este artículo abajo. Están en formato .csv. Si encuentras algún error, anomalía, u otra cosa de interés, no dudes en escribirme.

Descargar datos aquí.

Cita recomendada: Bunker, Kenneth, 2020, “Replication Data for: La mesa más predictiva”, https://doi.org/10.7910/DVN/CXKYAB, Harvard Dataverse, V1, UNF:6:NwN9JL9ZevhkgPD8pQwJQg== [fileUNF].

konami

Comentar