TSM

En esta p谩gina podr谩s conocer el m茅todo que se utiliza para realizar pron贸sticos electorales. Primero, describe el modelo, y sus dos etapas sequenciales. Luego, da un ejemplo a partir de una carrera con dos candidatos. Finalmente, sugiere algunos enclaces que se pueden seguir para encontrar informaci贸n m谩s detallada sobre el modelo.

ep 驴Qu茅 es el TSM?

El TSM (Two-Stage Model) es un m茅todo para realizar pron贸sticos electorales usando datos de encuestas que buscan estimar preferencias para cada uno de los candidatos (o opciones, en caso de un plebiscito) que est谩n en carrera. Tal como su nombre lo indica, el proceso diferencia entre dos fases: una fase de input y una fase de output. En la primera de las dos fases:

  1. Se determina las encuestas que se pueden agregar a la base de datos;
  2. Se eliminan preferencias inv谩lidas (e.g., no sabe, no responde);
  3. Se pondera cada encuesta en base a su puntaje en el ranking de encuestas;
  4. Se pondera cada encuesta en base a su margen de error estimado;
  5. Se pondera cada encuesta en base a su distancia del d铆a de la elecci贸n usando una funci贸n de media-vida.

En la segunda de las dos fases, se toman los datos calibrados, y:

  1. Se estima la probabilidad de cada pron贸stico usando un proceso de inferencia Bayesiana;
  2. Se simula el resultado de la elecci贸n 50,000 veces por medio de una Cadena de Markov Monte Carlo (MCMC);
  3. Se repiten los pasos anteriores (6-7) sequencialmente para generar la l铆nea de tiempo.

Lo anterior resulta en un pron贸stico para la elecci贸n 鈥渟i fuera hoy鈥. Pero no produce un margen de error asociado. Para computar ese margen de error, hay al menos dos alternativas. La primera es usar los par谩metros generados por el MCMC (i.e., el interv谩lo de credibilidad). La segunda alternativa es construirlos a partir de una extensi贸n de los argumentos que sostiene el MCMC.

En este caso, se opta por la segunda alternativa. Es decir, se extrae el resultado de las cadenas, y se computa una curva Gaussiana. Esa curva constituye la distribuci贸n de probabilidades o densidad de probabilidades. De esa curva se c谩lcula el 谩rea dentro de la cual caen 80% de las simulaciones (ver z-score). Finalmente, se identifican los puntos m谩s extremos y se asignan como los l铆mites en el rango de resultados probables.

ep Un ejemplo

Lo anterior solo es posible cuando hay al menos 2 encuestas. A modo de ejemplo, supongamos que hay 2 encuestas que buscan pronosticar el resultado de una elecci贸n con dos candidatos (alternativas). Supongamos tambi茅n que en una de esas dos encuestas se reporta que el candidato A obtiene 40% de las preferencias y el candidato B obtiene 35% de las preferencias. Esto significa que hay un total de 75% de preferencias validas.

Dado que esto no es un escenario viable, se opta por considerar solo las preferencias que son validas. Para hacer aquello, simplemente se 鈥渋nfla鈥 el porcentaje de votos a 100%. Es decir, el candidato A autom谩ticamente pasa a tener 53% y el candidato B autom谩ticamente pasa a tener 47%. Si bien esta operaci贸n se basa en un 鈥渟upuesto鈥, es probablemente el mejor supuesto posible.

Una vez que ambas encuestas se 鈥渞ecalibran鈥, se pueden ponderar los datos en base a los tres criterios mencionados arriba (pasos 3-5). En otras palabras, se pone m谩s confianza en una encuesta que en promedio obtiene un puntaje m谩s alto despu茅s de considerar su nivel de precisi贸n en elecciones anteriores (su ranking), su margen de error (n煤mero de encuestados), y su antiguedad (distancia temporal).

Luego, se estima la probabilidad de que el pron贸stico que propone la segunda encuesta sea 鈥渧erdadera鈥 en base al pron贸stico que propone la primera encuesta. Esto resulta en un pron贸stico final para cada candidato en carrera para la fecha en que se registr贸 la segunda (o la m谩s reciente) de las encuestas. Ese es el pron贸stico 鈥渟i la elecci贸n fuera hoy鈥.

Para construir la serie de tiempo, supongamos ahora que tenemos diez encuestas. La idea es tratar de reemplazar cada uno de los puntos en que se hizo una encuesta por un pron贸stico 鈥渟i la elecci贸n fuera hoy鈥. Para hacer eso, sencillamanete se repite el proceso completo, sequencialmente. Primero para las dos primeras encuestas, luego para las tres primeras, luego para las cuatro primeras. Y as铆 sucesivamente hasta llegar a la d茅cima.

ep Detalles t茅cnicos

Como nota final, el TSM es experimental. Es solo una aproximaci贸n 鈥渋nformada鈥, y por ende inevitablemente conlleva error. Para ver un sketch conceptual, pincha aqu铆. Para ver los detalles t茅cnicos del TSM, pincha aqu铆. Para ver un ejemplo de la aplicaci贸n para el caso chileno en 2013, pincha aqu铆. Para ver un ejemplo de su aplicaci贸n para el caso italiano en tres elecciones (2008, 2013 y 2017), pincha aqu铆.

konami