_
_
_
_
_

La predicción con todas las encuestas en Cataluña

Nuestro modelo estadístico utiliza decenas de sondeos y 10.000 simulaciones para calcular los escaños de cada partido y la probabilidad de distintas mayorías

Kiko Llaneras

En 14 días los catalanes votarán en unas elecciones trascendentales. Estos son los pronósticos de nuestro modelo estadístico basado en sondeos. El modelo agrega docenas de sondeos (publicadas antes del 7 de diciembre) y ha sido calibrado con la precisión histórica de miles de encuestas en 200 elecciones de 19 países. La metodología se explica al final.

El gráfico anterior muestra el promedio de encuestas. ERC sigue siendo el primer partido con el 23% de los votos, pero se le acercan Ciudadanos (21%) y Junts per Catalunya (17%). En el gráfico pueden observarse los movimientos de las últimas semanas: suben Cs, JxCat y PSC y caen CeC, PP y ERC.

A partir de ese promedio de votos el modelo predice los escaños que logrará cada partido. Para eso hace 10.000 simulaciones de las elecciones considerando cada provincia. El gráfico a continuación representa el resultado en escaños de cada partido.

El modelo dice que ERC rondará los 35 escaños y que le siguen Ciudadanos (29), JxCat (26), PSC (21), CeC-Podem (9), PP (8) y la CUP (8). El gráfico también hace evidente la incertidumbre de estas elecciones. Los intervalos al 80% de probabilidad son horquillas de unos diez escaños. ERC puede moverse fácilmente entre los 29 y los 41 diputados y el PSC entre 15 y 26. Los comunes, por ejemplo, tienen un 10% de probabilidades de quedarse con sólo 4 escaños, pero también un 10% de superar los 13. Estas variaciones pueden parecer excesivas, pero no son caprichosas: vienen determinadas por el acierto histórico de miles de encuestas que hemos analizado.

Ni siquiera el orden de los partidos está garantizado. La tabla siguiente muestra la probabilidad que tiene cada formación de acabar en cada puesto. ERC es el partido con más escaños el 75% de las veces, pero Ciudadanos se impone en el 17%. En votos sus números están aún más ajustados: ERC es el más votado con un probabilidad del 64% y Cs con el 30%. El motivo de esa diferencia es el sistema electoral catalán. Los escaños fuera de la provincia de Barcelona se consiguen con menos votos y eso beneficia a los partidos independentistas porque allí logran mejores resultados.

Las mayorías posibles

La pregunta fundamental del 21 de diciembre consiste en saber qué coaliciones tendrán una mayoría de escaños. ¿Qué probabilidades tienen distintos partidos de sumar 68 diputados y poder escoger al próximo gobierno catalán? Esa es una predicción que no pueden hacer las encuestas convencionales, pero que ofrece nuestro modelo electoral. El gráfico representa la suma de escaños para distintos partidos en nuestras 10.000 simulaciones del 21D. Son histogramas. La masa a la derecha de los 68 escaños representa la probabilidad de que una suma de partidos alcance la mayoría.

Ahora mismo, nuestra predicción es que los independentistas (ERC, JxCat y la CUP) tienen un 58% de probabilidades de sumar una mayoría de escaños. Son poco más de la mitad de opciones. Equivale prácticamente lanzar una moneda al aire. En el 42% restante de las veces, Cs, PSC, PP y CeC suman 68 escaños y podrían buscar un acuerdo para elegir gobierno.

El modelo ve muy complicado que los tres partidos del llamado bloque constitucionalista logren una mayoría ellos solos. La suma de Cs, PSC y PP ronda el 43% en votos y los 57 escaños. No es imposible que mejoren sus encuestas hasta alcanza los 68 escaños, pero es algo que solo pasa 3 de cada 100 veces.

Tampoco está asegurada la viabilidad aritmética de un pacto entre ERC, CeC-Podem y PSC. No solo es complicado políticamente; además sólo suman 68 escaños un tercio de las veces. La fuga de votos de ERC hacía JxCat y la caída de los comunes en los sondeos ha reducido esta suma.

La otra alternativa al bloque independentista es que ERC gobierne apoyado por JxCat y los comunes. Estos tres partidos suman 68 escaños el 70% de las veces. Es probable, pero en absoluto seguro. Tan probable como ver encestar un tiro libre en baloncesto. Además en este caso es importante un matiz: la probabilidad de esta suma cae si el bloque independentista no alcanzo la mayoría. Si ERC, JxCat y la CUP se quedan por debajo de los 68 diputados, las probabilidades de que sumen JxCat, ERC y los comunes caen al 45%. Es decir, en una de cada cuatro simulaciones las dos opciones son imposibles.

En los próximos días las predicciones del modelo se moverán. Primero porque la incertidumbre irá cerrándose y las encuestas ganarán precisión. Será así hasta el último momento, aunque durante los últimos seis días no podremos publicar sondeos porque la ley lo prohíbe. Hasta entonces veremos si las encuestas siguen moviéndose. Esta semana han acercado a ERC y Ciudadanos, han mejorado los pronósticos de Carles Puigdemont y han seguido hundiendo al PP y los comunes. Con todos esos movimientos iremos actualizando nuestra predicción electoral del 21 de diciembre.

Metodología de nuestro modelo. Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. El modelo es similar al que usamos en Francia y Reino Unido. Funciona en cuatro pasos: 1) agregar y promediar las encuestas en Cataluña, 2) proyectar ese promedio sobre cada provincia, 3) incorporar la incertidumbre esperada, y 4) simular 10.000 elecciones para calcular probabilidades.

Paso 1. Promediar las encuestas. El modelo agrega las estimaciones de voto de docenas de sondeos. La mayoría pueden consultarse en Wikipedia. Hay dos razones para hacer este promedio: sirve para reducir el error de muestreo y además ofrece una «cocina» de consenso. El promedio está ponderado para tener en cuenta el tamaño de muestra, la empresa encuestadora y la fecha del sondeo.

Paso 2. Proyectar el promedio a cada provincia. Antes de calcular los escaños es necesario estimar el porcentaje de votos de cada partido en cada provincia. Para eso hacemos una proyección lineal del promedio de votos en todo Cataluña. La proyección tiene en cuenta resultados históricos en cada provincia (del 26J y el 27S) y los últimos sondeos del CIS y del CEO.

Paso 3. Incorporar la incertidumbre de las encuestas. Este paso es el más complicado. También es el más importante. Para predecir el resultado «más probable» basta usar el promedio de votos y estimar los escaños. Pero si queremos saber qué probabilidad tienen distintos resultados necesitamos algo más: un modelo probabilístico. Necesitamos estimar la precisión esperada para los sondeos en Cataluña. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 1, 2 o 5 puntos? Para responder esas preguntas hemos analizado el error de miles de encuestas.

Calibrar los errores esperados. Primero he estimado el error de las encuestas en España. He construido una base de datos con encuestas de 23 elecciones desde 1982 —incluyendo todas las generales y una docena de elecciones recientes. El error absoluto medio (MAE) de los promedios de encuestas en España ha rondado los 2,1 puntos por partido. Pero esos errores dependen al menos de dos cosas: del tamaño del partido y de la cercanía de las elecciones. Para tener en cuenta esos dos factores hemos recurrido a la base de datos de Jennings y Christopher Wlezien. Hemos analizado los errores de más de 2.700 encuestas en 198 elecciones de 19 países occidentales. Así hemos construido un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tamaño (es más fácil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los días que faltan hasta las elecciones (porque las encuestas mejoran al final).

Distribución. Para incorporar la incertidumbre al voto de cada partido en cada simulación utilizo varias distribuciones multivariables. Uso distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explica Nate Silver. El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que i) la suma de los votos no sobrepase el 100% (unaidea de Chris Hanretty), y ii) consideren correlaciones entre partidos cercanos (por ejemplo, ERC y JxCat). Esas correlaciones las he basado en las matrices de transferencias del CIS y de Metroscopia. La incertidumbre la incorporo con cinco distribuciones, una a nivel catalán y otra en cada provincia. La primera distribución introduce errores iguales para el voto de un partido en toda Cataluña. Es importante hacerlo así porque en general los errores de las encuestas son sistémicos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pasó con algunos modelos de las elecciones de EEUU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviación estándar esperados según la calibración.

Paso 4. Simular. El último paso consiste en ejecutar el modelo 10.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según las distribuciones definidas en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades de que haya una mayoría de ciertos partidos, de que un candidato logre cierto número de votos, quede primero, etc.

Por qué encuestas. El modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que a nivel nacional fallaron por pocos puntos incluso con Trump y con el Brexit. En otras elecciones recientes, como las francesas, las holandesas o las de País Vasco y Galicia, los sondeos dieron poco que hablar porque estuvieron acertados. Las encuestas raramente son perfectas, pero son capaces de predecir elecciones en términos probabilísticas. Además,no existe una alternativa que haya demostrado mayor capacidad de predicción.

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_

Sobre la firma

Kiko Llaneras
Es periodista de datos en EL PAÍS y doctor en ingeniería. Antes de llegar al periódico en 2016 era profesor en la Universitat de Girona y en la Politécnica de Valencia. Escribe una newsletter semanal, con explicaciones y gráficos del día a día, y acaba de publicar el libro ‘Piensa claro: Ocho reglas para descifrar el mundo’.

Más información

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_