Selecciona Edición
Entra en EL PAÍS
Conéctate ¿No estás registrado? Crea tu cuenta Suscríbete
Selecciona Edición
Tamaño letra
EP Datos BLOGS Por KIKO LLANERAS (@KIKOLLAN)

Así es la predicción final de las encuestas en Cataluña

Nuestro modelo electoral agrega docenas de sondeos. Con 10.000 simulaciones calcula los escaños de cada partido y las posibles mayorías. Estos son sus pronósticos

Así es la predicción final de las encuestas en Cataluña

Nuestro modelo electoral predice un empate entre Ciudadanos y ERC —el primero podría ganar en votos y el segundo en escaños— y deja en el aire la mayoría independentista. El modelo agrega docenas de sondeos (publicados antes del sábado 16 de diciembre) y ha sido calibrado con la precisión histórica de miles de encuestas.

Los sondeos se han movido en los últimos días y la semana pasada colocaron a Ciudadanos por delante de ERC. Ciudadanos ronda el 23,3% de los votos; y le siguen ERC (22,2%), Junts per Catalunya (17,7%), PSC (15,3%), CeC-Podem (8%), la CUP (6,2%) y el PP (5,5%). El trasvase desde ERC a JxCat parece haberse parado, pero quizás sigue activo el flujo de votantes del PP hacia Ciudadanos.

Así es la predicción final de las encuestas en Cataluña

La predicción de escaños

A partir del promedio de votos, nuestro modelo calcula los escaños que podría lograr cada partido. Para eso hacemos 10.000 simulaciones de las elecciones en cada provincia.

El gráfico a continuación representa el resultado en escaños.

Así es la predicción final de las encuestas en Cataluña

El modelo dice que ERC rondará los 33 escaños; le siguen Ciudadanos (31-32), JxCat (27), PSC (20), CeC-Podem (9), CUP (8) y PP (6). El gráfico también refleja la incertidumbre de estas elecciones. Las predicciones tienen horquillas de hasta 10 escaños, que pueden parecer excesivas, pero que no son caprichosas: vienen determinadas por el acierto histórico de miles de encuestas que hemos analizado.

La pregunta clave: las posibles mayorías

La principal incógnita del 21-D está en saber qué partidos lograrán una mayoría de escaños, para poder gobernar y escoger presidente. ¿Qué probabilidad tienen distintos partidos de sumar 68 diputados? Esa es una predicción que no pueden hacer las encuestas convencionales, pero que ofrece nuestro modelo electoral.

El gráfico representa la suma de los escaños de distintos partidos en 10.000 simulaciones del 21-D. La masa a la derecha del 68 representa la probabilidad de que una suma de partidos alcance la mayoría.

Así es la predicción final de las encuestas en Cataluña

Ahora mismo, nuestra predicción es que los independentistas (ERC, JxCat y la CUP) tienen un 54% de probabilidades de sumar una mayoría de escaños. Son poco más de la mitad de opciones; prácticamente como lanzar una moneda al aire. En el 46% restante de las simulaciones, son Ciudadanos, PSC, PP y CeC-Podem los que suman 68 escaños, y podrían buscar un acuerdo.

El modelo ve difícil que los tres partidos del bloque constitucionalista logren una mayoría solos. La suma de Ciudadanos, PSC y PP ronda los 58 escaños. No es imposible que mejoren sus encuestas hasta alcanzar los 68, pero es algo que solo pasa 3 de cada 100 veces.

Tampoco está garantizado que puedan sumar ERC, los comunes y el PSC. El acuerdo es complicado política y aritméticamente: los tres partidos sólo alcanzan 68 escaños en el 14% de las simulaciones.

Otra alternativa al bloque independentista es que ERC gobierne apoyado por JxCat y los comunes. Estos tres partidos suman 68 escaños el 70% de las veces. Es probable, pero en absoluto seguro (más o menos tan probable como ver encestarse un tiro libre). En este caso, además, es importante un matiz: la probabilidad de esta suma cae al 48% si el bloque independentista (Si ERC, JxCat y la CUP) no alcanzan la mayoría.

La lucha por el primer puesto

La tabla siguiente representa la probabilidad que tiene cada partido de quedar en cada puesto. Es evidente que no está decidido. De acuerdo con el modelo, Ciudadanos es la fuerza más votada en el 55% de las simulaciones y ERC en el 40%.

Así es la predicción final de las encuestas en Cataluña

Y a continuación mostramos las posiciones en escaños. En este caso, el partido con más opciones de ganar es ERC. Los republicanos ganan en escaños en el 58% de las simulaciones, Ciudadanos en el 34% y JxCat en el 8%. La diferencia del resultado en votos y escaños se debe al sistema electoral. Los escaños en Girona, Lleida y Tarragona se consiguen con menos votos que en Barcelona, y como los partidos independentistas son más fuertes allí, sus resultados en escaños son mejores que sus resultados en votos.

Así es la predicción final de las encuestas en Cataluña

Es importante interpretar bien estas probabilidades y no exagerar las diferencias. La distancia entre ERC (gana el 58% de las veces) y Ciudadanos (gana el 34%) parece muy grande, pero es un resultado igualado. Pensad en un dado. Ciudadanos gana si sale 1 o 2; ERC gana si sale 3, 4 o 5; y si sale 6, ganan ERC o JxCat (a cara o cruz). Es una tirada de datos arriesgada.

Los escaños en cada provincia

El último gráfico representa los escaños en juego, probables y (casi) seguros de cada provincia. El voto útil no es un reclamo tan fuerte como en unas elecciones generales. Pero el modelo sí sugiere estrategias para quienes confíen en sus pronósticos.

Por ejemplo, un votante de Girona que dude entre ERC y la CUP, tiene más opciones de ganar un escaño votando por el primero. En Tarragona hay escaños en juego del PSC y Ciudadanos, pero no del PP ni de los comunes. Y en Lleida, si alguien duda entre los tres independentistas, debería descartar a ERC porque tienen menos escaños en duda.

Así es la predicción final de las encuestas en Cataluña

Metodología de nuestro modelo. Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. El modelo es similar al que usamos en Francia y Reino Unido. Funciona en cuatro pasos: 1) agregar y promediar las encuestas en Cataluña, 2) proyectar ese promedio sobre cada provincia, 3) incorporar la incertidumbre esperada, y 4) simular 10.000 elecciones para calcular probabilidades.

Paso 1. Promediar las encuestas. El modelo agrega las estimaciones de voto de docenas de sondeos. La mayoría pueden consultarse en Wikipedia. Hay dos razones para hacer este promedio: sirve para reducir el error de muestreo y además ofrece una «cocina» de consenso. El promedio está ponderado para tener en cuenta el tamaño de muestra, la empresa encuestadora y la fecha del sondeo. También penalizo las encuestas de una misma empresa en fechas cercanas, para evitar que dominen excesivamente la media. El promedio está ponderado por fecha según una ley exponencial decreciente (con una vida medida de 7 días y una ventana que ignora las encuestas con más de 14 días).

Paso 2. Proyectar el promedio a cada provincia. Antes de calcular los escaños es necesario estimar el porcentaje de votos de cada partido en cada provincia. Para eso hacemos una proyección lineal del promedio de votos en todo Cataluña. La proyección tiene en cuenta resultados históricos en cada provincia (del 26J y el 27S) y los últimos sondeos del CIS y del CEO.

Paso 3. Incorporar la incertidumbre de las encuestas. Este paso es el más complicado. También es el más importante. Para predecir el resultado «más probable» basta usar el promedio de votos y estimar los escaños. Pero si queremos saber qué probabilidad tienen distintos resultados necesitamos algo más: un modelo probabilístico. Necesitamos estimar la precisión esperada para los sondeos en Cataluña. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 1, 2 o 5 puntos? Para responder esas preguntas hemos analizado el error de miles de encuestas.

Calibrar los errores esperados. Primero he estimado el error de las encuestas en España. He construido una base de datos con encuestas de 23 elecciones desde 1982 —incluyendo todas las generales y una docena de elecciones recientes. El error absoluto medio (MAE) de los promedios de encuestas en España ha rondado los 2,1 puntos por partido. Pero esos errores dependen al menos de dos cosas: del tamaño del partido y de la cercanía de las elecciones. Para tener en cuenta esos dos factores hemos recurrido a la base de datos de Jennings y Christopher Wlezien. Hemos analizado los errores de más de 2.700 encuestas en 198 elecciones de 19 países occidentales. Así hemos construido un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tamaño (es más fácil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los días que faltan hasta las elecciones (porque las encuestas mejoran al final).

Distribución. Para incorporar la incertidumbre al voto de cada partido en cada simulación utilizo varias distribuciones multivariables. Uso distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explica Nate Silver. El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que i) la suma de los votos no sobrepase el 100% (unaidea de Chris Hanretty), y ii) consideren correlaciones entre partidos cercanos (por ejemplo, ERC y JxCat). Esas correlaciones las he basado en las matrices de transferencias del CIS y de Metroscopia. La incertidumbre la incorporo con cinco distribuciones, una a nivel catalán y otra en cada provincia. La primera distribución introduce errores iguales para el voto de un partido en toda Cataluña. Es importante hacerlo así porque en general los errores de las encuestas son sistémicos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pasó con algunos modelos de las elecciones de EE UU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviación estándar esperados según la calibración.

Paso 4. Simular. El último paso consiste en ejecutar el modelo 10.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según las distribuciones definidas en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades de que haya una mayoría de ciertos partidos, de que un candidato logre cierto número de votos, quede primero, etc.

Por qué encuestas. El modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que a nivel nacional fallaron por pocos puntos incluso con Trump y con el Brexit. En otras elecciones recientes, como las francesas, las holandesas o las de País Vasco y Galicia, los sondeos dieron poco que hablar porque estuvieron acertados. Las encuestas raramente son perfectas, pero son capaces de predecir elecciones en términos probabilísticas. Además,no existe una alternativa que haya demostrado mayor capacidad de predicción.

Más información