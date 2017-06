Los votantes del PSOE son los más bajitos y tienen tendencia al sobrepeso. Eso dicen los datos del CIS. Los socialistas miden 1,72 metros de media, mientras que los hombres que simpatizan con Ciudadanos —que son los más altos—, miden 1,76. Con las mujeres pasa lo mismo: las votantes del PSOE son las más bajas y las de Ciudadanos, las más altas.

Los votantes del PP y el PSOE son más bajos y pesados, mientras que los partidos nuevos tienen un electorado alto y más delgado. Por ideología las diferencias son más matizadas, con una excepción: las personas que se dicen muy de derechas tienden a ser muy bajitas.

¿Pero de dónde salen estas diferencias? Muchos lectores estarán pensando en una clave: la edad de los votantes. Los jóvenes prefieren a los partidos nuevos —Podemos y Ciudadanos— y eso puede explicar que tengan electorados altos y delgados. En el gráfico siguiente se ve claro el efecto: los votantes de todos los partidos tienden con la edad a medir menos y pesar más.

La edad explica en parte el primer gráfico: UP y C's tienen votantes más altos (y delgados) porque les votan jóvenes.

Pero no lo explica todo. Si miráis con atención el gráfico anterior, veréis que la curva de C's aparece por encima del PSOE en altura (y por debajo en peso). La diferencia entre los dos partidos permanece incluso corrigiendo por franjas de edad. Para medirlo he hecho un pequeño análisis estadístico. Al introducir controles por edad, las diferencias de sobrepeso entre partidos casi desaparecen y dejan de ser significativas. Pero las diferencias en altura resisten: con la misma edad, los votantes del PSOE son más bajos (un centímetro) y los de C's, más altos (otro centímetro).

De nuevo esa diferencia se explica probablemente con motivos distintos al voto. Basta por ejemplo considerar añadir la variable clase social —del CIS— para que las diferencias entre partidos desaparezcan. En general, como se ve en el gráfico, las personas de clases altas y medias-altas son más delgadas y miden más.

Correlación no implica causalidad

Este texto es un juego estadístico, pero tiene un propósito: sirve para ilustrar la diferencia entre correlación y causalidad. Las características que observamos en un grupo (votantes o cualquier otra cosa) no siempre son causales. A veces son fortuitas y muchas veces tienen una causa indirecta. Los votantes del PSOE son más bajitos, pero no han elegido al partido por eso, sino que otras variables —como su generación— explican a la vez cuánto miden y el partido que prefieren. Su voto y su altura están correlacionados, aunque ninguno es causa del otro.

Esta distinción entre causas y correlaciones es importante. Es útil conocerla para responder preguntas y evitar errores en el día a día. Pero también hay quien se pasa de frenada y casi desecha las correlaciones como algo inútil. Es un error: que una relación no sea causal no la hace falsa. Imaginad, por ejemplo, un partido político que tuviese muchos simpatizantes con animales de compañía. El partido no tiene una agenda especial sobre el tema, pero sus votantes son jóvenes urbanitas con rentas medias, y ese perfil hace —estoy especulando— que tengan mascotas. La relación entre el partido y las mascotas no es causal, pero desde luego importa. Imaginad qué pasaría si el partido se declarase partidario de los toros o pusiese un impuesto a los veterinarios. Las mascotas no eran "la causa" de esos votos, pero sí podrían ser la causa de la pérdida de esos votos.

Metodología. Todos los datos provienen del barómetro del CIS de marzo de 2017. El estudio consta de 2.500 entrevistas. Los resultados están sujetos a márgenes de error (en especial los cruces de más de dos variables). En el primer gráfico, Unidos Podemos no incluye a las confluencias, pero sí en el resto. Los datos de los gráficos dos y tres son un suavizado de los datos reales con un algoritmo 'Loess' para capturar las tendencias y reducir el ruido. Para el análisis estadístico introduciendo controles he usado un modelo de regresión lineal en el que la variable a explicar era el sobrepeso (o la altura) y las explicativas eran el sexo, la edad y la clase social.