top of page
Foto del escritorJavier Cone

Una historia desde los datos: ¿Qué pasa con Madrid?

Tras revisar los diferentes tutoriales de Cairo y practicar con las bases de datos propuestas, estuve consultando algunas otras de interés personal, como las de porcentaje de mujeres entre los graduados STEM (Wolrd Bank) y los graduados en general (INE).


Precisamente mirando información en estas bases de datos llegué a una sobre saldos migratorios internos en España. Me pareció interesante en relación con la España vaciada y todas las polémicas sobre el papel de Madrid dentro de este fenómeno (en unos días se celebran unas elecciones autonómicas, con sabor nacional, en las que la vida “a la madrileña” se ha convertido en ente político propio). Así que me dispuse a limpiarla en Excel y hacer algunas visualizaciones en InZight, más por practicar de cara a la PEC que por descubrir algo nuevo. Pero, muchas veces, las historias nos encuentran a nosotros.


Toda historia parte de los datos

Empezamos obteniendo la base. El Instituto Nacional de Estadística nos permite elaborar nuestros propios informes jugando con una serie de variables. Algunas de ellas son obligatorias si están incluidas en el estudio, por lo que deberemos ajustar y limpiar la base para adaptarla a nuestras necesidades. Estos son los datos de la que descargué:

  • Nombre INE: Saldo migratorio interprovincial por semestre, provincia, sexo y edad.

  • Variables: Provincias (52), Sexo (Ambos sexos), Edad (Total), Periodo (2015S1 a 2019S2).

  • Presentación: Periodo, Sexo y Edad en columnas. Provincias en Filas.

¿Por qué estos datos? En principio, no me interesaba profundizar en los grupos de edad o el sexo de los migrantes internos, y estimé que el periodo de 5 años podía ser interesante. Por una parte, porque nos aleja de muchas migraciones provocadas por la crisis económica de 2008 y, por otra, porque recoge los años en los que “la España vaciada” ha entrado de lleno en los debates político y público. Quise excluir, además, el primer semestre de 2020, último periodo recogido por el INE, por lo particular de la situación pandémica y por la inexistencia de datos sobre el segundo semestre.


Una vez tuve la base de datos en formato XLS, abrí Excel para empezar a trabajarlos. Lo primero fue crear una copia del archivo original y eliminar las cabeceras y pies de nuestro archivo de trabajo. Puesto que había decidido prescindir de las variables Sexo y Edad, también tuve que eliminar sus textos. La información venía dada por semestres, pero no consideraba suficientemente importante esta separación, así que procedí a unirlos con la fórmula SUMA e incluir un agregado de los saldos migratorios en 5 años. Tras esto, unas pequeñas extracciones de texto (DERECHA(Xn;LARGO(Xn)-n) en los nombres de años y provincias (el formato del INE es aaaaSn y nn Provincia, respectivamente), para quedarnos con algo así:


Tras aplicar filtros y comprobar que no había ningún dato, a priori, extraño, pasé a calcular las estadísticas en otra hoja. La moda (MODA) no tenía mucho sentido, como bien me indicó Excel con su N/A, al tratarse de cifras muy concretas y no coincidentes. La media (PROMEDIO) y la mediana (MEDIANA) a 5 años sí empezaron a arrojar datos interesantes:


Mientras que la mitad de provincias tenían un saldo inferior a -855,5 personas, y la otra mitad superior, la media del saldo migratorio en España era prácticamente de 0. Una distribución extraña y, pensé, motivada por las provincias en las que se encuentran las grandes ciudades. ¿Por qué no comprobarlo con InZight?


Saldo migratorio interno en España, por provincias, de 2015 a 2019.


Algo pasa con Madrid, pero no solo con Madrid

Efectivamente, la barra azul que se aleja del resto del histograma es la Comunidad de Madrid. Revisando los datos, vemos que entre 2015 y 2019 ha registrado un saldo migratorio positivo de 66.193 personas. Con una media de 0,02 y una mediana de -855,5 personas, podemos observar la enorme diferencia respecto al resto de provincias. Aquí tenemos nuestra primera historia: Madrid ha registrado un saldo migratorio exagerado en comparación al resto de las provincias de España. Sus datos se alejan de la media y de la mediana más de 65.000 puntos, estadísticas que eleva de tal forma que puede distorsionar la interpretación. Por ello, decido calcular ambas cifras sin tener en cuenta a Madrid:

La mediana varía en más de 5.000 puntos, algo comprensible al eliminar un elemento cualquiera de la serie, ya que las diferencias entre los primeros y últimos elementos y los que se ubican en los cuadriles 2 y 3 es muy pronunciada. Más impactante es la variación de la media, que pasa de 0,02 a -63.302 habitantes.

Con estas cifras, es fácil establecer una relación entre el vaciado de España y la concentración en Madrid pero, ¿qué más información ocultan nuestros datos? ¿Qué provincias se están vaciando, cuáles están creciendo, y dónde están las otras grandes ciudades españolas?



Saldo migratorio interno en España, por provincias, de 2015 a 2019.


Respuesta: En el nuevo histograma, podemos ver que Jaén (-16.466), Ciudad Real (-10.952), Córdoba (-10.291), Badajoz (-8.676) y la dupla de Cádiz (-7.757) y Cáceres (-7.772) son las provincias que registran un saldo migratorio más negativo entre 2015 y 2019. Baleares y Málaga (15.035), aunque a mucha distancia de Madrid, son la segunda y tercera provincia con mejor saldo, seguidas de Valencia (6.786). En cuanto a las provincias que alojan la segunda y la cuarta ciudad del país, Barcelona (-1.563) y Sevilla (-7.991), han registrado saldos casi neutros o negativos. En nuestro excel podemos consultar los datos exactos, que añado entre paréntesis.


De estos datos podemos extraer indicios para otra historia: ¿Por qué registra Barcelona un saldo migratorio negativo? ¿Qué ocurre en Andalucía, para que su mayor provincia y sede de la cuarta ciudad del país, Sevilla, tenga un saldo tan negativo frente al de la segunda provincia, Málaga? Como vemos, hay historias más allá de Madrid.

¿Y si jugamos con el tiempo?

Habíamos bajado datos de 2015 a 2019, por semestre, que luego habíamos agrupado en años. Por eso, pensé que podría ser interesante ver si ha habido variaciones en estos saldos migratorios. Estos datos pueden ayudarnos a identificar qué fenómenos explican lo que nos ha llamado la atención a primera vista.


Saldo migratorio interno en España, por provincias y saldo acumulado 2015-2019. Comparativa de 2015 contra 2019.


Este gráfico está entre mis favoritos. Es un scatter que nos cruza los datos del primer año de la serie (2015) y el último (2019) y que, además, aumenta el tamaño del círculo en función del saldo a 5 años. Hemos tenido que enfatizar este tamaño, ya que la gran diferencia de Madrid con el resto de provincias impedía que estas se mostraran correctamente. El gráfico puede parecer confuso, ya que concentra gran parte de los puntos en torno al 0-0. Pero, buscando historias, lo que más nos interesa es precisamente aquellos puntos que se alejan del grupo. Pasamos al gráfico a InZight Lite para poder jugar con su interactividad, y aparecen nuevos personajes interesantes preparados para protagonizar sus historias:

  • Sin necesidad de un gráfico interactivo, vemos ya como el margen en el que se mueven los datos es, especialmente en la parte superior, muy diferente entre 2015 y 2019. De un límite superior a 20.000 hace 6 años, pasamos a uno de 4.000 hace dos.

  • Madrid, nuestro punto loco, nos da una explicación: mientras que en 2015 tuvo un saldo migratorio de 21.809 personas, en 2019 fue de solo 3.580.

  • De hecho, aunque lejos en el eje X de 2015, el Y de 2019 muestra 5 puntos más cerca de Madrid. Se trata de Málaga, Valencia y Baleares, que ya habíamos identificado, y de dos nuevos actores: Tarragona y Toledo.

  • Tarragona pasó de un saldo negativo de -1.411 en 2015, a uno positivo de 2.465 en 2019. El caso de Toledo es más sorprendente, pasa de perder 2.646 migrantes internos en 2015 a ganar casi la misma cifra, 2.426, en 2019.

  • ¿Y abajo? ¿Quién destaca? Encabezando la lista negativa en 2015 y segundo en 2019, Jaén. Pero, siendo, por mucho, la provincia con el saldo migratorio más bajo en 2019 mientras que tuvo el segundo saldo más alto en 2015, encontramos a Barcelona. Si en 2015 su saldo fue de 5.603, en 2019 perdió hasta 6.169 personas en migraciones internas.

Una historia: Madrid, la España llenada

Ya habíamos decidido que Madrid podría protagonizar una de nuestras historias y, actualidad mediante, vamos a dejarnos llevar por ese dato llamativo. Analicemos estos casos con detalle gracias a nuestra base de “Saldos migratorios” y a dos nuevas bases, “Saldos migratorios por comunidad autónoma” y “Flujos migratorios”. La primera de ellas utiliza las mismas variables que nuestra base provincial, pero sus datos vienen ya agrupados por año. Por lo tanto, el trabajo con la base será similar al que hicimos con la provincial. En cuanto a la base de datos de “Flujos migratorios”, nos muestra todos los movimientos entre provincias que se han dado en los años elegidos (de nuevo, 2015-2019), según su destino y origen.


Nos fijaremos primero en la base de “Flujos migratorios”. Tras limpiar la base y obtener unos cálculos, llegamos a que Madrid fue el destino de 70.756 personas en 2019, mientras que 67.176 abandonaron la comunidad. Como vemos, y con los ajustes estadísticos pertinentes, estos datos concuerdan con nuestra base de saldos:

Con las bases personalizadas “Flujo migratorio interprovincial” con “Origen Madrid” y “Destino Madrid”, elaboramos una tercera base de saldos migratorios interprovinciales en los últimos cinco años. Así, bajamos los datos de nuestra base inicial para conocer cómo es la relación migratoria de Madrid con cada provincia. ¿Podremos resolver así nuestras dudas?


Saldo migratorio interno en la Comunidad de Madrid, de 2015 a 2019.


Comencemos con el histograma del total a 5 años. Como ya vimos, la mayoría de provincias han aportado migrantes a Madrid entre 2015 y 2019. Solo 4 de ellas resultan en un saldo migratorio positivo al compararse con la provincia de la capital. Con nuestro segundo histograma podemos averiguar cuáles son: Toledo, Guadalajara, Baleares y Alicante.


Anteriormente, habíamos detectado que el saldo migratorio iba decreciendo año a año, pasando de los más de 21.000 migrantes en 2015 a los poco más de 3.500 en 2019. Si comparamos el primer y el último año de la serie, a la vez entre los que existe la mayor diferencia, y además modulamos cada punto en función de su peso en el agregado a 5 años, obtenemos este gráfico:

Saldo migratorio interno entre la Comunidad de Madrid y el resto de provincias, por saldo acumulado 2015-2019. Comparativa de 2015 contra 2019.


De saldos casi exclusivamente positivos en 2015 y un saldo máximo que sobrepasa los 1.000, en 2019 pasamos a movernos entre el -1000 y el 1.000, sin alcanzar esta última cifra. Si vamos a InZight Lite para hacer zoom en aquellos puntos más discordantes, nuestra historia comienza a completar su elenco:

  • Ciudad Real, el mayor punto del gráfico y también el más extremo. Tanto en 2015 como en 2019 es el que genera mayor saldo migratorio en favor de Madrid, pero pasa de 1201 a 710, en una bajada de casi 500 puntos.

  • Sevilla y Salamanca, segunda y tercera ciudad que más aportaban al saldo migratorio, también reducen esta aportación de 913 y 847, respectivamente, a 388 y 499.

  • Barcelona, fruto de su propia historia, ya la tercera provincia que más saldo aporta a Madrid en 2019, multiplicando por 4 su papel en 2015. La segunda, Badajoz, es otra de las que ve caer esta migración hacia el centro peninsular.

  • Y en el otro extremo de la tabla, las provincias limítrofes con Madrid, como Guadalajara o Toledo, pasan de un saldo en favor de la capital de 397 y 1604, a uno negativo por el que Madrid pierde 1227 y 2632.


A tenor de este último dato, uno más. Recordemos nuestra base de “Saldos migratorios por comunidades autónomas”, que finalmente no hemos utilizado en el caso madrileño. La quinta comunidad con mayor crecimiento en 2019 fue Castilla-La Mancha. A su vez, es la única que en 2015 tenía un saldo negativo (en concreto, de -8.735) y en 2019 uno negativo (902).


Conclusión: Historias (y preguntas) por todas partes

De nuestro primer histograma surgió la historia que he analizado en esta PEC: el caso de Madrid y su saldo migratorio rompe-estadísticas. Sin embargo, el trabajo con InZight nos ha desvelado, al menos, otras dos historias, y nos ha ido contando cómo la migración masiva a Madrid estaba decreciendo año a año.


Se me ocurren muchas preguntas a raíz de los datos utilizados: ¿Se está parando el fenómeno de la España vaciada? ¿Está empezando el cinturón de Madrid a recuperar parte de su población? ¿Estamos cansados de vivir en grandes ciudades o en provincias masificadas? Si miramos a Cataluña y a como la provincia que aloja su capital, Barcelona, ha pasado en apenas 5 años de ganar a perder migrantes, ¿qué peso habrá tenido la declaración de independencia y el abandono de determinadas empresas? ¿Está experimentando Barcelona un caso similar al de Madrid, con su cinturón provincial creciendo (acordémonos de Tarragona) mientras la provincia pierde fuelle? Y si miramos al sur, a la región más poblada, ¿está en peligro esta supremacía, teniendo en cuenta que solo Málaga se dibuja como un lugar que atrae migraciones internas?


Lo mejor de los datos es que incluso aquellas variables que hemos descartado nos ocultan historias. ¿En España migran más los hombres o las mujeres? ¿Cómo se dan estos saldos migratorios según los grupos de edad? Descarté, por ejemplo, incluir “nacionalidad”, tras probarlo y ver que los resultados no presentaban grandes diferencias, salvo en Barcelona, donde si solo tuviéramos en cuenta a la población nacida en España, los datos negativos se multiplicarían por 8, arrojando un saldo acumulado en 5 años de más de -8.000 migrantes.


Con todo esto, no puedo más que impresionarme, como periodista y como estudiante, de lo gigantesco que es el mundo que debemos cubrir. De cómo cada uno de nosotros no está compuesto solo de millones de átomos, sino también de miles de datos. Y de cómo cada dato puede ocultarnos cientos de historias.


Referencias

  • Cairo Touriño, A. (s.f.). El Arte honesto. Recuperado de www.uoc.edu

  • Cairo Touriño, A. (s.f.). Limpiando datos con excel [Tutorial] . Recuperado de www.uoc.edu

  • Cairo Touriño, A. (s.f.). Análisis estadístico y visualización. Recuperado de www.uoc.edu

  • Estadística para todos (s.f.). Página web. www.estadisticaparatodos.es

  • Malaprensa (s.f.). Página web. www.malaprensa.com

  • Maqueda, A. (2017). La pobreza severa baja en España pero la desigualdad no se corrige’. El País. Publicado el 25 de abril de 2017. Recuperado de www.elpais.com

Bases de datos consultadas


Comments


bottom of page