El cherry picking es casualidad

Acabo de ver un artículo de Luis Garicano de 2009 en Nada es Gratis, aplaudido en el primer comentario por Jesús Fernández-Villaverde, donde a partir de los datos de mortalidad infantil de la OECD para España para el periodo de 2004-2006 llega a la conclusión de que en las comunidades con menos población la mortalidad infantil es mayor, por lo tanto su sanidad es peor, ergo las comunidades más pequeñas no pueden dar una sanidad adecuada a sus ciudadanos.

Para hacer esa afirmación tan rotunda es llamativo que use un periodo muy reducido (3 años, 2004-2006), una afirmación que por otra parte va en sintonía con las propuestas de C’s, el partido al que ahora muestra apoyo público Garicano.

Pues bien, en el INE están disponibles los mismos datos en la serie de 1975-2015, y con ellos se puede replicar la gráfica más ilustrativa del artículo de Garicano, solo cambiando el eje de abscisas de escala logarítmica a lineal y manteniendo su representación del eje de ordenadas que no empieza en cero para mejor apreciar los puntos, aunque a costa de amplificar las diferencias. El gráfico es este:

Es interesante estudiar el dato de la tasa de mortalidad infantil de La Rioja, que es el punto que guía a la hora de hacer la interpretación visual, por ser la comunidad autónoma con población más pequeña y mayor tasa. En el otro extremo, de mayor población, están las comunidades catalana y andaluza, donde mientras Cataluña tiene la menor tasa de mortalidad infantil, Andalucía no muestra una buena tasa de mortalidad infantil, pero en fin, para Garicano es un outlier, valor atípico, porque ya se sabe cómo son de Despeñaperros para abajo: ¡no saben ni organizar unos buenos servicios sanitarios con todos los que son!

Lo gracioso es cuando se dibuja cómo ha variado la tasa de mortalidad infantil para comunidades seleccionadas (La Rioja como muestra de peor mortalidad infantil con menor población, Castilla y León por ser una comunidad de tamaño mediano limítrofe con La Rioja y Cataluña como la comunidad con mejor tasa):

Anda, la mortalidad infantil ha cambiado mucho —a mejor—, y La Rioja, muestra más fluctuaciones que las otras dos, totalmente lógico ya que al tener menor población tiene más fluctuaciones estadísticas. He resaltado el periodo que utiliza Garicano en su artículo 2004-2006, y para verlo mejor se muestra un gráfico solo desde 2000:

Se observa cómo La Rioja en los dos últimos años tiene una tasa de mortalidad infantil mejor que Cataluña y Castilla y León, pese a seguir teniendo tan poca población como suele, y que casualmente su peor tasa de mortalidad infantil se da en 2005, justo en el periodo que usa Garicano. ¡Qué mala suerte, vaya! Habrá algún mal pensado que ni haciendo cherry picking se podría haber elegido desde el 2000 un año peor.

¿Y qué pasa si se dibuja la gráfica de comparación de autonomías en un periodo mayor y actualizado por ejemplo con los últimos seis años con datos disponibles ahora en el INE, 2010-2015? Pues este es el gráfico:

Pues no sé, aplicando las enseñanzas de xkcd, no me atrevería a señalar ninguna correlación debida a la población:

Garicano escribía en su artículo:

Si la correlación es causal (y me encantaría oír vuestras hipótesis) esto es un problema serio.

Espero que si lee este artículo, le ayude retrospectivamente.

4 opiniones en “El cherry picking es casualidad”

  1. Brutal. Claro que, cuando se disfruta de una kojobeca black, las cosas se ven de otra manera.

  2. Muy buen análisis. Cierto, escarbando solo un poquito en los sesudos y profundos datos de Garicano y resto de liberales ad usum se les descubre el tomate. Eso si, ellos seguirán imponiendo sus datos. El IBEX35 les paga justo para eso.

Comentarios cerrados.