Promedios, medianas y desempleo: análisis de números

Cada mes, cuando la Oficina de Estadísticas Laborales publica su informe de empleos, la gente se concentra en una métrica en particular: la tasa de desempleo. Pero hay muchos otros datos interesantes y potencialmente significativos en el informe, aunque interpretarlos adecuadamente puede ser complicado.


Tomemos, por ejemplo, la duración del desempleo. No hay duda de que hay más personas que permanecen sin trabajo durante más tiempo de lo que ha sido históricamente. El mes pasado, según el BLS, la duración media desestacionalizada del desempleo fue de 35,6 semanas, no muy por debajo del máximo posterior a la crisis de 40,7 semanas a finales de 2011. Antes de que la crisis financiera golpeara con toda su fuerza, la duración media era de alrededor de 16 o 17 semanas.

Pero espromedioduración la mejor medida? Como muestra el gráfico de la derecha, la duración del desempleo está fuertemente sesgada: si bien la mayoría de las personas se agrupan hacia períodos más cortos, hay algunas personas que han estado sin trabajo durante mucho tiempo (3, 4, 5 años o más) y esos casos elevan el promedio más alto. Cuando los datos se distribuyen así, los promedios pueden ser muy engañosos en cuanto a cuál es el valor 'típico'.

En tales casos, la mayoría de los expertos usarían la mediana, el punto medio de una distribución, con la mitad de los valores por encima y la mitad por debajo. La mediana se ve mucho menos afectada por distribuciones sesgadas y valores atípicos (puntos de datos que son inusualmente grandes o pequeños en comparación con el resto del conjunto de datos). losmedianaLa duración del desempleo en junio, desestacionalizada, fue de 16,3 semanas, todavía muy por encima de la duración media típica antes de la recesión de 8 a 9 semanas.

La duración del desempleo no es la única distribución de datos que puede verse demasiado afectada por un puñado relativo de valores atípicos. Los datos de riqueza e ingresos, por ejemplo, están notoriamente sesgados: según el columnista del New York Times Floyd Norris, la riqueza media de los hogares en 2010 (calculada a partir de la Encuesta trienal de las finanzas del consumidor de la Reserva Federal) era aproximadamente una sexta parte de la riqueza promedio de los hogares.


En cuanto a los ingresos, como Stephanie Coontz argumentó recientemente en The New York Times, si Warren Buffett y Oprah Winfrey se les metiera en la cabeza mudarse a Steubenville, Ohio, el ingreso familiar promedio se dispararía de la noche a la mañana de $ 46,341 a $ 75,263. El artículo de Coontz ofrece varios otros ejemplos de distribuciones sesgadas y promedios engañosos.



Observar tanto los promedios como las medianas, y qué tan cerca están entre sí, puede decirle mucho sobre los datos subyacentes. (En una distribución perfectamente normal, serían idénticos). La amplia y continua brecha entre el promedio y la duración del desempleo en los medios (aunque no tan amplia como hace un año aproximadamente) indica que, si bien la mayoría de los estadounidenses desempleados están encontrando trabajo en 20 semanas o menos, un núcleo de desempleados de larga duración permanece sin trabajo durante períodos cada vez más largos. Y tenga en cuenta que, dado que para ser contado como desempleado, una persona tiene que haber buscado trabajo recientemente, estos datos no incluyen a los aproximadamente 7.2 millones de estadounidenses que quieren un trabajo pero no lo han buscado durante el año pasado.