El pasado sábado en La Sexta Noche, programa de análisis político que se emite en La Sexta los sábados por la noche, nos mostraban unos datos sobre sueldos (sí, con un espacio entre las dos palabras) en España frente a los cuales el economista José Carlos Díez comentaba que era más conveniente utilizar el salario mediano en vez del salario medio. Es decir, la mediana en vez de la media. Y no estamos muy acostumbrados a que en los medios de comunicación se haga esto, más bien al contrario: estamos acostumbrados a que con la media se basten y se sobren para sacar conclusiones. Vamos a explicar qué es la mediana y a comentar por qué es más conveniente que la media en casos como éste, pero antes veamos el vídeo:
Sí, cierto, José Carlos Díez se lía un pelín durante su explicación, pero para eso estamos nosotros aquí, ¿no? Vamos a ello.
Como todo el mundo sabe, la media de un conjunto de datos se calcula sumándolos todos y dividiendo el resultado entre el número de ellos. Por ejemplo, la media del conjunto
es
Imaginemos que estos números corresponden a la cantidad de primos que tienen 10 personas (sí, tener 50 primos ó más puede parecer algo muy exagerado, o irreal, pero hay casos conocidos, como el de nuestro gran amigo José Manuel López Nicolás, aka Scientia, que tiene 60). Si interpretamos la media como una medida representativa del número de primos de estas 10 personas obtenemos por un lado que de media estas personas tienen 9 primos, pero por otro lado se da la situación siguiente, aparentemente paradójica: 8 de esas 10 personas tienen un número de primos por debajo de la media. ¿Es entonces la media una medida representativa de verdad de la situación real? Parece que no.
¿Por qué ocurre esto? Pues porque, como bien me dijeron a mí en Estadística de 1º, la media es muy sensible a valores extremos. Es decir, si tenemos algún valor mucho mayor que la mayoría de los datos la media nos saldrá muy grande respecto a los mismos (que es lo que ocurre con los primos), y al revés si el valor extremo es mucho más pequeño que los demás. Por ello, en casos así la media no es representativa de la situación, por lo que no es conveniente dar el valor medio como dato realista de la población.
Ahora, sí querríamos saber cómo anda la cantidad intermedia de primos. Ese dato sería el que quede justo en el centro de todos (ordenados de menor a mayor), el que deja a la mitad más pequeña de los datos a su izquierda y a la mitad más grande a su derecha. Ese dato se denomina mediana, y en casos así representa la situación real mucho mejor que la media.
¿Cómo calculamos la mediana? Pues muy sencillo:
Ordenamos los datos de menor a mayor. Si tenemos un número impar de datos, la mediana es el dato central. Y si tenemos un número par de datos, la mediana se calcula sumando los dos centrales y dividiendo entre 2 el resultado.
Veamos qué ocurre en el caso de los primos. Ordenamos de menor a mayor:
Y ahora, como tenemos una cantidad par de ellos, sumamos los dos datos centrales y dividimos entre 2:
Esto significa que al menos la mitad de las personas estudiadas tienen 4 primos o menos y la otra mitad tienen 4 primos o más. Como podéis ver, la mediana es mucho más representativa que la media en este caso.
Pues con los salarios ocurre lo mismo. La media solamente sería representativa si los salarios de las personas estudiadas fueran muy homogéneos (muy parecidos todos), pero creo que está bastante claro que en realidad eso no es así. Un ejemplo muy simple:
Imaginad una empresa con 100 trabajadores en la que 60 de ellos cobran un sueldo de 900 €, 20 de ellos cobran 1100, 15 cobran 1400, 4 cobran 2500 y el que queda, el dueño, cobran 20000. Una situación nada descabellada, ¿verdad? Bien, la mediana de los salarios de estos miembros de la empresa es 900, mientras que la media es 1270.
¿Cuál de estos dos datos creéis que representa de una forma más realista la situación de los sueldos de esta empresa? Claramente la mediana, ¿verdad? Sin duda (ya les gustaría a los de abajo, la gran mayoría, que no fuera así). Pues lo mismo ocurre cuando se habla de salarios en España (o en cualquier otro sitio). Si queremos dar un dato que dé información real sobre lo que cobra un español intermedio debemos dar el salario mediano, ya que si damos la media estaremos dando un dato alejado de la realidad.
Por todo ello me alegro de que en La Sexta alguien haya incidido en este detalle (igual que a veces criticamos lo que hacen mal también es justo destacar lo que hacen bien). A ver si de una vez por todas nos damos cuenta todos, tanto los que proporcionan los datos (los que realizan los estudios) como los que los comunican (normalmente los medios de comunicación), de que cuando hablemos de salarios lo más justo y lo más realista es utilizar la mediana en vez de la media. Y no sólo cuando hablemos de salarios, sino, en general, cuando hablemos de pasta: lo que la gente gasta en rebajas, lo que la gente debe a los bancos, o lo que la gente invierte en Lotería de Navidad.
Evidentemente este cambio de medida no se puede hacer de manera radical a los ojos y oídos de la población. Estamos tan acostumbrados a la media que el hecho de cambiar así sin más a mediana podría verse como un intento de manipulación, cuando en realidad es justo lo contrario. Por ello lo ideal sería ir introduciendo el concepto poco a poco y, evidentemente, explicar con claridad ambos conceptos (ejemplos tipo los que aparecen en esta entrada pueden ser interesantes) para que la gente termine por interiorizar la idoneidad del uso de la mediana.
Esperemos que así sea.
Sobre este tema (y alguna cosa más), os recomiendo leer este post que nuestra admirada Clara Grima escribió para JotDown el pasado mes de junio.
¿Te ha gustado la entrada? Puedes invitarme a un café, Gauss te lo agradecerá 😉
Información Bitacoras.com…
Valora en Bitacoras.com: El pasado sábado en La Sexta Noche, programa de análisis político que se emite en La Sexta los sábados por la noche, nos mostraban unos datos sobre sueldos (sí, con un espacio entre las dos palabras) en España frente a ……
http://www.medicine.mcgill.ca/epidemiology/hanley/tmp/DescriptiveStatistics/median_or_mean_height.gif
Esta muy bien el concepto de mediana, pero cuando los que ganan mucho utilizan la misma moneda que los que ganan poco, no se puede sesgar a la ligera para dar una medida más representativa del conjunto, ya que parece un intento de disimular la sinverguencería de algunos.
[…] Cuando hables de salarios utiliza la mediana […]
En lo que to aprendí de estadistica, se decía que estos dos valores individulamente no significaban nada, que un buen dato debia incluir normalmente la media y la desviación cuadrática media.
Como referencia esta el cuento del pollo para dos personas.
Si se lo come 1 solo, Media = 0.5 desviación cuadrática 0.7
Si cada uno come la mitad. Media 0.5 desviación cuadrática 0
Artículo acertado. No obstante a mí se ma ha quedado una variable en el tintero: la amplitud de la distribución de los salarios (su variabilidad). La diferencia entre la media y la mediana puede parecer grande, cerca de 4.000€, pero de acuerdo a la distribución de salarios, en la que unos pocos cobrarán el salario mínimo interprofesional y otros pocos ganarán salarios superiodres a 1 millón de € anual, por ejemplo, ¿es significativa esa diferencia entre media y mediana? Es más, ¿qué pasaría si agrupásemos individuos de acuerdo a su rango de salarios para configurar un histograma?, ¿podría reducirse la… Lee más »
Siempre me han dicho que para obtener datos estadísticos realistas, es necesaria la combinación de dos medidas. Pueden ser la media y la desviación típica o la mediana y la moda.
A mi humilde entender, la media sola es un engañabobos y la mediana sola aporta muy poca información.
Buen artículo. El tema de las medidas de tendencia central y por qué la media es «mala» es muy repetido, pero que merece la pena repetir una vez más.
Sólo un apunte: cuidado con el «sí querríamos» :S
Pau, ¿qué ocurre con el «sí querríamos»?
¡Salarios! Entonces es verdad que hay gente que cobra por trabajar…
En cuanto a los números, no es necesario usarlos. Todo el mundo sabe, especialmente los grandes estadistas como Aznar y Rajoy, que con las tartas de colorines basta.
Excelente artículo, me ha gustado mucho.
gaussianos , creo que Pau se refiere a que el tiempo verbal correcto es: «si quisiéramos».
No creo que José Carlos Díez se líe un pelín, le he entendido perfectamente.
Para mi lo mejor sería mostrar el histograma, si sobre el histograma se indican tanto la media y la mediana, mucho mejor. estudiando el gráfico ya cada cual puede sacar sus conclusiones.
Yo encuentro imposible conocer una distribución con el dato de media y mediana o la media y la desviación típica o incluso con los tres. no todas las distribuciones en esta vida son normales… y en concreto la de salarios no creo que vaya a serlo, supongo que se parecerá más a una weibull que a una distribución normal…
Personalmente coincido con la gente que considera más significativo acompañar el dato de la media con el de la desviación típica, lo que en definitiva nos da una idea de cuán separadas están las muestras de la media. Y si tomamos el siguentes fragmento de la Wikipedia respecto a la desviación estándar, «Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar muestrales son 8.08, 5.77 y 1.15 respectivamente.» , vemos que en los tres casos puestos a modo de ejemplo la… Lee más »
Mejor la media y la desviación típica. No es tan complicado que la gente entienda lo que significan. De hecho, se explican en la ESO, enseñanza básica.
La media y y la desviación típica solo caracterizan a la distribución normal. Los datos de distribución de la renta no son normales (tienen una larga cola a la derecha).
Creo que hoy en día no hay motivo para limitarse a mostrar uno o dos valores para caracterizar una distribución. Bien se puede mostrar toda ella (p.e., con el histograma).
[…] Cuando hables de salarios utiliza la mediana top por escribano en actualidad | economía hace nada […]
Artículo muy acertado, de hecho en mi país (Chile) donde la desigualdad en los ingresos es de las más altas del mundo se habla del promedio de cada decil o quintil (por ejemplo el salario promedio del 20% más pobre del país).
Otro problema de la media para los salarios es que por el extremo de arriba no hay limites, pero por abajo, tienes el mínimo que no será nunca 0, lo que hace que la media sea mucho mayor ya que los extremos no se cancelan.
Con una cantidad de datos como la que se debe usar para computar el salario medio, me imagino que debe ser difícil obtener la desviación cuadrática media, además de que en este caso no es tan informativa como muchos de ustedes creen. Por eso, para el caso del ingreso, se computa también el índice de Gini, que da mas o menos idea de que tan desigual es la distribución del ingreso. Coincido con muchos de ustedes, el dato, por sí solo no es realmente significativo, pero acompañarlo de la DCM no aportaría tanta información como creen, en este caso. Porque… Lee más »
Pio, respetuosamente discrepo respecto del tiempo verbal.
La forma indicada por ti como correcta, es decir, «si quisiéramos» requeriría otro tipo de frase, una frase condicional: «si quisiéramos hacer X, entonces Y». Pero no es la frase utilizada por el autor.
Lo que el autor dice es que ahora, en este momento, «SÍ QUERRÍA» hacer algo, no es una frase condicional sino una frase asertiva del tipo «ahora me tomaría un helado».
Gaussianos, muy bien por el artículo. 🙂
Cualquier parámetro o conjunto de ellos utilizado para estimar los ingresos de los trabajadores de un país, sea con medias, medianas, desviaciones, hiistogramas, etcétera , debe considerar TODOS los elementos implicados. La población considerada tiene que incluir el número de parados con salario 0 y sin prestación por desempleo y los parados que sí la perciben. De ese modo estaríamos más cerca de saber cual es la situación real.
Pio, fíjate que el «sí» tiene tilde, por lo que no entra un «quisiéramos» en esa frase. Como comenta reygecko, es una afirmación: «SÍ querríamos».
JJGJJG, eso es evidente, lo suyo sería incluir a todo el mundo y dar todos los datos. La idea de mi artículo es la siguiente: «Si vas a usar solamente un dato usa la mediana».
con el matiz del acento en Sí, opino que es correcto el «querriamos»
[…] […]
Muy buen articulo. Supongo que, como siempre, según la situación que el medio de comunicacion quiera describir, utilizara un dato u otro. Se agradecen los programas y blogs que explican las noticias, y no sólo las cuentan. Reygecko, debes ser de la misma ciudad o de alguna próxima a la del autor del artículo. Tengo incluso curiosidad por conocer cuál es porque dos errores como ese pueden indicar una realidad lingüistica de esa zona y no un simple lapsus. La frase correcta es «si quisiera». http://elcastellano.elnortedecastilla.es/castellano/aula/pret%C3%A9rito-imperfecto-del-subjuntivo «Existe también en español un pretérito imperfecto de subjuntivo (también llamado simplemente imperfecto o… Lee más »
Aunque en esa imagen que está en la portada del vídeo (no voy a reproducirlo) también aparece que el salario de las mujeres es inferior al de los hombres. Tan estadístico como inventarse las cifras: solo se puede comparar en el mismo puesto y categoría profesional, no en plan churras y merinas, como hacen ahí. Los convenios colectivos fijan las bandas salariales y jamás he visto las absurdas diferencias que siempre se publican. Por eso no me molesto en reproducir el vídeo.
Insisto, utiliza la mediana pero incluye los parados. O tienen salario 0 o tienen una prestación inferior a su salario real pero durante un tiempo limitado.
Pues a mí me gustaría, aún más, el sueldo moda, el que más se repite.
Como han sugerido anteriormente, yo creo que lo mejor para representar una distribución es tratar de caracterizarla totalmente, ?es una normal? Una weibull? Es discreta? Es binomial? Y un largo etc. Y por supuesto con sus parámetros que las definen.
?por qué limitarse a un solo parámetro para caracterizar una distribución?
Ya se que esta entrada trata eso, y que es mejor la mediana que la media para los sueldos, pero lo mejor seria contar con toda la información disponible, y no hay razón para no usarla cuando esta disponible.
Todos los comentarios son una sarta de despropósitos. Solo ha faltado alguien discutiendo la tipografía. Me recuerdan a un personaje del Criptonomicon. El que cuando ingresa en el ejercito le hacen un test de inteligencia y en la primera sencilla pregunta agota el tiempo con complejos cálculos de dinámica de fluidos. Le clasifican de retrasado mental. Aquí se trata de la señora Paca que llega reventada de trabajar y se sienta un rato delante de la tv. Se discute como darle una información lo más exacta posible para una persona de un nivel formativo lamentable y agotada. Si le empiezas… Lee más »
Siempre digo a mis alumnos que a la hora de entender las noticias lo mejor es no escucharlas, porque mi país siempre las estadísticas están manipuladas. En lo que concierne al salario, la mediana incluyendo como dice JJGGJJGG los de salario 0 (y aquí habría que considerar a aquellos en edad laboral que no hallan empleo, no a los que pudiendo trabajar les gusta vivir de lo ajeno como sea), sería un buen indicador de quien es el intermedio. Pero si queremos ver como está realmente distribuida la riqueza salarial, la moda es lo que mejor representa la realidad. Y… Lee más »
Es discutible: Si la mediana se aleja de la moda tampoco es muy representativa.
En cualquier caso, los estadísticos de Mediocristán sirven de poco en Extremistán (Nassim Nicholas Taleb & Chris Anderson).
http://jmonzo.blogspot.com.es/2008/03/el-cisne-negro-de-nassim-nicholas-taleb.html
http://jmonzo.blogspot.com.es/2008/02/tendencias-emergentes-economa-long-tail.html
También hay gente que escribe que busca la mediana en las palabras. La matemática no está tan alejada de las letras y del pensar letresco; no debo estarlo; hay que enlazar. También la matemática es escritura.
http://ellaberintogrotesco.blogspot.com.es/2013/07/la-palabra-mediana-de-barthes.html
Nunca me cansaré de recomendar a periodistas y demas fauna de los medios de comunicación , el libro de John Allen Paulos, «un matemático lee el periódico» : http://www.papelenblanco.com/divulgacion/un-matematico-lee-el-periodico-de-john-allen-paulos
Está claro que lo mejor es tener la televisión en off….
Entonces, si el «sí» tiene tilde y es, como comentas, una afirmación, lo que sobra es la coma para evitar confusiones: «Ahora sí querríamos…» en lugar de: «Ahora, sí querríamos…» porque en este último caso «ahora» parece sinónimo de «ahora bien», que iría lógicamente seguido de una condicional. Otros dos factores que llevan a la confusión son: La afirmación debería ir como final de un párrafo (si efectivamente fuera una frase de afirmación aislada) y no como inicio de otro, pues da la impresión de abordar un nuevo escenario en lugar de concluir uno. La frase siguiente es una condicional.… Lee más »
Gaussianos:
¿Por qué no aceptan que la cagaron?
«Ahora, sí querríamos saber cómo anda la cantidad intermedia de primos. Ese dato sería…»
«Ahora, si quisiéramos saber cómo anda la cantidad intermedia de primos, ese dato sería…»
El artículo está muy interesante, me gustó.
Estadística salarial 2011 (INE).
Media: 22.899,35 €
Mediana: 19.287,24 €
Moda: 15.500 €
Fuente: http://www.ine.es/prensa/np790.pdf
PD. Aunque la mediana se vista de seda…
Para evitar estos desaguisados estadísticos, en economía se suele usar la curva de Lorenz o el coeficiente de Gini:
http://es.wikipedia.org/wiki/Curva_de_Lorenz
http://es.wikipedia.org/wiki/Coeficiente_de_Gini
Pero claro, es más complicado explicar esto en televisión. La única solución es acompañar siempre la desviación estándar junto con la media.
[…] El pasado sábado en La Sexta Noche, programa de análisis político que se emite en La Sexta los sábados por la noche, nos mostraban unos datos sobre sueldos (sí, con un espacio entre las dos palabras) en España frente a los cuales el economista José Carlos Díez comentaba que era más conveniente utilizar el salario mediano en vez del salario medio. Es decir, la mediana en vez de la media. […]
Ernesto, porque yo no quería decir lo que has escrito tú en la segunda frase. La mía lleva una afirmación, «sí», y la tuya un condicional, «si».
[…] El pasado sábado en La Sexta Noche, programa de análisis político que se emite en La Sexta los sábados por la noche, nos mostraban unos datos sobre sueldos (sí, con un espacio entre las dos palabras) en España frente a los cuales el economista José Carlos Díez comentaba que era más conveniente utilizar el salario mediano en vez del salario medio. Es decir, la mediana en vez de la media. Y no estamos muy acostumbrados a que en los medios de comunicación se haga esto, más bien al contrario: estamos acostumbrados a que con la media se basten y… Lee más »
[…] dues entrades interessants que poden ampliar el coneixement sobre aquests mètodes estadístics: Guassianos ( Cuando hables de salarios…) i Clara Grima (Con medias y a lo loco). Aquestes […]
Muy buen post, muchas gracias.
Discrepo: toda tabla o gráfica de distribución debe incluir la media en unidades reales. La mediana es un indicador que se puede calcular -en medias de la distribución- a partir de una tabla de deciles o de datos de la curva de Lorenz. Si por ejemplo la mediana da 400 unidades y la media es de 800, podemos decir que la mediana es igual a 400/800=0.5 medias de la distribución. El índice de Gini es muy polisémico, la desviación estándar es dimensional y poco útil. Hay otro dato interesante para entender la concentración: qué porcentaje de la población percibe la… Lee más »
[…] é representativo (e menos ainda para a estrutura salarial espanhola), porque, como você explicou Gaussian ” é muito sensível a outliers. Ie se temos um valor muito maior do que a maioria teremos […]
[…] toma la media como referencia ya que los sueldos más altos la distorsionan, tal y como se aclara aquí. La mediana, en este caso, en una explicación exprés, sirve para saber cual es el sueldo tipo […]
[…] La media solamente sería representativa si los salarios de las personas estudiadas fueran muy homogéneos (muy parecidos todos), pero creo que está bastante claro que en realidad eso no es así. […]
[…] En la Unidad de Estadística estamos trabajando el uso (o mal uso de los teléfonos celulares) Quiero dejar aquí algunas páginas que he hallado en al web de referencia a este tema y que ayudan a la concientización en relación al uso del móvil Nota en la Voz del interior – 2 de Agosto 2015 Institute of Advanced Motorists. Asociación Luchemos por la vida Sitio donde se explica el verdadero valor de la mediana […]
[…] toma la media como referencia ya que los sueldos más altos la distorsionan, tal y como se aclara aquí. La mediana, en este caso, en una explicación exprés, sirve para saber cual es el sueldo tipo […]
[…] Cuando hables de salarios utiliza la mediana, no la media. […]