El objetivo de este artículo es hacer visible de una manera divertida las diferencias entre media y mediana; y cuando una de ellas no es adecuada para describir un conjunto de datos.
La media de unos datos es obtenida como la suma de los valores, dividida por el número total de elementos. Mientras que la mediana es el valor de variable de posición central en un conjunto de datos ordenados.
Para hacer claramente visible la diferencia entre media y mediana, utilizaremos un ejemplo hipotético. Digamos que hay 10 personas en un bar:
La media de salario anual de los presentes en el bar es: 29.700€. No hay una mediana definida pero sería entre 27.000 y 29.000€.
Y entonces entra Amancio Ortega (ta-ta-ta-chán…).
Como ahora la persona más rica del bar es mucho más acaudalada que el resto, la media del salario anual se ha disparado a 104 Millones de Euros. Sí, Amancio cobra eso, sólo en dividendos.
Mientras que la mediana, sigue en la misma zona, ahora definiéndose en Pilar con 29.000 €.
La mayoría de la gente convendrá en que 29.000 € es una mejor representación del salario anual en España que 104 Millones de Euros.
El ejemplo trata de ilustrar que la media es una cifra “resumen” que se ve afectada por valores extremos mientras que la mediana mucho menos. De manera que para distribuciones de datos sesgados, la mediana es una mejor medida del centro.
Así pues comencemos a hablar menos con las medias y más con las medianas.
Inspiración: https://introductorystats.wordpress.com