Media vs mediana vs moda
La media, la mediana y la moda son las principales medidas de tendencia central utilizadas en las estadísticas descriptivas. Son completamente diferentes entre sí y los casos en los que se utilizan para resumir los datos también lo son.
Media
La media aritmética es la suma de los valores de los datos dividida por el número de valores de los datos, es decir,
[látex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/látex]
Si los datos provienen de un espacio muestral, se denomina media muestral ([latex]\bar{x} [/latex]), que es una estadística descriptiva de la muestra. Aunque es la medida descriptiva más utilizada para una muestra, no es una estadística robusta. Es muy sensible a los valores atípicos y las oscilaciones.
Por ejemplo, considere el ingreso promedio de los ciudadanos de una ciudad en particular. Dado que todos los valores de los datos se suman y luego se dividen, el ingreso de una persona extremadamente rica afecta significativamente la media. Por lo tanto, los valores medios no siempre son una buena representación de los datos.
Además, en el caso de una señal alterna, la corriente que pasa a través de un elemento varía periódicamente de la dirección positiva a la dirección negativa y viceversa. Si tomamos la corriente promedio que pasa por el elemento en un solo período, dará un 0, lo que significa que no ha pasado corriente por el elemento, lo que obviamente no es cierto. Por lo tanto, en este caso también, la media aritmética no es una buena medida.
La media aritmética es un buen indicador cuando los datos están distribuidos uniformemente. Para una distribución normal, la media es igual a la moda y la mediana. También tiene los residuos más bajos cuando se considera el error cuadrático medio; por lo tanto, la mejor medida descriptiva cuando se requiere representar un conjunto de datos por un solo número.
Mediana
Los valores del punto medio de datos después de organizar todos los valores de datos en orden ascendente se definen como la mediana del conjunto de datos. La mediana es el segundo cuartil, el quinto decil y el percentil 50.
• Si el número de observaciones (puntos de datos) es impar, entonces la mediana es la observación exactamente en el medio de la lista ordenada.
• Si el número de observaciones (puntos de datos) es par, entonces la mediana es la media de las dos observaciones intermedias en la lista ordenada.
La mediana divide la observación en dos grupos; es decir, un grupo (50%) de valores superiores y un grupo (50%) de valores inferiores a la mediana. Las medianas se usan específicamente en distribuciones asimétricas y representan los datos bastante mejor que la media aritmética.
Modo
La moda es el número que más aparece en un conjunto de observaciones. La moda de un conjunto de datos se calcula encontrando la frecuencia de cada elemento dentro del conjunto.
• Si ningún valor aparece más de una vez, entonces el conjunto de datos no tiene moda.
• De lo contrario, cualquier valor que ocurra con la mayor frecuencia es una moda del conjunto de datos.
Puede existir más de 1 modo en un conjunto; por lo tanto, la moda no es una estadística única de un conjunto de datos. En una distribución uniforme, hay una moda. La moda de una distribución de probabilidad discreta es el punto donde la función de masa de probabilidad alcanza su punto más alto. A partir de las interpretaciones anteriores, podemos decir que los máximos globales son modas.
Considere la aplicación de las tres medidas al siguiente conjunto de datos.
DATOS: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Media=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8.12
Mediana=9 (elemento 13)
Modo=9 (frecuencia de 9=5)
¿Cuál es la diferencia entre la media, la mediana y la moda?
• La media aritmética es la suma de los valores (observaciones) dividida por el número de observaciones. No es una estadística sólida y depende en gran medida de la naturaleza de la distribución normal dentro de la distribución considerada. Un solo valor atípico puede causar un cambio significativo en la media dando valores relativamente engañosos. El concepto se puede extender a la media geométrica, la media armónica, la media ponderada, etc.
• La mediana son los valores medios del conjunto de observaciones y se ve relativamente menos afectada por los valores atípicos. Puede dar una buena estimación como estadística de resumen en casos muy sesgados.
• La moda son los valores de observación más comunes en el conjunto de datos. Si la distribución tiene un sesgo positivo, la moda se encuentra a la izquierda de la mediana y, si tiene un sesgo negativo, la moda se encuentra a la derecha de la mediana.
• Si tiene sesgo positivo, la media es derecha a la mediana; si la media sesgada negativamente está a la izquierda de la mediana.
• En la distribución normal, las tres, la media, la moda y la mediana son iguales.