Desviación estándar frente a la media
En estadística descriptiva e inferencial, se utilizan varios índices para describir un conjunto de datos correspondiente a su tendencia central, dispersión y asimetría. En la inferencia estadística, estos se conocen comúnmente como estimadores, ya que estiman los valores de los parámetros de la población.
La tendencia central se refiere y ubica el centro de la distribución de valores. La media, la moda y la mediana son los índices más utilizados para describir la tendencia central de un conjunto de datos. La dispersión es la cantidad de dispersión de datos desde el centro de la distribución. El rango y la desviación estándar son las medidas de dispersión más utilizadas. Los coeficientes de asimetría de Pearson se utilizan para describir la asimetría de una distribución de datos. Aquí, la asimetría se refiere a si el conjunto de datos es simétrico con respecto al centro o no y, de no ser así, cuán asimétrico es.
¿Qué significa?
La media es el índice de tendencia central más utilizado. Dado un conjunto de datos, la media se calcula tomando la suma de todos los valores de los datos y luego dividiéndola por el número de datos. Por ejemplo, los pesos de 10 personas (en kilogramos) se miden como 70, 62, 65, 72, 80, 70, 63, 72, 77 y 79. Luego, el peso medio de las diez personas (en kilogramos) puede ser calculado de la siguiente manera. La suma de los pesos es 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Media=(suma) / (número de datos)=710 / 10=71 (en kilogramos).
Como en este ejemplo particular, el valor medio de un conjunto de datos puede no ser un punto de datos del conjunto, pero será único para un conjunto de datos dado. La media tendrá las mismas unidades que los datos originales. Por lo tanto, se puede marcar en el mismo eje que los datos y se puede usar en comparaciones. Además, no hay restricción de signos para la media de un conjunto de datos. Puede ser negativo, cero o positivo, ya que la suma del conjunto de datos puede ser negativo, cero o positivo.
¿Qué es la desviación estándar?
La desviación estándar es el índice de dispersión más utilizado. Para calcular la desviación estándar, primero se calculan las desviaciones de los valores de datos de la media. La raíz cuadrada de la media de las desviaciones se denomina desviación estándar.
En el ejemplo anterior, las desviaciones respectivas de la media son (70 – 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 y (79-71)=8. La suma de los cuadrados de la desviación es (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. La desviación estándar es √(366/10)=6,05 (en kilogramos). De esto, se puede concluir que la mayoría de los datos están en el intervalo 71±6.05, siempre que el conjunto de datos no esté muy sesgado, y de hecho lo es en este ejemplo en particular.
Dado que la desviación estándar tiene las mismas unidades que los datos originales, nos da una medida de cuánto se desvían los datos del centro; mayor es la desviación estándar mayor es la dispersión. Además, la desviación estándar será un valor no negativo independientemente de la naturaleza de los datos en el conjunto de datos.
¿Cuál es la diferencia entre la desviación estándar y la media?
• La desviación estándar es una medida de la dispersión desde el centro, mientras que la media mide la ubicación del centro de un conjunto de datos.
• La desviación estándar siempre es un valor no negativo, pero la media puede tomar cualquier valor real.