Desviación frente a desviación estándar
Desviación frente a desviación estándar
En estadística descriptiva e inferencial, se utilizan varios índices para describir un conjunto de datos correspondiente a su tendencia central, dispersión y asimetría. En la inferencia estadística, estos se conocen comúnmente como estimadores, ya que estiman los valores de los parámetros de la población.
La dispersión es la medida de la dispersión de los datos alrededor del centro del conjunto de datos. La desviación estándar es una de las medidas de dispersión más utilizadas. Las desviaciones de cada punto de datos de la media se tienen en cuenta al calcular la desviación estándar. Por lo tanto, se puede argumentar que la desviación estándar junto con la media proporcionarán una imagen casi suficiente sobre un conjunto de datos.
Considere el siguiente conjunto de datos. Los pesos de 10 personas (en kilogramos) se miden como 70, 62, 65, 72, 80, 70, 63, 72, 77 y 79. Entonces, el peso medio de las diez personas (en kilogramos) es 71 (en kilogramos)).
¿Qué es la desviación?
En estadística, desviación significa la cantidad por la cual un solo punto de datos difiere de un valor fijo como la media. En general, sea k un valor fijo y x1, x2, …, xn denote un dato establecer. Entonces, la desviación de xj desde k se define como (xj– k).
Por ejemplo, en el conjunto de datos anterior, las desviaciones respectivas de la media son (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 y (79 – 71)=8.
¿Qué es la desviación estándar?
Cuando se pueden tener en cuenta los datos de toda la población (por ejemplo, en el caso de un censo), es posible calcular la desviación estándar de la población. Para calcular la desviación estándar de la población, primero se calculan las desviaciones de los valores de los datos de la media de la población. La raíz cuadrada media (media cuadrática) de las desviaciones se denomina desviación estándar de la población. En símbolos, σ=√{ ∑(xi-µ)2 / n} donde µ es la media de la población y n es el tamaño de la población.
Cuando se utilizan datos de una muestra (de tamaño n) para estimar los parámetros de la población, se calcula la desviación estándar de la muestra. Primero se calculan las desviaciones de los valores de los datos de la media de la muestra. Dado que la media muestral se usa en lugar de la media poblacional (que se desconoce), no es apropiado tomar la media cuadrática. Para compensar el uso de la media muestral, la suma de los cuadrados de las desviaciones se divide por (n-1) en lugar de n. La desviación estándar de la muestra es la raíz cuadrada de esto. En símbolos matemáticos, S=√{ ∑(xi-ẍ)2 / (n-1)}, donde S es la desviación estándar de la muestra, ẍ es la media de la muestra y xi son los puntos de datos.
En el conjunto de datos anterior, la suma de los cuadrados de la desviación es (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1) 2 + (-8)2 + 12 + 62 + 82=366. Por lo tanto, la desviación estándar de la población es √(366/10)=6,05 (en kilogramos). (Asumiendo que la población bajo consideración está compuesta por las 10 personas de quienes se tomaron los datos).
¿Cuál es la diferencia entre desviación y desviación estándar?
• La desviación estándar es un índice estadístico y un estimador, pero la desviación no lo es.
• La desviación estándar es una medida de la dispersión de un grupo de datos desde el centro, mientras que la desviación se refiere a la cantidad en la que un solo punto de datos difiere de un valor fijo.