Varianza frente a desviación estándar
La variación es un fenómeno común en el estudio de las estadísticas porque si no hubiera habido variación en los datos, probablemente no necesitaríamos estadísticas en primer lugar. La variación se describe como la variación en las estadísticas, que es una medida de la distancia de los valores de su media. La varianza es pequeña o pequeña si los valores se agrupan más cerca de la media. La desviación estándar es otra medida para describir la diferencia entre los resultados esperados y sus valores reales. Aunque ambos están estrechamente relacionados, existen diferencias entre la varianza y la desviación estándar que se analizarán en este artículo.
Los valores brutos no tienen sentido en ninguna distribución y no podemos deducir ninguna información significativa de ellos. Es con la ayuda de la desviación estándar que podemos apreciar la importancia de un valor, ya que nos dice qué tan lejos estamos del valor medio. La varianza es similar en concepto a la desviación estándar excepto que es un valor cuadrado de SD. Tiene sentido entender los conceptos de varianza y desviación estándar con la ayuda de un ejemplo.
Supongamos que hay un granjero cultivando calabazas. Tiene diez calabazas de diferentes pesos que son las siguientes.
2.6, 2.6, 2.8, 3.0, 3.1, 3.2, 3.3, 3.5, 3.6, 3.8. Es fácil calcular el peso promedio de las calabazas ya que es la suma de todos los valores dividida por 10. En este caso son 3.15 libras. Sin embargo, ninguna de las calabazas pesa tanto y su peso varía desde 0,55 libras menos hasta 0,65 libras más que la media. Ahora podemos escribir la diferencia de cada valor de la media de la siguiente manera
-0.55, -0.55, -0.35, -0.15, -0.05, 0.15, 0.35, 0.45, 0.65.
Qué hacer con estas diferencias de la media., Si tratamos de encontrar la diferencia promedio, vemos que no podemos encontrar la media ya que al sumar, los valores negativos son iguales a los valores positivos y la diferencia promedio no se puede calcular así. Por eso se decidió elevar al cuadrado todos los valores antes de sumarlos y encontrar la media. En este caso, los valores al cuadrado resultan de la siguiente manera
0.3025, 0.3025, 0.1225, 0.0225, 0.0025, 0.0025, 0.1225, 0.2025, 0.4225.
Ahora estos valores se pueden sumar y dividir por diez para llegar a un valor que se conoce como varianza. Esta variación es de 0,1525 libras en este ejemplo. Este valor no tiene mucha importancia ya que habíamos elevado al cuadrado la diferencia antes de encontrar su media. Es por eso que necesitamos encontrar la raíz cuadrada de la varianza para llegar a la desviación estándar. En este caso son 0,3905 libras.
En resumen:
• Tanto la varianza como la desviación estándar son medidas de dispersión de valores en cualquier dato.
• La varianza se calcula tomando la media de los cuadrados de las diferencias individuales de la media de la muestra
• La desviación estándar es la raíz cuadrada de la varianza.