Correlación vs Covarianza
Correlación y covarianza son conceptos estrechamente relacionados en estadística teórica. Son importantes para determinar la relación entre dos variables aleatorias.
¿Qué es la correlación?
La correlación es una medida de la fuerza de la relación entre dos variables. El coeficiente de correlación cuantifica el grado de cambio de una variable en función del cambio de la otra variable. En estadística, la correlación está relacionada con el concepto de dependencia, que es la relación estadística entre dos variables
El coeficiente de correlación de Pearson o simplemente el coeficiente de correlación r es un valor entre -1 y 1 (-1≤r≤+1). Es el coeficiente de correlación más utilizado y válido solo para una relación lineal entre las variables. Si r=0 no existe relación, y si r≥0 la relación es directamente proporcional; el valor de una variable aumenta con el aumento de la otra. Si r≤0 la relación es inversamente proporcional; una variable disminuye a medida que la otra aumenta.
Debido a la condición de linealidad, el coeficiente de correlación r también se puede utilizar para establecer la presencia de una relación lineal entre las variables.
¿Qué es la covarianza?
En teoría estadística, la covarianza es una medida de cuánto cambian juntas dos variables aleatorias. En otras palabras, la covarianza es una medida de la fuerza de la correlación entre dos variables aleatorias.
En otra perspectiva, se puede ver que la correlación es solo la versión normalizada de la covarianza, donde la covarianza se divide por el producto de las desviaciones estándar de las dos variables aleatorias. El rango de covarianza puede ser grande; por lo tanto, no es fácil de comparar. Esta dificultad se supera llevando los valores de covarianza a un rango en el que se pueden comparar normalizándolos (algo así como lo hace el puntaje z). Aunque la covarianza y la varianza están vinculadas entre sí de la manera anterior, sus distribuciones de probabilidad no están unidas entre sí de manera simple y deben tratarse por separado.
¿Cuál es la diferencia entre correlación y covarianza?
• Tanto la correlación como la covarianza son medidas de relación entre dos variables aleatorias. La correlación es la medida de la fuerza de la linealidad de las dos variables y la covarianza es una medida de la fuerza de la correlación.
• Los valores del coeficiente de correlación son un valor entre -1 y +1, mientras que el rango de covarianza no es constante, sino que puede ser positivo o negativo. Pero si las variables aleatorias se estandarizan antes de calcular la covarianza, entonces la covarianza es igual a la correlación y tiene un valor entre -1 y +1.