Gráfico de barras frente a histograma
En estadística, es importante resumir y presentar los datos. Se puede hacer numéricamente usando medidas descriptivas o gráficamente usando gráficos circulares, gráficos de barras y muchos otros métodos de representación gráfica.
¿Qué es un gráfico de barras?
El gráfico de barras es uno de los principales métodos de representación gráfica en estadística. Se utiliza para mostrar distintos valores de los datos cualitativos en un eje horizontal y las frecuencias relativas (o frecuencias o porcentajes) de esos valores en un eje vertical. Una barra con su altura/longitud proporcional a la frecuencia relativa representa cada valor distinto, y las barras están colocadas de manera que no se tocan entre sí. Un gráfico de barras con la configuración anterior es el más común y se conoce como gráfico de barras verticales o gráfico de columnas. Pero también es posible intercambiar los ejes; en ese caso las barras son horizontales.
El gráfico de barras se utilizó por primera vez en el libro de 1786 "The Commercial and Political Atlas" de William Playfair. Desde entonces, el gráfico de barras se ha convertido en una de las herramientas más importantes para representar datos categóricos. El uso de gráficos de barras se puede ampliar para representar datos categóricos más complejos, como variables de desarrollo de tiempo (respuesta electoral), datos agrupados y más.
¿Qué es un histograma?
El histograma es otra representación gráfica importante de los datos y se puede considerar como un desarrollo del gráfico de barras. En un histograma, las clases de datos cuantitativos se muestran en el eje horizontal y la frecuencia (o frecuencia relativa o porcentajes) de las clases se muestran en el eje y. Una barra vertical suele representar la frecuencia (o frecuencia relativa o porcentajes) de la clase cuya altura es igual a su magnitud. A diferencia de los gráficos de barras ordinarios, las barras están colocadas para tocarse entre sí.
La variable en el eje del eje X puede ser un valor único agrupado o un límite agrupado. Para la agrupación de un solo valor, se utilizan distintos valores de las observaciones para etiquetar las barras, con cada valor centrado debajo de su barra. Para la agrupación de límites o la agrupación de puntos de corte, se utilizan límites de clase inferior (o, de manera equivalente, puntos de corte de clase inferior) para etiquetar las barras. También se pueden utilizar marcas de clase o puntos medios de clase centrados debajo de las barras.
Una de las principales diferencias radica en la variable utilizada en el eje X. En el histograma, la variable es una variable cuantitativa y puede ser continua o discreta. Y se puede usar para representar información de densidad sobre los conjuntos de datos. En este caso, los intervalos utilizados en el eje x pueden variar de uno a otro, y en el eje y se marca la densidad de frecuencia. Si el intervalo del eje X es 1, entonces el histograma es igual a la gráfica de frecuencia relativa.
¿Cuál es la diferencia entre el gráfico de barras y el histograma?
• En primer lugar, un histograma es un desarrollo del gráfico de barras, pero no es idéntico a un gráfico de barras. Los histogramas son un tipo de gráficos de barras, pero los gráficos de barras definitivamente no son histogramas.
• Los gráficos de barras se utilizan para trazar datos categóricos o cualitativos, mientras que los histogramas se utilizan para trazar datos cuantitativos con los rangos de los datos agrupados en contenedores o intervalos.
• Los gráficos de barras se usan para comparar variables, mientras que los histogramas se usan para mostrar distribuciones de variables
• Los gráficos de barras tienen espacios entre dos barras, mientras que los histogramas no tienen espacios entre las barras. (La razón es que el eje x en los gráficos de barras son valores categóricos discretos mientras que, en los histogramas, es cuantitativo discreto o continuo).
• Los histogramas se utilizan para ilustrar la densidad de una variable en intervalos; en este caso el área de la barra representa la frecuencia de la variable.