En la era de la explosión de la información, se acumulan cada vez más datos. Sin embargo, estos datos densos están desenfocados y son menos legibles. Por lo tanto, necesitamos visualización de datos para ayudar a que los datos se comprendan y acepten fácilmente. Por el contrario, la visualización es más intuitiva y significativa, y es muy importante utilizar gráficos adecuados para visualizar los datos.
En esta publicación, presentaré los 16 tipos principales de gráficos en la visualización de datos y analizaré sus escenarios de aplicación para ayudarlo a seleccionar rápidamente el tipo de gráfico que muestra las características de sus datos.
NOTA: Todos los gráficos del artículo están tomados de la herramienta de visualización de datos FineReport .
Los gráficos de columnas usan columnas verticales para mostrar comparaciones numéricas entre categorías, y el número de columnas no debe ser demasiado grande (las etiquetas de los ejes pueden aparecer incompletas si hay demasiadas columnas).
El gráfico de columnas aprovecha la altura de la columna para reflejar la diferencia en los datos, y el ojo humano es sensible a las diferencias de altura. La limitación es que solo es adecuado para conjuntos de datos pequeños y medianos.
Escenario de aplicación : comparación de datos clasificados
Los gráficos de barras son similares a los gráficos de columnas, pero la cantidad de barras puede ser relativamente grande. En comparación con el gráfico de columnas, las posiciones de sus dos ejes cambian.
Escenario de aplicación : comparación de datos (el nombre de la categoría puede ser más largo porque hay más espacio en el eje Y)
Un gráfico de líneas se utiliza para mostrar el cambio de datos durante un intervalo de tiempo continuo o un lapso de tiempo. Se caracteriza por una tendencia a reflejar las cosas a medida que cambian en el tiempo o en categorías ordenadas.
Cabe señalar que el número de registros de datos del gráfico de líneas debe ser superior a 2, lo que puede utilizarse para la comparación de tendencias de un gran volumen de datos. Y es mejor no superar las 5 polilíneas en un mismo gráfico.
Escenario de aplicación : tendencia del volumen de datos a lo largo del tiempo, comparación de tendencias de series
El gráfico de áreas se forma sobre la base del gráfico de líneas. Rellena el área entre la polilínea y el eje en el gráfico de líneas con color. El relleno del color puede resaltar mejor la información de tendencias.
El color de relleno del gráfico de área debe tener cierta transparencia. La transparencia puede ayudar al usuario a observar la relación superpuesta entre diferentes series. La zona sin transparencia hará que las diferentes series se tapen entre sí.
Escenario de aplicación : relación de serie, relación de tendencia de tiempo
Los gráficos circulares se usan ampliamente en varios campos para representar la proporción de diferentes clasificaciones y para comparar varias clasificaciones por arco.
El gráfico circular no es adecuado para varias series de datos, porque a medida que aumenta la serie, cada porción se vuelve más pequeña y, finalmente, la distinción de tamaño no es obvia.
Un gráfico circular también se puede convertir en un gráfico circular de varias capas, que muestra la proporción de diferentes datos categóricos, al mismo tiempo que refleja la relación jerárquica.
Escenario de aplicación : relación de serie, comparación de tamaño de serie (diagrama de rosa)
El gráfico de dispersión muestra dos variables en forma de puntos en un sistema de coordenadas rectangulares. La posición del punto está determinada por el valor de la variable. Al observar la distribución de los puntos de datos, podemos inferir la correlación entre las variables.
Hacer un diagrama de dispersión requiere una gran cantidad de datos, de lo contrario, la correlación no es obvia.
Escenario de aplicación : análisis de correlación, distribución de datos
Un gráfico de burbujas es un gráfico multivariable que es una variante de un gráfico de dispersión. Excepto por los valores de las variables representadas por los ejes X e Y, el área de cada burbuja representa el tercer valor.
Debemos tener en cuenta que el tamaño de la burbuja es limitado y que demasiadas burbujas dificultarán la lectura del gráfico.
Escenario de aplicación : comparación de datos clasificados, análisis de correlación
Un indicador en la visualización de datos es una especie de gráfico materializado. La escala representa la métrica, el puntero representa la dimensión y el ángulo del puntero representa el valor. Puede representar visualmente el progreso o la situación real de un indicador.
El calibre es adecuado para la comparación entre intervalos.
También se puede hacer en forma de anillo o de tubo, indicando la proporción.
Escenario de aplicación : reloj, pantalla de relación
Los gráficos de radar se utilizan para comparar múltiples variables cuantificadas, como ver qué variables tienen valores similares o si hay valores extremos. También ayudan a observar qué variables en el conjunto de datos tienen valores más altos o más bajos. Los gráficos de radar son adecuados para demostrar el desempeño laboral.
El gráfico de radar también tiene un estilo de columna apilada que se puede usar para la comparación bidireccional entre la clasificación y la serie, al mismo tiempo que representa la proporción.
Escenario de aplicación : análisis de dimensiones, comparación de series, análisis de peso de series
El diagrama de marco es un medio visual de presentar la jerarquía en forma de estructura de árbol, que muestra claramente la relación jerárquica.
Escenario de aplicación : visualización de jerarquía, visualización de procesos
El diagrama de árbol rectangular es adecuado para presentar datos con relaciones jerárquicas, que pueden reflejar visualmente la comparación entre los mismos niveles. En comparación con el diagrama de estructura de árbol tradicional, el diagrama de árbol rectangular hace un uso más eficiente del espacio y tiene la función de mostrar la proporción.
Los diagramas de árbol rectangulares son adecuados para mostrar la jerarquía con relaciones de peso. Si no es necesario reflejar la proporción, el diagrama del marco puede ser más claro.
Escenario de aplicación : datos de árboles ponderados, proporción de datos de árboles
El gráfico de embudo muestra la proporción de cada etapa y refleja visualmente el tamaño de cada módulo. Es adecuado para comparar clasificaciones.
Al mismo tiempo, el gráfico de embudo también se puede usar para comparar. Organizamos múltiples gráficos de embudo horizontalmente y el contraste de datos también es muy claro.
Escenario de aplicación : clasificación de datos, relación, comparación de valores estándar
La nube de palabras es una representación visual de datos de texto. Es un gráfico de color similar a una nube compuesto de vocabulario. Se utiliza para mostrar una gran cantidad de datos de texto y puede ayudar rápidamente a los usuarios a percibir el texto más destacado.
El gráfico de nube de palabras requiere una gran cantidad de datos y el grado de discriminación de los datos es relativamente grande; de lo contrario, el efecto no es obvio. Y no es adecuado para un análisis preciso.
Escenario de aplicación : búsqueda de palabras clave
El diagrama de Gantt muestra visualmente el momento de la misión, el progreso real y la comparación con los requisitos. Para que los gerentes puedan comprender fácilmente el progreso de una tarea (proyecto).
Escenario de aplicación : progreso del proyecto, cambios de estado a lo largo del tiempo, proceso del proyecto
El mapa se divide en tres tipos: mapa regional, mapa de puntos y mapa de flujo.
Un mapa regional es un mapa que usa color para representar la distribución de un determinado rango de valores en una partición de mapa.
Escenario de aplicación : comparación y distribución de datos
Un mapa de puntos es un método para representar la distribución geográfica de los datos trazando puntos del mismo tamaño sobre un fondo geográfico.
La distribución de puntos facilita la comprensión de la distribución general de los datos, pero no es adecuada cuando se necesita observar un solo dato específico.
Escenario de aplicación : distribución de datos
Pero si reemplaza el punto con la burbuja, el mapa de puntos no solo puede mostrar la distribución sino también comparar aproximadamente el tamaño de los datos en cada región.
El mapa de flujo muestra los datos de interacción entre el área de salida y el área de entrada. Suele expresarse mediante la línea que une los centros de gravedad geométricos de los elementos espaciales. El ancho o el color de la línea indica el valor del flujo.
Los mapas de flujo ayudan a ilustrar la distribución de la migración geográfica y el uso de líneas de flujo dinámico reduce el desorden visual.
Escenario de aplicación : flujo, distribución y comparación de datos
El mapa de calor se utiliza para indicar el peso de cada punto en el área geográfica. Además del mapa como capa de fondo, también puede utilizar otras imágenes. Y el color en un mapa de calor generalmente se refiere a la densidad.
Escenario de aplicación : visitas regionales, distribución de calor, distribución de varias cosas.
Al final
Todos los anteriores son los 16 tipos de gráficos que se utilizan con frecuencia en la visualización de datos. Si desea comenzar con la visualización de datos, le sugiero que comience aprendiendo a hacer estos gráficos básicos y practique con una herramienta fácil de usar.
Algunas personas pueden pensar que los gráficos básicos son demasiado simples y primitivos, y tienden a utilizar gráficos más complicados. Sin embargo, cuanto más simple sea el gráfico, más fácil será ayudar a las personas a comprender rápidamente los datos. ¿No es ese el propósito más importante de la visualización de datos? Así que no subestimes estos gráficos básicos. Porque los usuarios están más familiarizados con ellos. Deben considerarse prioritarios siempre que sean aplicables.
Divulgación: el autor no tiene ningún interés personal en los proyectos mencionados.