|
|
Preparado por Luis M. Molinero (Alce
Ingeniería) |
"Scientific images are scientific because they have scales of measurement; the dequantification of images takes astronomy down the road toward astrology. It is especially important to provide scaling in images for public consumption, since the public might not have the contextual feel for scale that the experts do. And without scales, the images start to look like Hollywood sets rather than scientific evidence". -- Edward Tufte, February 19, 2003 |
|
Introducción |
En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización de sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema de referencia (coordenadas), permiten presentar información cuantitativa. La utilidad de los gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismos una poderosa herramienta para el análisis de los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla.
El propósito de un gráfico no es entonces muy diferente del de cualquier otra herramienta estadística: ayudar a la comprensión y comunicación de la evidencia aportada por los datos respecto a una hipótesis en estudio. Un gráfico científico debe servir por tanto para representar la realidad, no para generar nuevas realidades inexistentes fuera de la propia imagen. La llegada de los ordenadores y de programas para la generación de gráficos y presentaciones ha puesto en manos del usuario común una herramienta poderosa, antes de que disponga de los conocimientos o la mentalidad adecuada para usarla, y de esa forma nos vemos invadidos, cierto que con honrosas excepciones, por una insensata proliferación de gráficos mercantilistas que parece que tienen como único objetivo hacernos ver la capacidad del programa utilizado: llenos de una variada gama de colores, todo tipo de fuentes de letras imaginables, casi tantos como palabras, y por supuesto representación al menos en tres dimensiones. Todo lo contrario de lo que un buen gráfico científico debe ser, en el que su calidad radica precisamente en la simplicidad de la presentación para permitir visualizar unos datos complejos.
En este artículo nos vamos a centrar únicamente en los gráficos como vehículo de presentación de datos, sin abordar su otra faceta como herramienta de análisis.
La calidad de un gráfico estadístico consiste en comunicar ideas complejas con precisión, claridad y eficiencia, de tal manera que:
A su vez los gráficos se integran dentro de un contexto de presentación, por ejemplo en papel o proyectados en una pantalla en una presentación oral, y deben estar adecuadamente diseñados para el soporte al que van destinados. Personalmente me resulta asombroso la enorme cantidad de veces que oigo atónito a un presentador, que nos muestra una transparencia o una diapositiva llena de texto minúsculo, ilegible para la audiencia, decir que "aunque uds probablemente no pueden leerlo"... ¿entonces para qué lo ha puesto en esa imagen? ¿qué arcana misión cumple entonces el texto que la audiencia no puede leer?. Lo mismo podemos decir de los gráficos en papel ¿por qué contienen tantos puntos o rayas que no se pueden distinguir unos de otros?
Aunque como norma general en los gráficos científicos los adornos sobran, tampoco hay que olvidar que a menudo también cumplen una misión estética, ayudando de esa forma a una presentación que quizás sería demasiado árida sólo con texto y números. Pero entonces esa función estética debe ser comprendida y valorada, quedando perfectamente integrada en el contexto de lo que se presenta, y no puede ser una disculpa para distorsionar su contenido.
|
Algunas sugerencias para la confección de gráficos |
||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
|
Un tipo de representación muy utilizado son las tartas y sin embargo desde el punto de vista de la comunicación de resultados son totalmente inadecuadas, hasta tal punto que nuestra recomendación es no emplearlas nunca y mucho menos con tres dimensiones
Fíjense en cambio en el diagrama de barras de la siguiente figura. Ahora sí se está reflejando adecuadamente los datos en el gráfico y nos permite establecer relaciones visuales fiables entre ellos.
|
||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
|
Otra costumbre, que no tiene mucho sentido, y también muy difundida es la de unir puntos entre los que no existe una relación secuencial. Sí que es lógico construir de esa forma curvas de evolución de crecimiento, de supervivencia, pero no es lógico unir puntos que no guardan relación secuencial. Por ejemplo, en la gráfica anterior, si los 10 ensayos que se representan en el eje de las X son independientes no tendría sentido unir los puntos; sí lo sería, si se trata de ensayos secuenciales. En la siguiente figura vemos el perfil de la media de los resultados del cuestionario de calidad de vida SF-36 en los hombres (rojo) y mujeres (amarillo) en un grupo de pacientes diabéticos. Hay un punto para cada una de las dimensiones, que corresponden a los conceptos de función física, rol físico, dolor corporal, salud general, vitalidad, función social, rol emocional y salud mental. La moda es presentar los puntos unidos por una línea ¿por qué?. No dudo de que haya alguna razón, pero ¿los que así lo presentan conocen el motivo o lo hacen sólo por moda?
La utilización de un escalado adecuado es imprescindible en un buen gráfico estadístico. Es fundamental sobre todo si se van a comparar diferentes gráficas, ya que entonces los ejes deben tener el mismo recorrido y las gráficas tener el mismo tamaño. El recorrido de los ejes contiene en sí mismo también información. Así en la gráfica anterior, se quería indicar que el resultado posible de cada una de las escalas va de 0 a 100, y que las diferencias entre el grupo de mujeres y de hombres, siendo importantes, pueden quedar minimizadas en ese campo de variación. Si pretendiéramos realzar esas diferencias hubiéramos elegido otro recorrido para el eje:
En ambos casos el recorrido elegido transmite por sí mismo un mensaje, por lo tanto debe escogerse adecuadamente.
|
||||||||||||||||||||||||||||||||||||
|
Es difícil, sino imposible, dar consejos generales en cuanto a cómo elaborar un gráfico, si acaso sólo unas mínimas normas básicas como las que venimos comentando. Hay que tener en cuenta además que el gráfico cumple también una función estética, que fomenta la lectura del texto y ayuda a su comprensión. Y en el aspecto estético es donde será más complicado lograr un consenso. Quizás la única norma general sea la de buscar sencillez y claridad, incluso el uso del color debe ser moderado y bien elegido. Las líneas debieran ser finas, eliminándose aquellas que son superfluas y enmarañan el gráfico. Solo se utilizarán rejillas si se considera necesario para ayudar a la interpretación y ubicación de los datos. En la imagen debe haber un adecuado balance entre el espacio en blanco y el que contiene datos, aunque en ocasiones el espacio en blanco sí que contiene información y transmite un mensaje, como en la gráfica anterior sobre calidad de vida, cuando decidíamos presentar todo el rango de variación con el fin de minimizar la importancia de las diferencias. En el gráfico ideal no tenemos que acudir al texto para interpretarlo. Debe existir una adecuada relación entre el texto, las tablas y las imágenes, siendo fáciles de localizar y encontrándose próximas al texto donde son referenciadas y a ser posible en la misma página. También una buena idea puede ser combinar texto y tablas embebidas, para facilitar la lectura, ya que muchos números seguidos en una misma frase son difíciles de comprender. Veamos un ejemplo. Se encontró una diferencia importante en la PAS entre el grupo de pacientes obesos y el resto, de 5.1 mmHg (Int.confianza del 95% de 3.7 a 7.2), con los siguientes valores en cada grupo:
Incluir aquí la tabla con los datos en ambos grupos es mucho más legible que si hubiéramos continuado la frase indicando, a continuación de los valores de la diferencia, los datos de cada grupo. Así, con la tabla, resulta mucho más fácil de leer que si se expresa con un párrafo; por supuesto siempre que la tabla quede embebida en el texto y no vaya colocada en otro punto, y hagamos referencia a ella con el consabido véase tabla n, lo que distraerá la atención.
|
||||||||||||||||||||||||||||||||||||
|
Hay muchas otras posibilidades de gráficos, además de las tartas, barras, nubes de puntos y curvas, que constituyen una alternativa más eficiente de presentación que el texto. Por ejemplo, una información que debería figurar en todo trabajo de investigación, es la relativa al colectivo de sujetos del que se extrajo la muestra analizada, así como el procedimiento utilizado y la evolución del tamaño de muestra durante el desarrollo del estudio. Este tipo información resulta complicado de describir sólo con texto y sobre todo difícil de seguir por el lector, siendo mucho más ilustrativa la presentación de un diagrama de flujo, tal y como proponen las recomendaciones CONSORT, de las que hemos extraído el ejemplo de la figura.
Aquí no hay tres dimensiones, ni color, no es un gráfico muy vistoso, pero este diagrama de flujo es mucho más fácil de captar que una explicación textual y ayuda de forma notable a interpretar los resultados del estudio; debiera ser obligado, y así lo proponen las recomendaciones citadas.
|
||||||||||||||||||||||||||||||||||||
|
Los gráficos son un elemento importante en la comunicación de resultados, ayudando a su interpretación, y cumpliendo también, como el buen lenguaje, una función estética que facilita atraer la atención del lector y convencerle del mensaje que le trasmitimos. Los programas modernos ponen en nuestras manos una gran capacidad de diseño, pero es bueno que la utilicemos con sentido y al igual que un artículo no es mejor porque utilice más número de palabras o las palabras más bonitas, o más de moda, tampoco un gráfico será mejor porque tenga más colores, más tipos de letra o esté hecho con la versión más moderna del mejor programa de diseño. Y en ambos casos al final lo verdaderamente importante es el contenido. Citando a un arquitecto: "es correcto decorar las construcciones, pero nunca construir decoración". |
|
Enlaces de interés |
| The
work of Edward Tufte and graphics press Edward Tufte has written seven books, including Visual Explanations, Envisioning Information, The Visual Display of Quantitative Information, and Data Analysis for Politics and Policy. |
|
| Gallery of
Data Visualization The Best and Worst of Statistical Graphics This Gallery of Data Visualization displays some examples of the Best and Worst of Statistical Graphics, with the view that the contrast may be useful, inform current practice, and provide some pointers to both historical and current work. We go from what is arguably the best statistical graphic ever drawn, to the current record-holder for the worst |
|
| Statistical
Graphical design Statistics for the life sciences C. J. Schwarz, Department of Statistics and Mathematics, Simon Fraser University |
|
| Presenting
Data: Tabular and graphic display of social indicators Gary Klass. Illinois State University |
![]() |