Portada SEH-LELHA Mapa de navegación del web SEH-LELHA

Presentación de datos estadísticos en medicina

Preparado por Luis M. Molinero (Alce Ingeniería)
CorreoE: bioestadisticaalceingenieria.net
Enero 2003
www.seh-lelha.org/stat1.htm

Artículo en formato PDF

Una presentación adecuada y clara de los resultados de un trabajo de investigación además de ser fundamental para contribuir a la difusión de los mismos, puede incluso ser imprescindible para lograr que se acepte su publicación. En la actualidad la exigencia de las revistas y de los revisores ha contribuido a que el nivel de calidad en la presentación de datos sea bastante bueno, por lo que es conveniente tener algunas ideas muy claras para evitar errores o situaciones que hoy ya no son admisibles, lo que no solo nos preparará para la publicación de nuestros trabajos sino también para una lectura crítica de los de otros. Precisamente un buen punto de partida para obtener información, no sólo sobre cómo presentar nuestros resultados sino también sobre cómo preparar todo el conjunto del artículo, lo constituyen las propias guías suministradas por las revistas.

Con éste comenzamos una serie de artículos destinados a proporcionar algunas ideas básicas que ayudarán a la presentación de los datos; en ciertos casos se trata de normas, y en otros tan solo de sugerencias. Nos centraremos únicamente en la presentación de los datos -sección de métodos y sección de resultados- y no en el resto del cuerpo del artículo, puesto que es en esos apartados donde principalmente encontramos temas relacionados con la bioestadística, aunque lógicamente los datos que se presentan de forma resumida en el Abstract y más extensamente en el apartado de Resultados, estarán referenciados en otros lugares del artículo.

En mi opinión un artículo bien concebido debe transmitir la mayor parte de la información con sólo leer el Abstract y los Resultados, siendo para ello vital que los datos, con las tablas y figuras correspondientes, estén bien presentados y organizados. En general no debiera ser necesario acudir al texto para entender una tabla o una figura; otro caso es para interpretarla, lo que ya corresponde al apartado de Discusión o Conclusiones. El propio autor no debiera emitir juicios ni extraer conclusiones en la sección de Resultados, reservando éstos para la sección de Discusión.

Conviene tener claro que el resultado de un análisis estadístico no es un objetivo en sí mismo, sino tan solo una herramienta para comprobar o rechazar una hipótesis de trabajo, para representar de una forma eficiente y resumida un colectivo de observaciones, para validar un modelo de un proceso fisiológico, etc.

La manera de presentar los datos es diferente según el tipo de los mismos. De forma somera podemos hacer dos grandes grupos: datos cuantitativos y datos cualitativos. En el grupo de datos cuantitativos tenemos aquellos cuyo resultado puede variar de forma continua, como puede ser el peso, la presión arterial, el nivel de colesterol, etc. y los que sólo pueden tomar valores enteros como por ejemplo el número de hijos, el número de ingresados en la Unidad de Quemados un día concreto, etc. A su vez en las variables cualitativas distinguiremos las nominales, que constituyen una simple etiqueta -como puede ser el sexo, el grupo sanguíneo, etc.- de las ordinales, en las que se da una relación de orden entre las respuestas, como por ejemplo en el resultado de una patología/tratamiento (fallece, empeora, sin cambios, mejora, curación). Cada tipo variable tiene requerimientos propios en cuanto a presentación y en cuanto a las pruebas que se utilizan para contrastar los valores entre diferentes grupos.


Resumen de datos cuantitativos

Para resumir datos cuantitativos es preciso indicar un valor central y un índice de variabilidad o dispersión. Cuando es razonable suponer que los datos pueden seguir una distribución normal, se indicará la estimación de la media y la desviación típica.

Hay diferentes posibilidades de presentación, siendo quizás la más habitual:

La media de la PAS fue de 139.2 ± 14.9 mmHg

Personalmente prefiero una presentación alternativa, que no deja lugar a dudas sobre el significado del valor que acompaña a la media:

La media de la PAS fue de 139.2 mmHg (s=14.9)

donde al indicar s (símbolo universalmente empleado para denotar la estimación de la desviación típica o estándar) no se deja lugar a dudas en cuanto a qué parámetro de dispersión se está utilizando, duda que sí se plantea con el símbolo ± en la primera presentación.

No es adecuado resumir la variabilidad de los datos indicando el error estándar de la media, ya que éste proporciona una medida de la precisión de la estimación de la media poblacional a partir de nuestra muestra, mientras que la desviación típica mide la variablidad de los datos respecto de la media en la muestra.

Es correcto resumir los datos cuantitativos con la media y la desviación típica sólo cuando es válido suponer que su distribución de probabilidad se aproxima a una distribución Normal o de Gauss, y es por tanto una distribución simétrica en torno a la media, lo que explica el símbolo ± en la primera sentencia. En muestras grandes se podrá verificar esta hipótesis de normalidad, mientras que en muestra pequeñas puede no ser posible.

En muchas ocasiones no es razonable suponer que los datos biológicos se distribuyen según una normal, que es una distribución simétrica en torno a la media, de tal manera que son igualmente probables valores por debajo o por encima de ésta, y por sus propiedades cabe esperar la siguiente distribución aproximada de los valores

media ± desviación típica 68 % de los datos
media ± 2 x desviación típica 95 % de los datos
media ± 3 x desviación típica 99 % de los datos

Estas propiedades de la distribución normal nos proporcionan una guía sencilla para sospechar de la presencia de asimetría cuando estamos estudiando un parámetro que no puede tomar valores negativos, como es el caso de la mayoría de los valores de laboratorio. Si encontramos que el coeficiente de variación CV es próximo o mayor que 0.5 y no puede haber datos negativos, éstos probablemente no proceden de una distribución normal.

El CV es igual al cociente entre la desviación típica y la media

Si CV = 0.5 y los datos siguieran una distribución normal es de esperar alrededor del 2.5 % de valores negativos, y si esto no es compatible con nuestros datos (no pueden ser negativos), hay que sospechar que no siguen una distribución normal.

Veamos un ejemplo con datos reales para aclararlo. En una muestra de pacientes diabéticos encontramos que el valor medio de los triglicéridos es de

138.5 mg/dl (s=68.0, n=798)

Por tanto el coeficiente de variación es 0.49. Si representamos un histograma de los datos obtenemos la siguiente gráfica:

donde podemos comprobar lo que ya sospechábamos al calcular el coeficiente de variación, y es que la distribución de los datos presenta una asimetría importante. Para comparar se ha representado con una línea azul cuál sería la distribución esperable si los datos procedieran verdaderamente de una distribución normal.

Es frecuente expresar el coeficiente de variación CV en %, por lo que entonces un valor de 0.49 corresponde a 49 %.

Veamos otro ejemplo todavía más acusado. Calculamos la media de las proteínas de la composición de una base de datos de alimentos, obteniendo

9.1 g/100 g de porción comestible (s=9.3, n=529)

por lo que ahora el coeficiente de variación es incluso superior a 1 y no nos sorprende que cuando representamos el histograma de los datos, se obtenga la siguiente figura

En el caso de que los datos no sigan una distribución normal, no es adecuado utilizar la media y desviación típica para resumir la información, sino que debe emplearse la mediana como índice de centralización y el rango intercuartílico como índice de dispersión. La mediana es el valor que deja a cada lado, por encima y por debajo, la mitad de la distribución, de tal manera que es igualmente probable encontrar un valor más pequeño que uno mayor que la mediana.

Para caracterizar la distribución utilizamos los percentiles, que son aquellos valores que dejan una proporción determinada de datos a cada lado. Así el percentil 5 tiene el 5 % de valores a su izquierda y el 95 % a su derecha. El percentil 90 es el valor para el que el 90 % de los datos son inferiores y el 10 % son superiores. También hablamos de cuartiles, que son los valores que dividen la distribución de los datos en cuatro regiones iguales, el primer cuartil deja a su izquierda (valores inferiores) el 25 % de los datos y el tercer cuartil en cambio deja el 25 % a su derecha (valores superiores). Se denomina rango intercuartílico a la diferencia entre el valor del tercer cuartil y el primero.

En el caso de los alimentos indicaríamos que

Mediana = 5.9 g/100 g de porción comestible (rango intercuartílico = 1.5 a 15.2)

En el caso de los triglicéridos, en la muestra de pacientes diabéticos:

Mediana = 120.5 mg/dl (rango intercuartílico = 92 a 170.8)

El rango intercuartílico, como vemos, se suele indicar preferiblemente con los valores del primer y tercer cuartil, ya que es más informativo que dar directamente la diferencia, pues nos permite ubicar la posición de la mediana con respecto a esos extremos. En el ejemplo de las proteínas de los alimentos vemos que la distancia de la mediana al primer cuartil es de 4.4 y al tercer cuartil de 9.3, por lo que está más del doble alejado del extremo de la derecha que de la izquierda. En otros casos podría ser al revés y la asimetría estaría invertida, con una cola prolongada en el lado izquierdo.


Resumen de datos cualitativos

Los datos cualitativos (nominales u ordinales) se cuantifican como recuentos del número de casos observados para cada categoría, y suelen expresarse habitualmente como porcentajes u otro tipo de cocientes.

Siempre se debe indicar los valores de los denominadores (número total de casos) con los que se efectuaron los cálculos, sobre todo teniendo en cuenta que en muchos trabajos se parte de un efectivo de muestra pero luego una determinada tasa no se calcula sobre el total de pacientes, sino sobre una parte de ellos, bien porque se trata de un grupo especial o porque faltan datos de algunos pacientes, y si no se indica el denominador se dará la falsa impresión de que el porcentaje se refiere a toda la muestra, ya que no hay manera de comprobarlo con la información proporcionada en el artículo. Así, supongamos que partimos de una muestra de 888 pacientes diabéticos y en el artículo se indica que la proporción de mujeres con el síndrome X es del 82 %. Con solo esa información podemos pensar que 728 mujeres tienen síndrome X, lo que enseguida comprobamos que es imposible (pero nos obliga a efectuar los cálculos), ya que en el artículo se indica que el porcentaje de mujeres en la muestra es del 58 % (515 mujeres). Obviamente la explicación está en que solo una parte de los pacientes tienen el síndrome X y necesitamos buscar esa cifra en el artículo (aunque resulte sorprendente es algo que no siempre figurará) y encontramos que el 7.6 % de los pacientes presenta dicho síndrome, es decir 67 pacientes, de donde ya podemos saber cuántas son mujeres (un 82% = 55) y cuántos hombres (el resto, 12). Todo habría resultado más fácil, si se hubiera indicado

La proporción de mujeres con síndrome X es del 82 % (55 de 67)

Y el asunto podría estar más complicado si para determinar que el paciente tiene síndrome X se utilizan las variables Hipertensión (NO/SI), IMC, Colesterol, LDL y Triglicéridos; es posible que no todos los pacientes intervengan en los cálculos, debido a que en varios casos nos falta alguno de esos datos. Supongamos que sólo en 503 pacientes tenemos datos suficientes para determinar si tienen o no síndrome X, entonces el porcentaje de pacientes con esa característica es 13.3% ( 67 de 503), pero si sólo indicamos la cifra 13.3% de pacientes con síndrome X, el lector pensará, al aplicarla al tamaño inicial de 888 pacientes, que el número de casos con síndrome X es de 118, casi el doble de los que realmente tenemos (67). Moraleja: los porcentajes deben ir acompañados de las frecuencias absolutas siempre.

La recomendación de indicar las cifras absolutas acompañando a los porcentajes es todavía más necesaria cuando se trata de muestras pequeñas (n < 100), y mucho más cuando el tamaño es inferior a 30 pacientes. Es sutilmente engañoso leer en el apartado de resultados que mejoran el 45 % de los pacientes y después encontrar en Material y Métodos que esa cifra corresponde a 9 pacientes de 20. En estos casos hay quien incluso aconseja no usar porcentajes.

Y como siempre hay que aplicar el sentido común y comunicar los datos de acuerdo al contexto en el que se presentan. Veamos un ejemplo real. Estamos presentando información sobre la tasa de accidentes laborales con muerte en diferentes comunidades durante el 1999. En una tabla indicamos en una columna el número de accidentes en la Comunidad de Madrid durante ese año (165 accidentes mortales) y en otra la tasa media diaria, que en este caso corresponde a 165 accidentes / 365 días = 0.45 accidentes mortales/día. En la tabla está muy bien así, pero no es lógico expresarlo igual dentro del texto y mucho menos, como oí en la radio a un representante sindical, decir que muere 0.45 trabajadores diariamente por accidente laboral, cuando sería mucho más natural haber indicado que en la Comunidad de Madrid durante el año 1999 fallecieron en accidente laboral por término medio aproximadamente 1 trabajador cada 2 días.


Redondeo y número de cifras a emplear en la presentación de los datos numéricos

En general se debe especificar la media con un decimal más de precisión que los datos originales. Por ejemplo, si se recogen valores de presión arterial sin decimales, la media la expresaremos con 1 decimal (media de PAS = 121.2 mmHg), y lo mismo para las medidas de dispersión, aunque en este último caso, al utilizarse en cálculos posteriores, hay quien prefiere emplear dos decimales más que los datos. También hay que tener en cuenta que para los cálculos se emplearán siempre los datos sin redondear, de tal manera que sólo se redondearán los resultados para la presentación.

Los porcentajes se indicarán con un decimal como máximo y en el caso de que se den también las cifras absolutas, como debiera hacerse, se puede redondear a valores enteros, ya que siempre es posible a partir de ellos calcular el valor exacto y sin embargo las cifras enteras son más fáciles de leer.

Las probabilidades se deben especificar con no más de dos cifras significativas, indicándose su valor tanto si el resultado es estadísticamente significativo al nivel prefijado como si no lo es, ya que decir que "no es estadísticamente significativo un contraste" no es igual cuando P=0.06 que cuando P=0.48.

Los resultados de las pruebas estadísticas como el valor de t, chi, F, se darán con dos decimales como máximo.

En cuanto a la utilización de la coma o el punto como símbolo decimal, personalmente soy de la opinión que se debiera utilizar el punto, que es el símbolo empleado en las revistas de habla inglesa, y el que estamos habituados a utilizar en las calculadoras científicas. El lenguaje de los números (como el de la música) debe ser universal y no podemos pensar que existe una forma de expresar los números en español y otra en inglés. Además la utilización del punto presenta ventajas cuando se expresa un intervalo de valores (por ejemplo rango intercuartílico = 92.3 , 170.8) donde para evitar confusión habría que utilizar un símbolo distinto de la coma para separar las dos cifras, y el guión no es aceptable ya que sería confuso si alguno de los valores fuera negativo. Hay problemas con la coma en muchas otras situaciones, entre las que cabe destacar el paso de parámetros para el cálculo de valores de una función, por ejemplo

resultado=Media(170.5, 172.3, 171.2)

Desgraciadamente (en mi opinión) Microsoft ha decidido utilizar por defecto como símbolo decimal la coma en los sistemas operativos en español.

En las revistas en español hay disparidad de criterios y en cada caso habrá que atenerse a las normas de cada una.

Si se utiliza la coma para el símbolo decimal se sugiere presentar siempre los intervalos o rangos de la siguiente manera

92,3 a 170,8

Esta forma de expresarlo nos parece también más correcta aunque se utilice el punto como símbolo decimal, porque es la más clara


Generalización de los resultados. Intervalos de confianza y valores de probabilidad

El razonamiento que subyace en todo trabajo de investigación es que si la muestra que hemos estudiado ha sido extraída de forma aleatoria de la población, los resultados observados en ella serán válidos aproximadamente para esa población, y los procedimientos estadísticos nos permiten cuantificar la magnitud del término "aproximadamente", lo que dependerá del tamaño y representatividad de la muestra (error de muestreo), la variación debida a las técnicas de medida empleadas (error de medida), y la propia variabilidad biológica del proceso estudiado (error aleatorio).

La precisión de la estimación efectuada a partir de los datos del estudio se refleja en el intervalo de confianza. El intervalo de confianza de un parámetro viene dado por dos límites, inferior y superior, en el que, de acuerdo con nuestros datos, esperamos que se encuentre el valor verdadero del parámetro de la población (desconocido), con un nivel de seguridad determinado y que se suele fijar en el 95%.

El intervalo de confianza es mucho más informativo que indicar solo si un resultado ha sido estadísticamente significativo, incluso aunque se dé el valor de la probabilidad.

Los resultados del objetivo primario de la investigación se deben reflejar siempre con el intervalo de confianza, hayan resultado o no estadísticamente significativos.

Veamos un ejemplo

La media del IMC (índice de masa corporal) fue superior en 3.1 Kg/m² (Int.conf. 95% = 2.2 a 4.0, t Student = 6.9 p < 0.001) en los pacientes con cifras compatibles con hipertensión arterial (media IMC= 30.2 Kg/m², s=4.8, n=728), que en los pacientes con cifras de tensión arterial adecuadas (media IMC= 27.1 Kg/m², s=4.4, n=129).

La ventaja fundamental del intervalo de confianza frente al valor de probabilidad -y mucho más frente a indicar sólo si es estadísticamente significativo- radica en que al proporcionar un rango de valores nos permite cuantificar la precisión biológica de la estimación, mientras que el valor de P no tiene ningún significado clínico fuera del contexto de los datos obtenidos, y el nivel de significación no es, al fin y al cabo, mas que un valor arbitrariamente seleccionado, fundamentalmente por motivos de costumbre, porque ¿qué importancia puede tener obtener un valor de P de 0.046 o uno de 0.054? y sin embargo en el primer caso diremos que el resultado es estadísticamente significativo y en el segundo que no lo fue. En muchos manuales de estilo, y es algo que suscribimos fervientemente, se recomienda no utilizar los términos "estadísticamente significativo" en la exposición, amén de otros tecnicismos como "hipótesis nula". En esa misma línea recomendamos encarecidamente indicar, en el apartado de Métodos, la diferencia mínima entre grupos que se considera clínicamente relevante para todos los objetivos primarios del estudio, ya que además nos sirve para determinar la potencia de los contrastes, sobre todo cuando el resultado no ha sido estadísticamente significativo al nivel de probabilidad prefijado.


Otras recomendaciones generales

En la presentación de resultados, los relativos al objetivo primario del trabajo deben colocarse en primer lugar; tanto los que resultaron estadísticamente significativos como los que no, y siempre con referencia a la magnitud de su importancia clínica.

Los resultados del contraste de hipótesis no especificadas previamente en el protocolo deben presentarse como resultados exploratorios -propuestas-, y aunque deben tener plausibilidad biológica no pueden ser planteados como si se tratase de la confirmación de una hipótesis.

Si no se indica nada en contra, se entiende que los contrastes son bilaterales; si no fuera así, se debe especificar expresamente. También se debe especificar si se utilizó un contraste para muestras independientes o pareadas.

Cuando se trata de pruebas estadísticas conocidas basta con nombrarlas, y no tiene ningún sentido describirlas con detalle. Si utilizamos una prueba especial o poco conocida, al menos hay que proporcionar una buena referencia bibliográfica de ésta y en algunos casos puede ser interesante una pequeña descripción en el apartado de métodos, dirigida al lector medio a quien vaya destinado el artículo.

Se debe indicar el programa estadístico utilizado para los cálculos

Enlaces de interés

How to write a paper in scientific journal style and format
Greg Anderson. Biology Department. Bates College. Lewiston, Maine
 
Excelentes páginas orientadas fundamentalmente a los estudiantes, sencillas y claras; pero también de obligada lectura para quien se enfrente con la publicación de su primer artículo. Al resto quizás tampoco le viene mal recordar algunas cosas.
 
Guidelines for Statistical Reporting in Articles for Medical Journals. Amplifications and Explanations
John C. Bailar III, M.D., Ph.D.; and Frederick Mosteller, Ph.D.; Boston, Massachusetts.
Annals of Internal Medicine, 15 February 1988. 108:266-273.
 
Guía de estilo de la revista BMJ
 
Statistical Methods in Psychology Journals: Guidelines and Explanations
Leland Wilkinson and Task Force on Statistical Inference. APA Board of Scientific Affairs. American Psychologist.
 
Uniform Requirements for Manuscripts Submitted to Biomedical Journals
International Committee of Medical Journal Editors
 
The CONSORT statement: revised recommendations for improving the quality of reports of parallel group randomized trials
David Moher, Kenneth F Schulz and Douglas G Altman
BMC Medical Research Methodology 2001 1: 2
 

Bibliografía seleccionada

Lang TA, Secic M. How to Report Statistics in Medicine. Annotated Guidelines for Authors, Editors, and Reviewers. American College of Physicians. Philadelphia, 1997

Indice de artículos