Introducción al análisis multivariante

¿qué es?
¿qué añade?
¿es siempre necesario?

Volvamos al problema del ejercicio y la supervivencia al infarto. Supongamos que:
1) El problema tiene interés
2) el RR de 1,32 es suficientemente preciso
3) es clínicamente relevante.

¿Lo aceptamos? Es decir ¿consideramos la asociación estadística establecida y pasamos a considerar si es causal?

Supongamos que si tenemos en cuenta el tabaco, resultara que el 99% de los que hacen ejercicio no fuman, mientras que sólo no fuman el 70% de los que no lo hacen y el tabaco ya hubiera demostrado una asociación con la supervivencia: ¿hemos encontrado un nuevo factor pronóstico o sólo estamos viendo indirectamente el efecto del tabaco? Dicho en la jerga usual: ¿es el tabaco una variable de confusión para la asociación entre el ejercicio y la supervivencia?

Una variable es de confusión cuando está asociada simultáneamente con la variable en estudio (el ejercicio en este caso) y con la variable respuesta (la supervivencia) y no forma parte de la cadena causal.

La confusión se puede abordar por:
i) diseño: en este ejemplo se podría hacer que en la muestra estuvieran igualmente representados los fumadores y los no fumadores. Este es el objetivo fundamental de la asignación aleatoria a los grupos en los ensayos clínicos.
ii) análisis: por análisis multivariante (los más comunes son los modelos de regresión) con los que se puede analizar simultáneamente el efecto de varias variables y obtener estimaciones del efecto de cada una corregido o ajustado por las otras.

¿Cuándo es necesario el análisis multivariante? Siempre que el diseño no controle la confusión ... y eso ¿cuándo ocurre? No se puede saber a priori: el mejor método para evitar confusión es la selección aleatoria, pero no lo garantiza.

INDICE CAPÍTULO ANTERIOR VOLVER A BIOESTADÍSTICA