Introducción al análisis multivariante ¿qué es? Volvamos al problema del ejercicio y la supervivencia al infarto. Supongamos que: ¿Lo aceptamos? Es decir ¿consideramos la asociación estadística establecida y pasamos a considerar si es causal? Supongamos que si tenemos en cuenta el tabaco, resultara que el 99% de los que hacen ejercicio no fuman, mientras que sólo no fuman el 70% de los que no lo hacen y el tabaco ya hubiera demostrado una asociación con la supervivencia: ¿hemos encontrado un nuevo factor pronóstico o sólo estamos viendo indirectamente el efecto del tabaco? Dicho en la jerga usual: ¿es el tabaco una variable de confusión para la asociación entre el ejercicio y la supervivencia? Una variable es de confusión cuando está asociada simultáneamente con la variable en estudio (el ejercicio en este caso) y con la variable respuesta (la supervivencia) y no forma parte de la cadena causal. La confusión se puede abordar por: ¿Cuándo es necesario el análisis multivariante? Siempre que el diseño no controle la confusión ... y eso ¿cuándo ocurre? No se puede saber a priori: el mejor método para evitar confusión es la selección aleatoria, pero no lo garantiza.
|