Contrastes sobre independencia de v.a. cualitativas Se quiere estudiar un posible factor pronóstico del éxito de una terapia, p.e. cierto grado de albuminuria como mal pronóstico en la diálisis. Los resultados de un estudio de este tipo se pueden comprimir en una tabla 2x2 del tipo
Se estudian T individuos, a tienen al factor (F) y tiene éxito la terapia (E), b no tienen al factor (nF) y tiene éxito la terapia, ... ¡Ojo! A pesar de la aparente "inocencia" de esta tabla, puede significar cosas distintas segíun el diseño del estudio. No todas las probabilidades de las que se habla más abajo se pueden estimar siempre. H0 es que el factor F y el éxito E son independientes (F no es factor pronóstico) y H1 que están asociados (sí es factor pronóstico). Si son independientes p(EÇF) = p(E)p(F). A partir de los datos de la tabla las mejores estimaciones de estas probabilidades son , por lo tanto en H0 , en consecuencia el valor esperado para esa celda en H0 es (cociente entre el producto de los totales marginales y el gran total), del mismo modo se calculan los demás valores esperados y se construye el estadístico que se distribuye según una distribución conocida denominada ji-cuadrado, que depende de un parámetro llamado "grados de libertad" (g.l.) Los g.l. en esta tabla son 1. Esto se puede generalizar a tablas CxF y los grados de libertad son (C-1)x(F-1). En una muestra de 100 pacientes que sufrieron infarto de miocardio se observa que 75 sobrevivieron más de 5 años (éxito). Se quiere estudiar su posible asociación con la realización de ejercicio moderado (factor). La tabla es
Calculamos los valores esperados en H0
Obsérvese que una vez calculado uno de los valores esperados, los demás vienen dados para conservar los totales marginales (eso es lo que significa que hay 1 g.l.). A partir de aquí calculamos Rechazamos la H0 y concluimos que hay asociación entre el ejercicio y la supervivencia. Obviamente esta asociación no es necesariamente causal. Nota: Para hacerlo con un paquete estadístico, p.e. el SPSS, deberíamos crear un archivo con 2 variables: Super con un código distinto para cada grupo, p.e. 1 para supervivencia y 0 para no y Ejer también con dos códigos. Para calcular la ji-cuadrado desplegamos los menús que se ven en la gráfica: y la salida es Tabla de contingencia EJERC * SUPER Recuento
Pruebas de chi-cuadrado
a Calculado sólo para una tabla de 2x2. b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 10,00. |