Contrastes sobre independencia de v.a. cualitativas

Se quiere estudiar un posible factor pronóstico del éxito de una terapia, p.e. cierto grado de albuminuria como mal pronóstico en la diálisis. Los resultados de un estudio de este tipo se pueden comprimir en una tabla 2x2 del tipo

 

F

nF

 

E

a

b

m = a+b

nE

c

d

n = c+d

 

e = a+c

f = b+d

T

Se estudian T individuos, a tienen al factor (F) y tiene éxito la terapia (E), b no tienen al factor (nF) y tiene éxito la terapia, ...

¡Ojo! A pesar de la aparente "inocencia" de esta tabla, puede significar cosas distintas segíun el diseño del estudio. No todas las probabilidades de las que se habla más abajo se pueden estimar siempre.

H0 es que el factor F y el éxito E son independientes (F no es factor pronóstico) y H1 que están asociados (sí es factor pronóstico). Si son independientes p(EÇF) = p(E)p(F). A partir de los datos de la tabla las mejores estimaciones de estas probabilidades son , por lo tanto en H0 , en consecuencia el valor esperado para esa celda en H0 es (cociente entre el producto de los totales marginales y el gran total), del mismo modo se calculan los demás valores esperados y se construye el estadístico

que se distribuye según una distribución conocida denominada ji-cuadrado, que depende de un parámetro llamado "grados de libertad" (g.l.) Los g.l. en esta tabla son 1. Esto se puede generalizar a tablas CxF y los grados de libertad son (C-1)x(F-1).

Ejemplo

En una muestra de 100 pacientes que sufrieron infarto de miocardio se observa que 75 sobrevivieron más de 5 años (éxito). Se quiere estudiar su posible asociación con la realización de ejercicio moderado (factor). La tabla es

 

F

nF

 

E

50

25

75

nE

10

15

25

 

60

40

100

Calculamos los valores esperados en H0

 

F

nF

E

60x75/100=45

40x75/100=30

nE

60x25/100=15

40x25/100=10

Obsérvese que una vez calculado uno de los valores esperados, los demás vienen dados para conservar los totales marginales (eso es lo que significa que hay 1 g.l.). A partir de aquí calculamos

Rechazamos la H0 y concluimos que hay asociación entre el ejercicio y la supervivencia. Obviamente esta asociación no es necesariamente causal.

Nota: Para hacerlo con un paquete estadístico, p.e. el SPSS, deberíamos crear un archivo con 2 variables: Super con un código distinto para cada grupo, p.e. 1 para supervivencia y 0 para no y Ejer también con dos códigos. Para calcular la ji-cuadrado desplegamos los menús que se ven en la gráfica:

y la salida es

Tabla de contingencia EJERC * SUPER

Recuento

 

SUPER

 

Total

   

0

1

 

EJERC

0

15

25

40

 

1

10

50

60

Total

 

25

75

100

Pruebas de chi-cuadrado

Valor

gl

Sig. asint. (bilateral)

Sig. exacta (bilateral)

Sig. exacta (unilateral)

Chi-cuadrado de Pearson

5,556

1

,018

   

Corrección de continuidad

4,500

1

,034

   

Razón de verosimilitud

5,475

1

,019

   

Estadístico exacto de Fisher

     

,033

,017

Asociación lineal por lineal

5,500

1

,019

   

N de casos válidos

100

       

a Calculado sólo para una tabla de 2x2.

b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 10,00.

INDICE CAPÍTULO ANTERIOR SIGUIENTE CAPÍTULO VOLVER A BIOESTADÍSTICA