Variables indicadoras ("dummy")

En los modelos de regresión logística la "multiplicatividad" se asume. Esto, p.e. para la variable DOSIS del ejemplo 6, quiere decir que el OR para la muerte (variable dependiente) de la DOSIS 2 con respecto a la DOSIS 0 es el cuadrado del OR de la DOSIS 1. ¿Es razonable esta asunción?

La solución es la misma que en regresión lineal; crear tantas variables como categorías menos 1 denominadas variables indicadoras con el siguiente esquema

  X1 X2 X3
Dosis 0 0 0 0
Dosis 1 1 0 0
Dosis 2 0 1 0
Dosis 3 0 0 1

El modelo quedaría

Por lo tanto, para la dosis 0, como las tres variables son 0

es decir es el odds para la dosis 0

Para la dosis 1 el modelo queda

restando ambas expresiones

por lo tanto es el OR de la dosis 1 con respecto a la dosis 0, del mismo modo es el OR de la dosis 2 con respecto a la dosis 0, etc. El segundo esquema de codificación visto en regresión lineal no tienen una clara interpretación en regresión logística, mientras que el tercero tiene una interpretación similar a la que tenía allí.

Conviene destacar que estas variables indicadoras no tienen ningún sentido por sí solas y por, lo tanto, deben figurar en los modelos y se debe contrastar su inclusión siempre en bloque.

Ejercicio propuesto: Para los datos del Ejemplo 6, crear variables "dummy" para la dosis e interpretrar los coeficientes y comentar las diferencias.

INDICE CAPÍTULO ANTERIOR SIGUIENTE CAPÍTULO VOLVER A BIOESTADÍSTICA