La colinealidad en la regresión de Poisson

Del mismo modo que en la regresión logística, para estimar los coeficientes hay que invertir la matriz J = X’pX siendo además la inversa de J la matriz de varianzas-covarianzas de los mismos. Por consiguiente, si dicha matriz es singular el modelo es irresoluble y si es casi-singular existen problemas de precisión numérica y estadística, siendo, además, inestable la estimación. Como entonces, aunque no es un problema de colinealidad en sentido estricto se sigue hablando, por analogía, de colinealidad y, también, el diagnóstico de la misma se hace de análoga manera, es decir, calculando los índices de condición para la matriz J también escalada para que su diagonal principal esté formada por unos, y calculando a partir de los autovectores de la misma, la matriz de descomposición de la varianza de los estimadores. Evidentemente, por no ser un problema de colinealidad, el factor de inflación de la varianza tampoco es útil ahora.

También en el caso de la regresión de Poisson, y a diferencia de la regresión lineal, la matriz J no depende sólo de los datos, sino también de los coeficientes del modelo (a través de p) y pudiera darse el caso de que, en el proceso iterativo de estimación y para unos ciertos valores iniciales de los coeficientes, J fuera singular en algún paso del proceso alejado de la solución final y que, sin embargo, si se partiera de otros valores iniciales se pudiera acabar la estimación sin problemas. También puede ocurrir que, debido a la falta de precisión ligada a la casi-colinealidad de algún paso intermedio, el método de Newton-Raphson no convergiera para unos valores iniciales y, sin embargo, si convergiera para otros. En caso de que aparezcan estos problemas, un modo de minimizarlos es, ayudándose del diagnóstico de colinealidad, intentar la estimación con distintos valores iniciales, incluyendo estimaciones aproximadas de los coeficientes (obtenidas, por ejemplo, a partir del método usado en el ejemplo).

Hay que tener en cuenta, también, que debido a los grandes valores que suele tener la variable s, tamaño del intervalo, en algunos modelos (en el ejemplo desarrollado en este texto son cientos de miles, pero en problemas de estimación de tasas de mortalidad por países puede ser de decenas o centenas de millones) pueden aparecer problemas de precisión o, incluso, desbordes (se denomina así al hecho de que un número sea mayor que la capacidad de la porción de memoria reservada en el ordenador para almacenarlo) en los algoritmos de estimación. En estos casos se puede dividir dicha variable por una constante adecuada, es decir, se expresa la población en miles de personas o en centenas de miles, entonces el parámetro l queda multiplicado por ese mismo factor, pero en el modelo ese cambio sólo afecta a a0 (se le sumará el logaritmo de dicha constante) y no al resto de los coeficientes. Si en el ejemplo anterior se divide la población por 1.000, los modelos encontrados serán exactamente los mismos excepto el coeficiente a0 al que se le sumará ln1.000=6,908.

Ejemplo

Los “salida” del PRESTA del diagnóstico de colinealidad para el modelo del ejemplo anterior en el que se ha dividido la población por 1.000 es:

REGRESION POISSON CON LOS COEFICIENTES:
Const.: -3.6454  CIUDAD: .1302  EDAD1: .3680  EDAD2 : 2.2350

FACTOR
AUTOVALOR
INDICE CONDICION
1
2.64356
1.00000
2
1.00497
1.62188
3
.27931
3.07646
4
.07216
6.05269


PROPORCION DE VARIANZA EN LOS FACTORES

FACTOR
Const.
CIUDAD
EDAD1
EDAD2
1
.0163
.0423
.0140
.0182
2
.0003
.0014
.1838
.0802
3
.0375
.8924
.0586
.1435
4
.9459
.0639
.7436
.7581

Donde, con los criterios discutidos regresión lineal, no se aprecian problemas de colinealidad.

INDICE Capítulo anterior Siguiente capítulo VOLVER A BIOESTADÍSTICA