CORRELACION Y MODELOS DE REGRESION LINEAL

V. Abraira

Bibliografía:

V. Abraira, A. Pérez de Vargas
Métodos Multivariantes en Bioestadística.
Ed. Centro de Estudios Ramón Areces. 1996.

D.G. Kleinbaum, L.L. Kupper, K.E. Muller
Applied Regression Analysis and Other Multivariables Methods.
PWS-KENT Publishing Company. 1988.

Generalización del concepto de fdp a variables multidimensionales

La función densidad de probabilidad (fdp) para una variable aleatoria es una función a partir de la cual se puede calcular la probabilidad de los distintos valores de la variable.

En el caso discreto:

en el caso continuo:

Esto se puede generalizar a más de una variable. Para n variables aleatorias X1, X2, ..., Xn se llama fdp conjunta a una función n-dimensional f(x1,x2,...,xn) a partir de la cual se puede calcular la probabilidad de los distintos valores de las variables.

En el caso discreto:

en el caso continuo:

Del mismo modo que en el caso unidimensional estas funciones están sometidas a las condiciones:

discreta
continua

Ejemplo 1: En una cierta población se definen dos variables discretas: X1= hipertensión arterial y X2= consumo excesivo de sal, ambas con los valores 0=no y 1=sí. La fdp conjunta podría ser

X1
X2
0
1
0
0,4
0,1
1
0,3
0,2

f(0,0)=0,4 quiere decir que la probabilidad de que un individuo no sea hipertenso (X1=0) y no tenga un consumo excesivo de sal (X2=0) es 0,4. Obsérvese que la suma de los valores de la fdp es 1.

A partir de esta fdp se puede calcular p.e. la probabilidad de que un individuo sea hipertenso como 0,1+0,2=0,3.

En general dada una fdp conjunta (para simplificar la notación consideremos sólo dos variables X e Y) se pueden calcular las denominadas fdp marginales como

Caso discreto
Caso continuo

y simétricamente para la variable Y.

En el ejemplo anterior:

X1
X1
0
1
f2(X2)
0
0,4
0,1
0,5
1
0,3
0,2
0,5
f1(X1)
0,7
0,3

Se definen también las fdp condicionadas

que permiten calcular las respectivas probabilidades condicionadas.

En el ejemplo anterior se puede construir, p.e., la fdp de la hipertensión (X1) condicionada al consumo no excesivo de sal (X2=0).

X1
0
0,4/0,5=0,8
1
0,1/0,5=0,2

Obsérvese que como esto es una fdp, la suma de sus valores debe ser 1.

0,8 es la probabilidad de que un individuo no sea hipertenso dado que no tiene un consumo excesivo de sal.

INDICE Siguiente capítulo VOLVER A BIOESTADÍSTICA