|
|
CORRELACION Y MODELOS DE REGRESION LINEAL
V. Abraira
Bibliografía:
V.
Abraira, A. Pérez de Vargas
Métodos Multivariantes en Bioestadística.
Ed. Centro de Estudios Ramón Areces. 1996.
D.G. Kleinbaum, L.L. Kupper, K.E.
Muller
Applied Regression Analysis and
Other Multivariables Methods.
PWS-KENT Publishing Company. 1988.
Generalización del concepto de fdp a
variables multidimensionales
La
función densidad de probabilidad (fdp) para una variable aleatoria es
una función a partir de la cual se puede calcular la probabilidad de los
distintos valores de la variable.
En
el caso discreto:
en
el caso continuo:
Esto
se puede generalizar a más de una variable. Para n variables aleatorias X1,
X2, ..., Xn se llama fdp conjunta a una
función n-dimensional f(x1,x2,...,xn) a partir
de la cual se puede calcular la probabilidad de los distintos valores de las
variables.
En
el caso discreto:
en
el caso continuo:
Del
mismo modo que en el caso unidimensional estas funciones están sometidas a las
condiciones:
|
discreta
|
|
continua
|
Ejemplo
1: En una
cierta población se definen dos variables discretas: X1=
hipertensión arterial y X2= consumo excesivo de sal,
ambas con los valores 0=no y 1=sí. La fdp conjunta podría ser
|
X1
|
X2
|
0
|
1
|
0
|
0,4
|
0,1
|
1
|
0,3
|
0,2
|
f(0,0)=0,4
quiere decir que la probabilidad de que un individuo no sea hipertenso
(X1=0) y no tenga un consumo excesivo de sal (X2=0)
es 0,4. Obsérvese que la suma de los valores de la fdp es 1.
A
partir de esta fdp se puede calcular p.e. la probabilidad de que un
individuo sea hipertenso como 0,1+0,2=0,3.
En
general dada una fdp conjunta (para simplificar la notación consideremos
sólo dos variables X e Y) se pueden calcular las denominadas fdp
marginales como
Caso
discreto
|
|
Caso
continuo
|
|
y
simétricamente para la variable Y.
En el ejemplo anterior:
|
X1
|
|
X1
|
0
|
1
|
f2(X2)
|
0
|
0,4
|
0,1
|
0,5
|
1
|
0,3
|
0,2
|
0,5
|
f1(X1)
|
0,7
|
0,3
|
|
Se
definen también las fdp condicionadas
que
permiten calcular las respectivas probabilidades condicionadas.
En
el ejemplo anterior se puede construir, p.e., la fdp de la hipertensión
(X1) condicionada al consumo no excesivo de sal (X2=0).
X1
|
|
0
|
0,4/0,5=0,8
|
1
|
0,1/0,5=0,2
|
Obsérvese
que como esto es una fdp, la suma de sus valores debe ser 1.
0,8
es la probabilidad de que un individuo no sea hipertenso dado que no tiene un
consumo excesivo de sal.
|
|
|