Función lineal
Se
llama función lineal de una variable, a una función de la forma
a0:
ordenada en el origen (valor de Y cuando X=0)
a1:
pendiente (cambio de Y al aumentar X en 1) |
|
Modelo de regresión lineal simple
Es
un modelo de regresión lineal entre dos variables
es
un modelo probabilístico, que también se puede escribir
A
la variable Y se la denomina variable dependiente y a X independiente.
Modelo I de regresión lineal se asume
que
|
i) X no es una variable aleatoria.
ii) para cada
valor xi de X existe una v.a. Y|xi cuya media
está dada por el modelo.
iii)
todas las variables Y|xi son normales, independientes y con igual
varianza.
|
Ejemplo 2:
Se quiere estudiar la asociación entre consumo de sal y tensión arterial.
A una serie de voluntarios se les administra distintas dosis de
sal en su dieta y se mide su tensión arterial un tiempo después.
Variable
X: gr. de sal diarios (no aleatoria)
Variable Y: presión arterial en mm. de Hg
asumimos
que para cada valor de X, Y no está determinada, sino que
a0
presión arterial media de los que no toman nada de sal.
a1
cambio de la media de presión arterial por aumentar 1 gr el consumo de
sal, asumiendo que es constante. Si fuera 0, quiere decir que la presión
no cambia con el consumo de sal, por tanto ambas variables son independientes,
un valor distinto de cero indica que están correlacionadas y su magnitud
mide la fuerza de la asociación.
A
partir de una muestra aleatoria, la teoría estadística permite:
i) estimar los coeficientes a
i del
modelo (hay dos procedimientos: mínimos cuadrados y máxima verosimilitud que
dan el mismo resultado).
ii) estimar la varianza de las variables Y|xi llamada cuadrados
medios del error y representada por s2 o MSE. A su raíz cuadrada
se le llama error estándar de la estimación.
iii) conocer la distribución muestral de los coeficientes estimados, tanto su
forma (t) como su error estándar, que permite hacer estimación por
intervalos como contrastes de hipótesis sobre ellos.
Ejemplo 3
: Para el diseño del ejemplo 2 una muestra produce los siguientes datos:
X (sal)
|
Y (Presión)
|
1,8
|
100
|
2,2
|
98
|
3,5
|
110
|
4,0
|
110
|
4,3
|
112
|
5,0
|
120
|
La "salida" de un paquete estadístico es:
86,371
presión arterial media sin nada de sal.
6,335 aumento de presión por cada gr de sal; como es distinto de 0 indica
correlación. La pregunta es ¿podría ser 0 en la población? En términos de
contrastes de hipótesis
H0
: a1
= 0
H1 : a1
¹ 0
según
iii)
|
aquí
t=7,546 con un valor p=0,002
|
se
rechaza H0.
Para
hacer estimación por intervalos de la fuerza de la asociación o el efecto
en
este ejemplo para a
1
al 95%
6,335
± 2,776x0,840
= (4,004 8,666)
y del mismo modo
se ha calculado en la salida anterior, aunque en general
tiene menos interés, para a0
|