Contrastes de hipótesis

Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error.

La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).

La situación se puede esquematizar:

  H0 cierta H0 falsa
H1 cierta
H0 rechazada Error tipo I (a ) Decisión correcta (*)
H0 no rechazada Decisión correcta Error tipo II (b )

(*) Decisión correcta que se busca

a = p(rechazar H0|H0 cierta)
b = p(aceptar H0|H0 falsa)
Potencia =1-
b = p(rechazar H0|H0 falsa)

Detalles a tener en cuenta

1 a y b están inversamente relacionadas.
2 Sólo pueden disminuirse las dos, aumentando n.

Los pasos necesarios para realizar un contraste relativo a un parámetro q son:

1. Establecer la hipótesis nula en términos de igualdad

2. Establecer la hipótesis alternativa, que puede hacerse de tres maneras, dependiendo del interés del investigador

en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral (derecho en el 2º caso, o izquierdo en el 3º) o una cola.

3. Elegir un nivel de significación: nivel crítico para a

4. Elegir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H0 y que esté relacionado con q y establecer, en base a dicha distribución, la región crítica: región en la que el estadístico tiene una probabilidad menor que a si H0 fuera cierta y, en consecuencia, si el estadístico cayera en la misma, se rechazaría H0.

Obsérvese que, de esta manera, se está más seguro cuando se rechaza una hipótesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en H0, por eso es necesario que tenga la igualdad.

5. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica, o equivalentemente, calcular el "valor p" del estadístico (probabilidad de obtener ese valor, u otro más alejado de la H0, si H0 fuera cierta) y compararlo con a.

Ejemplo:

Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos

1. Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es:

2. la hipótesis alternativa

es un contraste lateral derecho.

3. Fijamos "a priori" el nivel de significación en 0,05 (el habitual en Biología).

4. El estadístico para el contraste es

y la región crítica T>ta
Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t1-a
y si hubiera sido bilateral T<t1-
a/2 o T>t a/2
En este ejemplo t(35)0,05=1,69.

5. Calculamos el valor de t en la muestra

no está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H0.

Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es buscar en las tablas el "valor p" que corresponde a T=0,833, que para 35 g.l. es aproximadamente 0,20. Es decir, si H0 fuera cierta, la probabilidad de encontrar un valor de T como el que hemos encontrado o mayor (¿por qué mayor? Porque la H1 es que m es mayor , lo que produciría una media muestral mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la probabilidad de equivocarnos si rechazamos H0 es 0,20, como la frontera se establece en 0,05 no la rechazamos.

Este valor crítico de 0,05 es arbitrario pero es la convención habitual. ¿Cuán razonable es?

Problema al respecto : en la hipótesis de que un mazo de cartas esté bien barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y 2 el rey de bastos es 1/40 x 1/39=0,000833.

Si hacemos la experiencia y obtenemos ese resultado ¿rechazaríamos la hipótesis de que el mazo está bien barajado? ¿Cuánto se parece esto a la lógica del contraste de hipótesis?

Volvamos al problema del estrés. Como no se rechaza H0, se puede cometer un error tipo II. ¿Cuál es b ?. De hecho, sería la información relevante a comunicar en este estudio (la probabilidad del error que se pude cometer en él). Habitualmente, sin embargo, no se da porque los paquetes estadísticos no la calculan.
Para calcularla se debe concretar H1, p.e.
m = 20 (el criterio para este valor no es estadístico)

b =p(aceptar H0|H1 cierta)

Supongamos que el tamaño muestral sea suficientemente grande para poder aproximar t a z.

¿Cuándo se acepta H0? si z £ 1,69

es decir, se acepta H0 si

¿Qué probabilidad hay de encontrar si m = 20 (zona verde del gráfico)? En esta hipótesis lo que se distribuye como una z es

Otras lecturas recomendadas

Hypothesis testing. Guyatt et al. CMAJ. 152:27-32. 1995

INDICE CAPÍTULO ANTERIOR CAPÍTULO SIGUIENTE VOLVER A BIOESTADÍSTICA