Contrastes de hipótesis

Contrastes de hipótesis

Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error.

La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H₀. Rechazar H₀ implica aceptar una hipótesis alternativa (H₁).

La situación se puede esquematizar:

	H₀ cierta	H₀ falsa H₁ cierta
H₀ rechazada	Error tipo I (a )	Decisión correcta (*)
H₀ no rechazada	Decisión correcta	Error tipo II (b )

(*) Decisión correcta que se busca

a = p(rechazar H₀|H₀ cierta)
b = p(aceptar H₀|H₀ falsa)
Potencia =1-b = p(rechazar H₀|H₀ falsa)

Detalles a tener en cuenta

1 a y b están inversamente relacionadas.
2 Sólo pueden disminuirse las dos, aumentando n.

Los pasos necesarios para realizar un contraste relativo a un parámetro q son:

1. Establecer la hipótesis nula en términos de igualdad

2. Establecer la hipótesis alternativa, que puede hacerse de tres maneras, dependiendo del interés del investigador

en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral (derecho en el 2º caso, o izquierdo en el 3º) o una cola.

3. Elegir un nivel de significación: nivel crítico para a

4. Elegir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H₀ y que esté relacionado con q y establecer, en base a dicha distribución, la región crítica: región en la que el estadístico tiene una probabilidad menor que a si H₀ fuera cierta y, en consecuencia, si el estadístico cayera en la misma, se rechazaría H₀.

Obsérvese que, de esta manera, se está más seguro cuando se rechaza una hipótesis que cuando no. Por eso se fija como H₀ lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en H₀, por eso es necesario que tenga la igualdad.

5. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica, o equivalentemente, calcular el "valor p" del estadístico (probabilidad de obtener ese valor, u otro más alejado de la H₀, si H₀ fuera cierta) y compararlo con a.

Ejemplo:

Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos

1. Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es:

2. la hipótesis alternativa

es un contraste lateral derecho.

3. Fijamos "a priori" el nivel de significación en 0,05 (el habitual en Biología).

4. El estadístico para el contraste es

y la región crítica T>t_a
Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t_1-_a
y si hubiera sido bilateral T<t_1- _a_/2 o T>t _a_/2
En este ejemplo t_(35)0,05=1,69.

5. Calculamos el valor de t en la muestra

no está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H₀.

Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es buscar en las tablas el "valor p" que corresponde a T=0,833, que para 35 g.l. es aproximadamente 0,20. Es decir, si H₀ fuera cierta, la probabilidad de encontrar un valor de T como el que hemos encontrado o mayor (¿por qué mayor? Porque la H₁ es que m es mayor , lo que produciría una media muestral mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la probabilidad de equivocarnos si rechazamos H₀ es 0,20, como la frontera se establece en 0,05 no la rechazamos.

Este valor crítico de 0,05 es arbitrario pero es la convención habitual. ¿Cuán razonable es?

Problema al respecto : en la hipótesis de que un mazo de cartas esté bien barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y 2 el rey de bastos es 1/40 x 1/39=0,000833.

Si hacemos la experiencia y obtenemos ese resultado ¿rechazaríamos la hipótesis de que el mazo está bien barajado? ¿Cuánto se parece esto a la lógica del contraste de hipótesis?

Volvamos al problema del estrés. Como no se rechaza H₀, se puede cometer un error tipo II. ¿Cuál es b ?. De hecho, sería la información relevante a comunicar en este estudio (la probabilidad del error que se pude cometer en él). Habitualmente, sin embargo, no se da porque los paquetes estadísticos no la calculan.
Para calcularla se debe concretar H₁, p.e. m = 20 (el criterio para este valor no es estadístico)

b =p(aceptar H₀|H₁ cierta)

Supongamos que el tamaño muestral sea suficientemente grande para poder aproximar t a z.

¿Cuándo se acepta H₀? si z £ 1,69

es decir, se acepta H₀ si

¿Qué probabilidad hay de encontrar si m = 20 (zona verde del gráfico)? En esta hipótesis lo que se distribuye como una z es

Otras lecturas recomendadas

Hypothesis testing. Guyatt et al. CMAJ. 152:27-32. 1995