Errores en las mediciones y clasificaciones clínicas: Precisión y validez

V. Abraira

Introducción

Todo proceso de medición (proceso mediante el cual se cuantifica una magnitud) está amenazado por diversas fuentes de error, derivadas tanto de las limitaciones del instrumento de medida, como de la naturaleza de la magnitud a medir. Clásicamente se distingue entre el error debido a la precisión limitada del instrumento que atenta a la reproducibilidad de la medición introduciendo un error aleatorio en la misma y el debido a la validez, también limitada, que introduce un error sistemático, que en epidemiología se denomina sesgo. De modo esquemático se puede decir que la validez depende exclusivamente del instrumento y tiene que ver con la cuestión de si el mismo mide lo que debe medir, mientras que la precisión depende tanto del instrumento como del proceso de medición y tiene que ver con cuánto se aproxima la medida al valor real de la magnitud. En ambos casos es siempre cuestión de grado, no existen instrumentos infinitamente precisos y válidos, hay sólo instrumentos más precisos y/o válidos que otros. Al modo habitual de controlar la validez de un instrumento de medida se le denomina calibración, y consiste en comparar las medidas obtenidas con él con unos patrones de referencia (cuanto más se parezcan estas medidas al patrón, más válido es el instrumento), mientras que la manera de controlar la precisión de un instrumento es comparar entre sí medidas repetidas de un mismo objeto y evaluar el grado de acuerdo entre ellas (cuanto más se parezcan estas medidas entre sí, más preciso es).

En ciertas situaciones, en la práctica clínica entre ellas, el proceso de control de la precisión y validez de una medida es más complejo que el esbozado hasta aquí, debido a dos fenómenos inherentes a las mismas y que, hasta ahora, no se han considerado. De un lado, las magnitudes a medir son aleatorias, es decir presentan diversos grados de variabilidad impredecible propia. Si, por ejemplo, se trata de controlar la precisión de la medición de la presión arterial diastólica habría que repetir la medición en un mismo individuo varias veces y como la propia presión arterial es variable a lo largo del tiempo, el resultado se vería afectado simultáneamente por la variabilidad introducida por la precisión limitada del instrumento (manómetro y observador) y la variabilidad propia de la presión arterial.

Por otro lado, además de magnitudes tales como presión, temperatura, concentración de hemoglobina en sangre, etc., se trabaja con magnitudes como dolor, mejoría en un proceso patológico, grado pronóstico de una afección, etc., para las cuales no existe un patrón de referencia claro y objetivo ni escala métrica apropiada y que, por tanto, suelen describirse en escalas ordinales o, incluso, nominales, cuya apreciación puede estar muy distorsionada por influencias subjetivas. Estas magnitudes suelen denominarse variables blandas (véase Feinstein) y dan lugar a clasificaciones mejor que a mediciones en sentido estricto (que implica la existencia de una escala métrica). Evidentemente, existen también variables objetivas ("duras" en la jerga) que dan lugar a clasificaciones, por ejemplo muerto/vivo. Los procesos de clasificación sufren los mismos problemas de validez y precisión que los de medición, pero con ciertas complicaciones añadidas en el caso de las variables blandas. Para controlar su validez, no suelen existir patrones de referencia, o no son tan objetivos o accesibles como en el caso de una magnitud física. Por ejemplo, en la calibración de las imágenes obtenidas por resonancia nuclear magnética para diagnosticar lesiones de menisco, ¿cuál es el patrón de referencia adecuado? ¿la visión directa mediante artroscopia? ¿es ésta suficientemente objetiva, o también está influida por factores subjetivos dependientes de la propia técnica, de la experiencia del médico que la realiza, de la diversidad de meniscos "normales"? En este sentido se suele distinguir entre dos modos de controlar la validez de un instrumento de medida (nótese que se está usando el término instrumento de medida en un sentido muy amplio, en este ejemplo no es sólo el "aparato" usado para obtener la imagen, sino el conjunto formado por el aparato que produce la imagen y el observador que la interpreta, siendo, además, éste último más crítico para los errores de medición-clasificación): cuando se hace con patrones objetivos (patrón de oro o “gold standard”) se habla de exactitud ("accuracy" en la literatura clínico-epidemiológica en inglés), mientras que cuando se controla comparando con una referencia considerada mejor pero que no puede considerarse un verdadero patrón de oro se habla de conformidad (“conformity” en inglés)

En cuanto a la reproducibilidad, sobre todo con métodos de clasificación, se distingue entre la reproducibilidad del mismo instrumento (típicamente un observador en este caso) en dos instantes de tiempo diferentes y se habla de concordancia ("agreement" en la literatura en inglés) o consistencia interna o intraobservador, por ejemplo un radiólogo o un servicio de radiología tomado como unidad, ¿clasifica igual la misma radiografía estudiada hoy y dos meses después? y reproducibilidad del mismo instrumento usado en diferentes condiciones, por ejemplo dos radiólogos diferentes ¿clasifican del mismo modo la misma radiografía? se habla entonces de concordancia o consistencia externa o interobservador.

Esquemáticamente

Precisión o reproducibilidad o concordancia concordancia intraobservador
concordancia interobservador
Validez exactitud
conformidad

Referencias

Feinstein A.R. (1987) Clinimetrics. Yale University Press. New Haven.

INDICE SIGUIENTE CAPÍTULO VOLVER A BIOESTADÍSTICA