Concordancia para variables continuas Aunque en la literatura clínica hay una gran tradición de usar el coeficiente de correlación lineal (r) para evaluar la concordancia entre variables continuas, ello es incorrecto: dicho coeficiente mide la correlación y no la concordancia: si, p.e. un aparato para medir una magnitud produce sistemáticamente el triple de otro aparato que supuestamente mide la misma magnitud, ambas mediciones están perfectamente correlacionadas (r=1) pero no son concordantes en absoluto. Ejemplo: en 1979, en un artículo de gran impacto entre neumólogos (Thorax,34:807-809), se comparaba las medidas de flujo respiratorio máximo obtenidas por el aparato estándar (Wright) con las obtenidas por otro portátil (miniWright). Los autores hacen hincapié en que ambas medidas se correlacionaban muy bien (r=0,992) y proponen el uso alternativo del portátil. Como veremos enseguida las cosas no eran tan claras. El índice más establecido para variables continuas es el denominado coeficiente de correlación intraclase que se calcula a partir de los estadísticos que produce un análisis de la varianza y que, por tanto, no estamos en condiciones de abordar en este curso. Un procedimiento, gráfico, alternativo propuesto por Altman e ilustrado con datos del estudio anterior es el siguiente:
Si calculamos el coeficiente de correlación lineal
![]() ![]() donde se observa que las mediciones no son tan concordantes como parecía en la gráfica anterior. La media de las diferencias es de -2.1 l/min, es decir hay un error sistemático "hacia abajo" por parte del miniWright. Los límites de concordancia son los límites de confianza de esta diferencia, para calcularlos se calcula la desviación típica de la diferencia, en este caso 38,8 y como t17 =2,11, los límites de concordancia son 79,3 y -83,5, es decir con un 95% de probabilidad la medición del miniWright puede ser 83,5 por debajo o 79,3 por arriba de la media de ambas ¿es esto aceptable clínicamente? Notar que en la gráfica, las diferencias se mantienen homogéneas a lo largo del eje X. Si no fuera así, este método no se puede usar. Puesto que estamos trabajando con una muestra, se deben también calcular los límites de confianza para dichos límites de concordancia. El error estándar para estos límites es aproximadamente En nuestro caso para el límite inferior serían -114,3 y -45,1 y para el superior 40,9 y 110,1. Referencias Bland J.M., Altman D.G. (1986) Statistical methods for assessing agreement between two methods of clinical measurement. Lancet i: 307-310. Latour J., Abraira V., Cabello J.B., López Sánchez J. (1997) Métodos de investigación en cardiología clínica (IV). Las mediciones clínicas en cardiología: validez y errores de medición. Rev Esp Cardiol 50:117-128.
|