¿Cómo estudiar la validez de una prueba para una variable continua?

¡Hola de nuevo!

En la primera entrada comentábamos cómo estudiar la validez de una prueba diagnóstica para una situación dicotómica; es decir, una situación con únicamente dos posibilidades (presencia o ausencia de la enfermedad). Sin embargo, hay condiciones que no son dicotómicas sino que se consideran variables continuas, ya que los valores entran dentro de un rango continuo, no tienen valores discretos. Por ejemplo, este es el caso de la diabetes. Entonces, ¿cómo se estudia la validez de una prueba para enfermedades de este tipo? Antes de nada, si no lo has hecho ya, echa un vistazo a los conceptos estudiados en la primera entrada, ya que muchos de ellos se volverán a nombrar y te será de ayuda. 

¡Comencemos!

Al trabajar con una variable continua, hay que "convertirla" en una variable dicotómica. Para ello, se eligen los puntos de corte dentro del continuo de la variable. Los puntos de corte son aquellos valores consensuados a partir de los cuales se considera la presencia de la enfermedad y, por debajo de ellos, su ausencia. Con tal fin se usan las curvas ROC:
  • Curvas ROC: método gráfico que relaciona la sensibilidad y la especificidad para comparar la validez de diferentes pruebas diagnósticas o para establecer el punto de corte óptimo.
    h
    Fuente: Molina Arias, M. & Ochoa Sangrador, C. (2017). Pruebas diagnósticas con resultados continuos o politómicos. Curvas ROC. Evidencias en pediatría. Recuperado de http://archivos.evidenciasenpediatria.es/files/41-13133-RUTA/Fundamentos_MBE_12.pdf
Para entenderlo mejor, vamos a ver un caso clínico.

Caso clínico: Diabetes

Como hemos comenzado diciendo, un ejemplo de enfermedad con variable continua es la diabetes, debido a que esta se caracteriza por los niveles de glucosa en sangre y se diagnostica cuando la concentración de este azúcar sobrepasa un cierto valor, el cual se trata del punto de corte. Se obtienen los datos de concentración de glucosa en sangre (mg/100mL) tras la ingesta de un preparado, se seleccionan tres puntos con los que se comenzará a trabajar y se calcula la especificidad (E) y la sensibilidad (S) para cada uno de los puntos:
Sabemos que la población sobre la que se hace el estudio es de 71724 individuos, de los cuales 6570 presentan la enfermedad. Así, con esos datos y utilizando las fórmulas que se explicaron en la primera entrada, se pueden rellenar las tablas de contingencia necesarias para el posterior cálculo de los parámetros de validación:

Con estos datos se pueden seguir dos caminos diferentes: estudiar los parámetros para la validación (VP+/VP-, RV+/RV- o YI) o, lo que en el caso de elegir el punto de corte óptimo es mejor, realizar una curva ROC. 

Siguiendo el primero de los caminos se reúnen los resultados en la siguiente tabla:
A partir de los valores que hemos calculado vemos que el punto de corte establecido en la concentración de glucosa de 70 mg/100mL queda descartado, ya que ninguno de los parámetros se ajusta a la validez de las pruebas diagnósticas. Sin embargo, los otros dos puntos presentan algunos valores que pueden dar lugar a error al compararlos por este método ya que mientras que los valores predictivos y las razones de verosimilitud del tercer punto son mejores, el YI se acerca más a la unidad en el segundo caso. Por ello, se considera mejor realizar las curvas ROC para la elección de un buen punto de corte.

Como comenzamos diciendo las curvas ROC relacionan la sensibilidad y la especificidad de las pruebas diagnósticas y es el área que queda bajo la curva (AUC) la que determina la bondad del método que se está analizando. Así, en una situación ideal el AUC sería de 1 (rojo), mientras que pruebas con poco valor diagnóstico constarán de una AUC menor o igual a 0.5 (verde), estando las demás en un punto intermedio entre ambos valores (azul). Esto se puede entender con la siguiente imagen:
Fuente: Molina Arias, M. & Ochoa Sangrador, C. (2017). Pruebas diagnósticas con resultados continuos o politómicos. Curvas ROC. Evidencias en pediatría. Recuperado de http://archivos.evidenciasenpediatria.es/files/41-13133-RUTA/Fundamentos_MBE_12.pdf

Una vez sabemos esto, con un programa informático como Excel podemos realizar la curva ROC de nuestro caso. Para ello, se toman los valores de E y S de los tres puntos de corte que se van a considerar y se grafican tanto la curva como la línea de tendencia:
La línea de tendencia nos ayudará a determinar el mejor punto de corte, ya que todos aquellos puntos que queden por encima de la misma se considerarán siempre mejores que los que quedan por debajo, ya que siguiendo con la misma explicación de arriba, cuanto más arriba de la línea de tendencia quede el punto más se acerca a la representación ideal de las curvas ROC donde el AUC es de 1. Esto se debe a que, principalmente, los puntos en estas localizaciones serán aquellos que muestren una mayor sensibilidad y, por tanto, un menor número de FP. Así, finalmente, vemos que el punto de corte óptimo para el diagnóstico de la diabetes es el segundo punto; es decir, el correspondiente a una concentración de glucosa de 110 mg/100mL.

Una vez llegados al final, quizá te preguntes lo siguiente, ¿qué ocurre si cambia la prevalencia de la enfermedad? ¿cambiaría el punto de corte? No, el punto de corte seguiría siendo el mismo porque, como hemos visto, las curvas ROC son independientes de la prevalencia. En este caso, la prevalencia de la diabetes es del 9.16% y, en el caso de que esta por ejemplo aumentase, tanto las tablas de contingencia como los valores predictivos cambiarían, tal como observamos en el ejercicio de la entrada anterior. Sin embargo, las razones de verosimilitud, el índice de Youden y las curvas ROC no cambiarían, por ello, el punto de corte óptimo, una vez establecido quedará consensuado.

Con esto, espero que hayáis entendido como se estudia la validez de variables continuas y como se elige el punto de corte óptimo para convertir la variable continua en una situación dicotómica.

¡Hasta la próxima!

Comentarios