¿Cómo se comprueba la validez de una prueba diagnóstica?

¡Hola! ¿Estáis preparados para comenzar? ¡Allá vamos!

Uno de los primeros problemas que se plantean en un laboratorio clínico es la comprobación de la validez de la prueba diagnóstica que se está utilizando para una determinada enfermedad y en una determinada población; es decir, ¿cómo sabemos que la prueba diagnóstica es realmente buena o mala?

Para ello, vamos a empezar definiendo unos conceptos que se van a utilizar mucho tanto en esta entrada como en entradas posteriores y que seguramente muchos de vosotros hayáis escuchado por ahí en estos últimos tiempos. Comenzaremos con determinar los 4 resultados posibles en una prueba diagnóstica:

  • Verdaderos positivos (VP): la enfermedad está presente y ha sido detectada por la prueba diagnóstica.
  • Falsos positivos (FP): la enfermedad está ausente pero ha sido detectada.
  • Verdaderos negativos (VN): la enfermedad está ausente y no es detectada.
  • Falsos negativos (FN): la enfermedad está presente pero no es detectada.

Con esto, se pueden definir los conceptos de sensibilidad (S) y especificidad (E), los dos parámetros fundamentales utilizados para medir la validez de las pruebas diagnósticas:

  • Sensibilidad (S): parámetro que determina la capacidad de detectar la enfermedad. Se trata de la razón de VP entre el total de individuos que presentan la enfermedad. Es decir:
  • Especificidad (E): parámetro que determina la capacidad de detectar la ausencia de la enfermedad; es decir, de detectar a los individuos sanos. Se trata de la razón de VN entre los individuos sanos totales.

Con esto, echemos un vistazo al siguiente caso. Se quieren validar las pruebas realizadas para la detección del SIDA en dos muestras poblacionales diferentes, sabiendo que la E y S de las mismas es de un 99.5% y que los casos de SIDA en este lugar son 6000. De partida, podríamos decir que las pruebas parecen bastante buenas, pero vayamos a comprobarlo.

Muestra: población gallega (2.800.000 ciudadanos)

Para comenzar, se realiza una tabla de contingencia con los datos tal y como se muestra en la siguiente imagen y utilizando las fórmulas que se han mostrado arriba:
Con esto, se puede proceder a calcular los parámetros que permitan la validación de la prueba diagnóstica. Estos parámetros pueden ser de dos tipos, dependientes o independientes de la prevalencia.
  •  Prevalencia: porcentaje de la presencia de la enfermedad en una población.
En este caso, habiendo 6000 casos de SIDA en una población de 2800000 ciudadanos la prevalencia es de 21.4%, lo cual es un porcentaje bastante elevado por lo que no se puede considerar que se trate de una enfermedad rara.

Así, se procede a calcular el primer parámetro, los valores predictivos positivos y negativos que son dependientes de la prevalencia:
  • Valor predictivo positivo (VP+): probabilidad de que una prueba positiva corresponda a la presencia de la enfermedad. Se trata de la razón de los VP entre el total de positivos.
  • Valor predictivo negativo (VP-): probabilidad de que una prueba negativa corresponda a la ausencia de la enfermedad. Se trata de la razón de los VN entre el total de negativos.
En este caso, se obtiene que el VP+ es 0.3 y el VP- es 0.999; es decir, la prueba que se está utilizando da un alto número de FP. Por otra parte, en lo que respecta al VP- se ha obtenido un resultado muy alto por lo que se muestra una gran capacidad para discriminar a los individuos sanos siendo el test negativo.

Habiendo visto estos resultados se podría concluir que se necesita una prueba más específica para evitar los FP; sin embargo, como se ha comentado anteriormente, el parámetro calculado es dependiente de la prevalencia; entonces, ¿qué ocurre si la población en estudio muestra una mayor prevalencia? Veamos el próximo caso.

Muestra: población gallega con riesgo de padecer SIDA (20979 ciudadanos)

De nuevo, comenzamos haciendo la tabla de contingencia:
En este caso y en comparación con el anterior, se observa que la cantidad de FP ha disminuido debido a que se toma como población concretamente al grupo social con riesgo de padecer SIDA, siendo los 6000 individuos que padecen la enfermedad de esta población; por lo tanto, la prevalencia aumentará. Concretamente, en este caso la prevalencia es de 28.6%. Así, como ha aumentado la prevalencia, los valores predictivos que dependen de esta se verán a su vez afectados siendo en este caso el VP+ de 0.987 y el VP- de 0.998. 

Esta vez, podemos afirmar que la prueba diagnóstica es muy buena, cosa que no hemos dicho en el primer caso. Con todo esto te preguntarás, ¿entonces, la prueba es buena o no? La respuesta que hemos recibido es que esto depende de la prevalencia y por tanto de la población en estudio. Sin embargo, como hemos empezado diciendo, hay unos parámetros que son independientes de la prevalencia que también nos indican la validez de las pruebas diagnósticas. A continuación, se muestran dos de ellos.

Por una parte, calculamos la razón de verosimilitud:
  • Razón de verosimilitud positiva (RV+): razón de VP frente a FP (S/1-E). Cuanto mayor sea su valor, mejor será la prueba diagnóstica.
  • Razón de verosimilitud negativa (RV-): razón de FN frente a VN (1-S/E). Cuanto menor sea su valor, mejor será la prueba diagnóstica.
En este caso, RV+ es 199 y RV- es 0.005; por lo tanto, independientemente de la prevalencia, la prueba diagnóstica da unos valores de RV muy adecuados que demuestran su validez ya que, generalmente, las pruebas clínicamente validadas poseen una RV+ mayor de 10 y una RV- menor de 0.1.

Por otra parte, también podemos calcular el índice de Youden:
  • Índice de Youden (YI): parámetro independiente de la prevalencia que relaciona mediante un cálculo sencillo la S y la E para comprobar la validez de las pruebas diagnósticas, siendo 1 la situación ideal. Se calcula mediante la siguiente fórmula:

En nuestro caso, el YI da un valor de 0.99, muy cercano a la idealidad, corroborando así los resultados anteriores.

Así, con todo lo observado, se considera que la prueba diagnóstica utilizada es de gran validez ya que hemos logrado calcular estadísticamente parámetros que lo corroboran. Sin embargo, hay que tener cuidado ya que se ha visto como aquellos parámetros dependientes de la prevalencia pueden inducir a error a la hora de sacar conclusiones acerca de la validez de las pruebas debido a que los datos se ven afectados por la muestra poblacional sobre la que se hace el estudio.

Comentarios