Es necesario mejorar los programas de detección del cáncer

Science, 10 de enero de 2020  Para muchos tipos de cáncer, no solo se desconocen los beneficios y daños comparativos de las pruebas de detección disponibles, sino que también existe una falta de consenso con respecto a la elección adecuada del intervalo de prueba y el umbral para un diagnóstico positivo.  Los “programas de aprendizaje de detección” podrían aleatorizar a los individuos participantes para comprobar resultados. Para muchos tipos de cáncer, se desconocen los beneficios y daños de las diferentes pruebas de detección, así como sus intervalos. Por lo tanto, se justifica una prueba de comparación aleatoria.

Los programas nacionales de detección del cáncer, como la mamografía para el cáncer de mama, se implementan ampliamente para reducir la incidencia y mortalidad por cáncer en países de altos ingresos. Su introducción también se está considerando en países de bajos y medianos ingresos. Para muchos tipos de cáncer, se desconocen los beneficios y los daños de las diferentes pruebas de detección y los intervalos en los que deben implementarse. Por lo tanto, se justifica la prueba de comparación aleatoria. Sin embargo, esto no es posible porque la mayoría de las personas en países de altos ingresos ya se han sometido a exámenes de detección o se han negado a realizar exámenes de detección y no son comparables (1). Existe un imperativo ético, médico, económico y social para la evaluación continua de los programas de detección de cáncer para garantizar que sus beneficios superen cualquier daño. Esto puede lograrse si los programas de detección adoptan un escenario de pruebas clínicas mediante la implementación de “programas de aprendizaje de detección”.

Cada año, ∼46 millones de personas (126.000 personas cada día) reciben pruebas de detección de cáncer en todo el mundo (2). Las pruebas de detección más utilizadas incluyen la prueba de Papanicolaou para el cáncer cervical; la prueba inmunoquímica fecal (FIT), prueba de sangre oculta en heces (FOBT), colonoscopia o sigmoidoscopia para el cáncer colorrectal; la prueba de antígeno prostático específico (PSA) para cáncer de próstata; la mamografía para el cáncer de mama; y la tomografía computarizada (CT) para el cáncer de pulmón. Los efectos de tales pruebas de detección en la incidencia y mortalidad del cáncer deben equilibrarse con sus daños, como las posibles complicaciones médicas de los procedimientos de detección y el tratamiento posterior, así como la angustia psicológica. La detección del cáncer se dirige a poblaciones enteras en lugar de pacientes individuales, y cada cáncer ocurre raramente. Por lo tanto, muchas personas se someten a pruebas sin beneficio.

Recientemente, también se ha hecho evidente que algunas pruebas de detección, como el PSA, la mamografía y la tomografía computarizada del pulmón, aumentan las tasas de incidencia de cáncer como resultado del sobrediagnóstico, es decir, la detección de cánceres y precursores de cáncer que no habrían progresado a síntomas o muerte en ausencia de detección (3). Debido a que las lesiones sobrediagnosticadas no pueden distinguirse de las lesiones que progresarán, todos los pacientes son tratados. Por lo tanto, los pacientes sobrediagnosticados solo experimentan daños y no obtienen ningún beneficio del cribado.

Para muchos tipos de cáncer, no solo se desconocen los beneficios y daños comparativos de las pruebas de detección disponibles, sino que también existe una falta de consenso con respecto a la elección adecuada del intervalo de prueba y el umbral para un diagnóstico positivo. Los programas de detección en diferentes países utilizan distintas pruebas, intervalos y umbrales. Por ejemplo, el Servicio Nacional de Salud del Reino Unido (NHS) ofrece una sigmoidoscopia de detección a los 55 años y FIT a partir de los 60 años en Inglaterra, mientras que en Escocia el NHS no ofrece sigmoidoscopia y tiene un límite superior para la positividad de la FIT que en Inglaterra (4). Ningún nuevo medicamento recetado entra en el mercado sin pruebas rigurosas en ensayos controlados aleatorios (ECA); por el contrario, se han introducido muchas pruebas y estrategias de detección del cáncer sin ensayos clínicos tan rigurosos. Para las pocas pruebas que se han evaluado en ECA, como la mamografía y la detección FOBT, los datos a menudo están desactualizados y existe controversia sobre si las pruebas son beneficiosas en los programas de detección actuales. Debido a las enormes mejoras en el tratamiento de muchos tipos de cáncer, la detección temprana a través del cribado puede no ser tan importante para lograr mejores tasas de mortalidad por cáncer hoy como lo fue hace 20 a 30 años cuando se realizaron los ensayos de cribado.
Se espera que las pruebas futuras, como paneles de marcadores genéticos para la detección del cáncer de próstata y cáncer de mama, entren pronto en los programas nacionales de detección (5). En los Estados Unidos, algunas organizaciones recomiendan un panel de marcadores de ADN fecal para el cáncer colorrectal en base a los datos de modelado de microsimulación (6) y no de ECA. Cuando el cribado es generalizado y todos están expuestos, los ECA tradicionales de las pruebas de cribado fuera de los programas nacionales de cribado no son posibles porque no hay un grupo de control para la comparación.

Un programa de aprendizaje de la detección genera de manera continua y sistemática conocimiento sobre lo que funciona, es decir, qué prueba es más efectiva para reducir la mortalidad, tiene el equilibrio óptimo entre beneficios y daños, y es más probable que sea aceptable en la población. Se requiere que las personas en los programas nacionales de detección sean aleatorizados para recibir una nueva prueba de detección, intervalo o umbral, o la opción estándar. Por lo tanto, las pruebas implican comparaciones aleatorias de miles o incluso decenas de miles de participantes con puntos finales clínicamente relevantes, como la incidencia o mortalidad por cáncer. Una vez finalizada la fase de prueba, será posible hacer estimaciones válidas de beneficios y daños. Por ejemplo, el sobrediagnóstico se puede medir en términos de la diferencia entre el número de cánceres detectados en individuos asignados al azar a una prueba de detección versus aquellos asignados al azar a otro. Entonces, la mejor prueba o método será ofrecido a todos. Cuando una nueva prueba o método esté disponible, el ciclo comienza nuevamente. Este ciclo continuo de pruebas, tratamiento y evaluación asegura que el público reciba una detección óptima del cáncer (vea la figura).

Finlandia, Noruega y Polonia han comenzado a aplicar programas de aprendizaje de la detección (7–9). El programa de detección de cáncer colorrectal finlandés se diseñó como comparación aleatoria de FOBT versus ninguna detección, utilizando a toda la población de 60 a 69 años de Finlandia (8). El programa no encontró un beneficio de mortalidad del cribado versus ningún cribado. El cribado FOBT se detuvo, y se evitó que la mitad de la población finlandesa se sometiera a una prueba de cribado ineficaz. Este año, Finlandia está comenzando nuevamente el ciclo del programa de aprendizaje de la detección para evaluar la FIT. El programa de detección de cáncer de cuello uterino de Noruega actualmente invita a las mujeres con fechas pares de nacimiento a hacerse la prueba del virus del papiloma humano (VPH, una causa de cáncer de cuello uterino) con pruebas de Papanicolaou, mientras que las mujeres nacidas en fechas impares reciben la prueba de Papanicolaou estándar. A las mujeres con pruebas negativas en los dos grupos se les ofrecen nuevas pruebas cada 5 y 3 años, respectivamente, y se las compara con la incidencia de cáncer (9). El programa de detección de cáncer colorrectal de Polonia ha comenzado a aleatorizar a las personas para realizar una detección de colonoscopia inmediata o tardía, o para no realizar ninguna evaluación, y evaluará la incidencia y mortalidad del cáncer (7).

Las actividades de los programas de aprendizaje de la detección que podrían establecerse de inmediato incluyen la evaluación del cáncer colorrectal, el cáncer cervical y las pruebas de detección del cáncer de mama. El programa de detección de cáncer colorrectal del NHS en Inglaterra ofrece detección FIT con un umbral de positividad de 20 µg de hemoglobina por gramo de heces (µg Hb / g) para una evaluación diagnóstica adicional con colonoscopia, mientras que NHS Escocia ofrece detección FIT con un umbral de positividad de 80 µg Hb / g (4). Se desconoce si la incidencia de cáncer colorrectal y las tasas de mortalidad difieren con estos umbrales y si los casos de cáncer colorrectal temprano se están perdiendo en Escocia (10). Un programa de aprendizaje de la detección podría aleatorizar a los individuos a los dos umbrales. Después de 10 años de seguimiento, los datos del programa establecerán los umbrales óptimos para la reducción de la incidencia y mortalidad por cáncer colorrectal, así como también para los daños y las cargas (por ejemplo, número de falsos positivos, carga de pruebas adicionales por colonoscopia y efectos secundarios de más pruebas, como perforaciones de colon o hemorragia), y podrían establecerse e implementarse para todos. Luego, el programa podría continuar y, por ejemplo, las mujeres podrían asignarse al azar a la colonoscopia versus FIT, porque hay pruebas de ECA de que las mujeres tienen menos beneficios de la FIT y la detección de sigmoidoscopia para reducir el riesgo de cáncer colorrectal (11).
El programa de detección de cáncer de cuello uterino en Noruega podría ampliarse a un verdadero programa de aprendizaje de detección (con ciclos continuos de prueba) al aleatorizar a las mujeres con citología negativa para el VPH a un intervalo de detección de 10 años en el próximo ciclo de prueba. Además, las mujeres vacunadas contra el VPH podrían asignarse al azar a la prueba de Papanicolaou, tal vez cada 10 años versus cada 15 años, porque no se sabe con qué frecuencia deben someterse a las mujeres vacunadas contra el VPH, si es que lo hacen (12). En un programa aprendizaje de detección, es posible averiguarlo.

Si bien las pruebas de mamografía obtuvieron una reducción de la mortalidad por cáncer de mama en ECA realizados hace 30 años, las mejoras recientes en la terapia y la atención pueden haber reducido este efecto (13). El equilibrio de beneficios y daños de la detección del cáncer es delicado y puede cambiar con una mejor calidad del servicio clínico y un mejor tratamiento y diagnóstico del cáncer (13). En un programa de aprendizaje de detección, las mujeres podrían asignarse al azar a una prueba de mamografía que se ofrece actualmente (cada 1 a 3 años) o a una prueba de detección, por ejemplo, cada 5 años. Si el cribado cada 5 años es tan eficaz para reducir la mortalidad y también reduce el sobrediagnóstico, entonces el cribado cada 1 a 3 años podría eliminarse gradualmente aleatorizando a las mujeres a cribado cada 5 años o a intervalos más largos, o incluso a ningún cribado.

Hay importantes desafíos a considerar para los programas de aprendizaje de detección: todas las personas en estos programas deben estar informadas sobre las comparaciones aleatorias. La información debe incluir descripciones de la incertidumbre de las pruebas y estrategias actuales, y estimaciones de nuevas pruebas y estrategias que se prueban. La información debe ser fácilmente accesible sin sobrevender y promover la nueva prueba. Las personas elegibles deben tener la oportunidad de dar su consentimiento para las pruebas y la evaluación. Se puede considerar la opción de no participar para facilitar la necesidad de evaluar a un gran número de personas. La oportunidad de dar su consentimiento también significa que las personas que no desean participar (es decir, no dan su consentimiento) necesitan una opción de detección alternativa, la prueba de detección estándar. Por lo tanto, el programa de detección será similar a cualquier ECA con un consentimiento previo a la aleatorización. También se debe proporcionar una supervisión ética independiente, como ocurre con los ensayos clínicos para la terapéutica. La detección ha sido fuertemente defendida y muchas personas sobrestiman el efecto de la detección. Por lo tanto, una revisión independiente debe centrarse en la capacidad del individuo para dar su consentimiento informado y puede requerir evidencia de que los individuos estén informados adecuadamente.

Las pruebas aleatorias en los programas de aprendizaje de detección requieren la aplicación de diferentes metodologías de prueba según la configuración y la viabilidad. Por ejemplo, los ensayos aleatorios grupales pueden ser aplicables cuando la aleatorización individual se considera difícil de implementar. Los ensayos aleatorios por conglomerados de cuña escalonada, donde se implementan nuevas intervenciones en un orden aleatorio entre los conglomerados, pueden facilitar la implementación de programas de detección de aprendizaje, porque este diseño combina la implementación deseada de nuevas pruebas y estrategias con la ventaja de la comparación aleatoria. También se pueden considerar ensayos clínicos de plataforma que combinen múltiples estrategias nuevas con un grupo conjunto de atención estándar.

Los programas de aprendizaje de detección necesitan nuevos mecanismos de financiación porque operan entre la salud pública y la investigación. Idealmente, la financiación debe ser a través de programas de salud pública en lugar de presupuestos de investigación. La aleatorización no aumenta los costes de los programas de detección convencionales que ya funcionan. Los programas de aprendizaje de detección también pueden ser aplicables a otras áreas de la salud pública y la práctica clínica, como la evaluación diagnóstica de enfermedades; por ejemplo, las técnicas de radiología y endoscopia podrían compararse para el diagnóstico de enfermedad inflamatoria intestinal.

La división tradicional entre los ensayos clínicos y la detección de enfermedades se ha convertido en un obstáculo para los programas de detección basados en evidencia. El establecimiento de programas de detección de aprendizaje puede proporcionar evidencia de alta calidad para estrategias de detección con la relación beneficio / daño más favorable.

el artículo
Mette Kalager, Michael Bretthauer Improving cancer screening programs
Science  10 Jan 2020: Vol. 367, Issue 6474, pp. 143-144
DOI: 10.1126/science.aay3156
disponible en  http://bit.ly/2uSFA5h

Compartir