Variaciones geográficas en el resultado de los ensayos clínicos

Cómo interpretar las diferencias entre regiones o países en los resultados de los ensayos clínicos, especialmente cuando su aparición es inesperada. New England Journal of Medicine, 8 de diciembre de 2016

Cómo interpretar las diferencias entre regiones o países en los resultados de los ensayos clínicos, especialmente cuando su aparición es inesperada.

New England Journal of Medicine, 8 de diciembre de 2016

Los investigadores clínicos generalmente aceptan la premisa de que los resultados sorprendentes en subgrupos de un ensayo controlado aleatorizado (ECA) probablemente surjan por azar. Como escribimos hace casi tres décadas, "Creemos que el resultado general promedio de un ensayo clínico aleatorizado es en general una estimación más fiable del efecto del tratamiento en los distintos subgrupos examinados que los efectos observados en subgrupos individuales". Cuando escribimos estas palabras, los ensayos que incluían pacientes con marcadores genéticos o con objetivos biológicos específicos eran poco frecuentes. Hoy en día, los subgrupos que están definidos por tales criterios son, y creemos que así debe ser, analizados con el propósito de hacer inferencias específicas sobre los efectos que pueden ser exclusivos para esos grupos.

Del mismo modo, pocos ensayos en la década de 1980 eran multinacionales, pero hoy muchos lo son. Este artículo aborda la cuestión de la interpretación de la variación observada en el efecto del tratamiento entre los subgrupos que se definen por país o por región geográfica. No tratamos la variabilidad de los efectos observados de acuerdo con el sitio de ensayo individual, porque en la mayoría de los ensayos multicéntricos, el tamaño de la muestra en cada sitio es demasiado pequeño para esperar estimaciones confiables del efecto del tratamiento.

El aumento del número de ensayos multinacionales ha surgido de la constatación de que la mayoría de las estrategias de tratamiento y prevención, especialmente para las enfermedades comunes, tienen en el mejor de los casos beneficios moderados en los resultados principales (por ejemplo, una reducción del 10-25% de eventos cardíacos o cáncer recurrente). Para detectar estos beneficios moderados de manera fiable, los ensayos generalmente necesitan acumular varios cientos de miles de resultados de interés, lo que a su vez significa la inclusión de miles o incluso decenas de miles de participantes en riesgo. La inscripción de tantos participantes requiere la colaboración de muchos sitios (a menudo varios cientos) en varios países (en algunos ensayos, hasta 50). Los ensayos que involucran a participantes con enfermedades poco comunes también pueden necesitar ser realizados en muchos países, ya que el reclutamiento de una cantidad suficiente de participantes puede no ser posible en un solo país. Por lo tanto, es frecuente que muy pocos pacientes (a menudo no más de 5 o 10) sean incorporados en cada país. Incluso para las condiciones más comunes, los estudios multinacionales pueden ser necesarios si el patrocinador de la intervención que se está probando desea la aprobación de las agencias reguladoras en varios países.

Variación entre países - ¿Es real o aleatoria?

La mayoría de los ensayos involucran a participantes para quienes existe incertidumbre sobre el valor de una intervención, y que no tienen contraindicaciones. Las variaciones verdaderas en los efectos del tratamiento entre subgrupos de pacientes dentro de las poblaciones seleccionadas para un ensayo son generalmente improbables. Sin embargo, a menudo se observan efectos diferenciales aparentes (que a veces pueden ser grandes) como consecuencia de la aleatoriedad. Por lo tanto, se espera que la respuesta a la estrategia de intervención sea generalmente similar en los diferentes países. Si los diseñadores del ensayo hubieran esperado respuestas muy diferentes según el país, lo más probable es que hubieran excluido países en los que no habrían esperado que el tratamiento fuera beneficioso.

En muchos ensayos, el número de participantes que se reclutan en cada país es pequeño. Por lo tanto, uno esperaría que el efecto observado de una intervención mostrara una variación considerable sólo por azar. Por un lado, incluso cuando un tratamiento es realmente beneficioso, los ensayos en algunos países con pocos participantes son más propensos a mostrar una estimación puntual en la dirección del daño que los ensayos en países con muchos participantes; por el contrario, los tratamientos que son realmente perjudiciales pueden a veces mostrar un beneficio aparente. Por otro lado, incluso si el efecto global del tratamiento es nulo, los ensayos en algunos países mostrarán, por casualidad, resultados que apuntan fuertemente hacia el beneficio o daño.

Por lo tanto, en teoría, aunque los resultados de una intervención en ocasiones pueden diferir verdaderamente según el país, no suele esperarse esta diferencia en los resultados. Esto conduce a la pregunta: cuándo se observan variaciones ¿son tales hallazgos derivados de datos reales o no? Por ejemplo, el ensayo de intervención aleatorizado con metoprolol CR/XL en insuficiencia cardiaca congestiva (MERIT-HF) estudió el efecto sobre la mortalidad de metoprolol de liberación controlada o de liberación prolongada de una vez al día además de la terapia estándar en pacientes con insuficiencia cardíaca con una fracción de eyección reducida. El ensayo se detuvo tempranamente por recomendación de su comité de monitoreo independiente de datos y seguridad debido a una clara reducción en la mortalidad (riesgo relativo 0,66; IC95% 0,53 a 0,81) en los 3.991 pacientes estudiados. Sin embargo, en el subgrupo de Estados Unidos, cuyos datos fueron analizados por la Administración de Drogas y Alimentos, las tasas de mortalidad observadas fueron similares en los grupos de metoprolol y placebo (riesgo relativo: 1,05; IC95%: 0,71 a 1,56) en 1.071 pacientes. Por el contrario, los datos de Europa mostraron un riesgo relativo de 0,55 (IC95%, 0,43 a 0,70) en 2.920 pacientes. Aunque el valor nominal P para la diferencia entre los riesgos relativos en los Estados Unidos y Europa fue significativo (P = 0,003), no se podría aportar ninguna explicación biológica o médica de estos resultados. Desafortunadamente, este valor nominal de P tiene muy poca interpretación probabilística formal porque la prueba que compara el riesgo relativo en los Estados Unidos con el de Europa se formuló después de que se había observado una gran diferencia en el efecto.

En un análisis alternativo de los efectos regionales en MERIT-HF, Wedel et al. informaron un valor de P de 0,22 para la mortalidad por todas las causas para la interacción entre tratamiento y país. La prueba estadística que condujo a este valor de P es probablemente más válida que la prueba que compara los Estados Unidos con Europa, porque esta última comparación es una observación inesperada derivada de datos. Sin embargo, la prueba de heterogeneidad en todos los países carece de poder estadístico debido al gran número de países involucrados y al número relativamente modesto de eventos en cada uno. Por otra parte, los datos no mostraron heterogeneidad en los efectos del metoprolol sobre el resultado coprimario de la muerte o cualquier hospitalización (p = 0,70) o sobre el resultado secundario de la muerte por cualquier causa u hospitalización por empeoramiento de la insuficiencia cardíaca. Por lo tanto, la falta de beneficio sobre la mortalidad en los Estados Unidos se debe probablemente al azar, y los resultados generales del ensayo proporcionan la mejor estimación de los beneficios del metoprolol en los Estados Unidos.

--------------

Conclusiones: aunque la mayoría de las variaciones de los resultados entre los países se deben probablemente al azar, pueden ocasionalmente reflejar diferencias importantes en cuanto a los verdaderos beneficios de una intervención o sus verdaderos daños. Cuando un ensayo clínico aleatorizado muestra variaciones marcadas en los resultados entre los países, se debe buscar evidencia de apoyo para entender si los resultados observados pueden ser reales, un artefacto del análisis de diseño o la implementación del ensayo, o simplemente debido al azar.

 

El artículo completo:

Yusuf S, Wittes J. Interpreting Geographic Variations in Results of Randomized, Controlled Trials. New England Journal of Medicine. 8 de diciembre de 2016;375(23):2263-71.

Disponible en: http://bit.ly/2gsp9Qf

Compartir