El sentido y la razonabilidad de los análisis de sensibilidad de los resultados de investigación
Los análisis de sensibilidad son fundamentales para evaluar la validez de las conclusiones de los ensayos. Se requiere una reflexión cuidadosa para planificarlos de antemano y comunicarlos de manera adecuada porque los datos de los ensayos pueden afectar directamente la atención al paciente, la distribución de recursos y la política de salud pública. New England Journal of Medicine, 14 de septiembre de 2024.
Los médicos y los funcionarios de salud pública toman rutinariamente decisiones basadas en evidencia que afectan la salud de los pacientes y de la población. La necesidad de un enfoque basado en principios para evaluar e interpretar la solidez de los hallazgos de las investigaciones científicas es más crítica que nunca. Los ensayos clínicos aleatorizados incorporan con frecuencia análisis de sensibilidad (para los cuales existen pautas pertinentes de la Administración de Alimentos y Medicamentos (FDA) y otros, pero persisten conceptos erróneos sobre su propósito y la comunicación adecuada de sus hallazgos. Se necesita mayor claridad, ya que los análisis de sensibilidad tienen el potencial de influir en las conclusiones de un ensayo, dar forma a su narrativa y afectar tanto a las políticas como a la práctica.
Los análisis de sensibilidad evalúan la solidez de los hallazgos de un ensayo evaluando el grado en que las decisiones y suposiciones analíticas afectan los resultados del ensayo. Deben planificarse con anticipación e incluirse en los planes de análisis estadístico (PAE). Deben diseñarse para evaluar si las opciones analíticas o los desafíos como la falta de datos influyen en las inferencias sobre el efecto del tratamiento. A veces pueden ser necesarios análisis de sensibilidad post hoc; sin embargo, su uso debe estar bien justificado (por ejemplo, por violaciones de los supuestos subyacentes al modelo primario) y minimizarse, porque introducen múltiples fuentes potenciales de sesgo, como la extracción de datos, la presentación de informes selectivos y la inflación de la tasa de error de tipo 1, y por lo tanto tienen menos credibilidad que los análisis planificados previamente.
El PAE de un ensayo requiere una especificación previa del enfoque analítico, incluidas las opciones sobre varios aspectos del análisis. Los ejemplos incluyen el uso de un modelo estadístico particular; la realización de supuestos comprobables (por ejemplo, la relación lineal entre dos variables); y la realización de supuestos no comprobables (por ejemplo, sobre la distribución de datos faltantes o censurados). Los análisis de sensibilidad examinan los efectos de realizar elecciones alternativas razonables para estos diversos aspectos del análisis. Por lo general, los supuestos sobre la especificación del modelo y la distribución de los resultados se pueden comprobar con datos observados, mientras que los supuestos sobre los datos faltantes y la censura no lo son. Los análisis de sensibilidad deben abordar estos tipos de supuestos por separado.
Por ejemplo, en un ensayo aleatorizado por conglomerados con un punto final binario, las opciones para el análisis incluyen un modelo de regresión logística de efectos mixtos con una intersección aleatoria distribuida normalmente y una regresión logística con efectos fijos para el conglomerado. Tales opciones sobre los supuestos de modelado pueden llevar a diferentes inferencias sobre los efectos del tratamiento. Los modelos utilizados con frecuencia para los datos faltantes se basan en el supuesto de falta aleatoria (MAR), que supone que la probabilidad de falta depende solo de los datos observados y no de los valores faltantes en sí. Aunque este supuesto no se puede evaluar solo con los datos observados, los análisis de sensibilidad pueden cuantificar el grado en que las inferencias sobre el efecto del tratamiento dependen de los supuestos sobre los datos faltantes. Esto se puede lograr imputando los datos faltantes a través de una gama de supuestos diferentes y luego comparando las inferencias resultantes sobre el efecto del tratamiento en los diferentes escenarios. La imputación múltiple con el uso de modelos de mezcla de patrones proporciona una forma estructurada de realizar este análisis.
Otra opción es un análisis de punto de inflexión. En este caso, los datos se vuelven a analizar bajo una serie de supuestos de datos faltantes que difieren de los utilizados para el análisis primario para identificar el umbral en el que las conclusiones cualitativas del análisis primario serían revocadas. Un punto de inflexión clínicamente improbable sugiere que la conclusión cualitativa del análisis primario es robusta a los supuestos de datos faltantes. La generación de una serie de resultados posibles a través de diferentes supuestos de datos faltantes proporciona una representación de la incertidumbre sobre las inferencias atribuibles a la falta de conocimiento sobre los datos faltantes; si la conclusión cualitativa sobre el efecto del tratamiento no cambia a lo largo de una serie de supuestos plausibles, el análisis primario puede considerarse robusto.
Hay errores comunes relacionados con los análisis de sensibilidad. Algunos tipos de análisis parecen evaluar la robustez cuando, de hecho, no lo hacen. Por ejemplo, es común analizar datos longitudinales incompletos con un ajuste de modelo de efectos aleatorios paramétricos utilizando máxima verosimilitud, que supone implícitamente MAR sin tener que imputar datos faltantes. Se esperaría que un segundo análisis con el mismo modelo pero utilizando imputación múltiple para completar los datos según MAR arroje la misma inferencia sobre el efecto del tratamiento y, por lo tanto, generalmente no constituiría un análisis de sensibilidad. De manera similar, con muestras grandes, no se esperaría que un análisis bayesiano con distribuciones previas poco informativas arroje conclusiones significativamente diferentes de las de un análisis frecuentista que utilice el mismo modelo. Presentar dichas comparaciones como análisis de sensibilidad transmitiría una falsa sensación de robustez.
[...]
Teniendo en cuenta los principios que hemos esbozado, tenemos varias recomendaciones para informar los resultados del análisis de sensibilidad. En primer lugar, se debe resumir la evaluación de la sensibilidad a las opciones y suposiciones clave en una tabla que compare los resultados del análisis primario y de cada análisis de sensibilidad. La tabla debe incluir estimaciones del efecto del tratamiento, intervalos de confianza y las suposiciones subyacentes a cada análisis.
En segundo lugar, las comparaciones de los resultados del efecto del tratamiento deben incorporar la incertidumbre estadística; comparar estimaciones puntuales por sí solas no es apropiado ni científicamente significativo. Para evaluar si las conclusiones sustanciales difieren entre los análisis primarios y de sensibilidad, los investigadores deben considerar tanto las estimaciones puntuales como los intervalos de confianza o presentar la diferencia entre los efectos del tratamiento en términos de unidades de error estándar. Aunque ninguno de los métodos representa una prueba formal para comparar los resultados de diferentes análisis, ambos son enfoques prácticos que incorporan medidas de incertidumbre. No existen reglas estrictas para determinar la solidez, pero los enfoques descritos anteriormente tienen en cuenta las medidas de incertidumbre.
En tercer lugar, los investigadores deben explicar las suposiciones realizadas con cada método y si las suposiciones comprobables están respaldadas por los datos. Tal contextualización es fundamental cuando las conclusiones de los análisis primarios y de sensibilidad difieren sustancialmente. En el caso de los supuestos comprobables, si dos modelos proporcionan conclusiones cualitativamente diferentes, debería ser posible evaluar empíricamente cuál modelo es más apropiado. Puede preferirse el modelo que haga menos supuestos y, por lo tanto, sea más flexible, aunque el análisis primario preestablecido deba informarse como tal. En el caso de los supuestos no comprobables, como los relativos a los datos faltantes, cuando los análisis de sensibilidad indican que los efectos del tratamiento pueden diferir de los del análisis primario, los autores deberían informar una serie de resultados en un conjunto de supuestos razonables y posiblemente incluir un análisis de punto de inflexión. No hay forma de determinar cuál de varios supuestos no comprobables es “mejor”; sin embargo, los análisis de sensibilidad proporcionan información importante sobre la solidez del análisis primario. La FDA ha publicado una guía sobre la implementación de un enfoque estructurado para los análisis de sensibilidad en presencia de supuestos comprobables y no comprobables.
En cuarto lugar, los investigadores deberían formular las conclusiones clave en términos de los análisis primarios y utilizar el análisis de sensibilidad para representar el grado de incertidumbre atribuible a las opciones de modelado y los supuestos no comprobables. Si se considera que las hipótesis comprobables que sustentan el análisis primario son inadecuadas, se debe informar sobre esa evaluación. Sin embargo, los autores deben evitar utilizar el análisis de sensibilidad para reemplazar los análisis primarios preespecificados o extraer conclusiones nuevas y definitivas. Todos los análisis deben informarse de manera transparente y designarse claramente (por ejemplo, primario versus de sensibilidad, planificado de antemano versus a posteriori).
Los análisis de sensibilidad son fundamentales para evaluar la validez de las conclusiones de los ensayos. Se requiere una reflexión cuidadosa para planificarlos de antemano y comunicarlos de manera adecuada porque los datos de los ensayos pueden afectar directamente la atención al paciente, la distribución de recursos y la política de salud pública. Un enfoque basado en principios para garantizar que los análisis de sensibilidad se realicen, presenten e interpreten de manera responsable promoverá la integridad científica de los ensayos y mejorará la calidad tanto del conocimiento médico como de la atención al paciente.
El artículo original:
Cheng DM, Hogan JW. The Sense and Sensibility of Sensitivity Analyses. N Engl J Med 2024;391:972-974.
Disponible en: https://n9.cl/c0l5u