Manejo de variables continuas y modelado de asociaciones no lineales en datos de atención sanitaria: guía práctica

El manejo adecuado de las variables continuas es crucial en la investigación sanitaria, por ejemplo, en el modelado de regresión con fines descriptivos, explicativos o predictivos. Sin embargo, se suelen utilizar métodos inadecuados. Este artículo ilustra las consecuencias de la categorización, por qué asumir una relación lineal entre variables podría ser inapropiado y cómo modelar relaciones no lineales.BMJ, 16 de julio de 2025.

Las variables continuas como la edad, los parámetros vitales o las concentraciones de biomarcadores son abundantes en la investigación sanitaria. Ya sea que el objetivo de la investigación sea describir (p. ej., si la edad se asocia con la mortalidad a los seis meses tras el diagnóstico de COVID-19), explicar (p. ej., si el efecto de un nuevo fármaco contra el cáncer varía según el valor de un biomarcador continuo) o predecir (p. ej., si añadir la presión arterial al modelo mejora la precisión de la predicción del riesgo de enfermedad cardiovascular), los investigadores deben modelar adecuadamente la asociación entre las variables independientes y dependientes. 

Los investigadores se enfrentan con frecuencia a este reto, por ejemplo, al ajustar un modelo de regresión. Pero con demasiada frecuencia, los enfoques utilizados son inadecuados, incluyendo los envíos a esta revista. En este artículo, ofrecemos una visión general del estado actual del manejo de las variables continuas en la investigación sanitaria. Analizamos las desventajas de categorizar una variable continua y las posibles limitaciones de asumir una relación lineal entre las variables independientes y dependientes.

Analizamos las revisiones existentes de la práctica actual y, a continuación, describimos dos enfoques recomendados que permiten relaciones no lineales: polinomios fraccionarios y splines, con un enfoque particular en los splines cúbicos restringidos. El Recuadro 1 proporciona una lista de términos clave, y los mensajes clave se ilustran a lo largo del texto utilizando el conjunto de datos de meningitis bacteriana aguda, disponible públicamente. En él, examinamos la asociación entre los niveles de glucosa en el líquido cefalorraquídeo (LCR) y el diagnóstico de meningitis bacteriana aguda. También se hace especial hincapié en la interpretación, la presentación gráfica y la generación de informes de modelos mediante transformaciones no lineales de variables continuas. Para facilitar la adopción de un enfoque de modelado flexible, proporcionamos código en R y Stata para reproducir el caso práctico.

Puntos clave:

  • Las variables continuas (p. ej., edad, presión arterial, niveles de biomarcadores, peso al nacer) suelen analizarse en estudios de investigación en salud.
  • Al modelar la asociación entre una variable independiente continua y una variable dependiente, muchos investigadores categorizan la variable independiente o asumen (a menudo incorrectamente) una relación lineal. Estos enfoques podrían conducir a resultados erróneos.
  • Las relaciones no lineales son comunes en la naturaleza y requieren técnicas de modelado flexibles para su correcta captura.
  • Los splines y los polinomios (fraccionales) son dos herramientas ampliamente utilizadas para permitir relaciones no lineales entre variables independientes y dependientes.
  • El código de R y Stata que acompaña a este artículo facilitará el uso de splines u otras funciones para modelar relaciones no lineales en sus propios estudios de investigación en salud.

El artículo original:

Lopez-Ayala P, Riley RD, Collins GS, et al. Dealing with continuous variables and modelling non-linear associations in healthcare data: practical guide. BMJ 2025;390:e082440 

Disponible en: https://n9.cl/jhkrq

Compartir