Falta de rigor metodológico y cobertura limitada de la inteligencia artificial generativa en las directrices existentes para la presentación de informes sobre inteligencia artificial
Las guías actuales de informes de inteligencia artificial (IA) en medicina presentan un rigor metodológico deficiente, redundancia y una cobertura insuficiente de las aplicaciones de la IA general. Las guías futuras y actualizadas deberían priorizar los procesos de desarrollo estandarizados, la colaboración multidisciplinaria y un mayor enfoque en tecnologías de IA emergentes, como los modelos de lenguaje grande (LLM). J Clin Epidemiol ,julio de 2025
Objetivos: Este estudio tuvo como objetivo mapear sistemáticamente los métodos de desarrollo, el alcance y las limitaciones de las pautas de informes de inteligencia artificial (IA) existentes en medicina y explorar su aplicabilidad a las herramientas de IA generativa (GAI), como los modelos de lenguaje grande (LLM).
Diseño y contexto del estudio: Se realizó una revisión exploratoria siguiendo la extensión "Ítems de Informe Preferidos para Revisiones Sistemáticas y Metaanálisis" para Revisiones Exploratorias. Se realizaron búsquedas en cinco fuentes de información, incluyendo MEDLINE (vía PubMed), la Red para la Mejora de la Calidad y la Transparencia de la Investigación en Salud (EQUATOR), la Infraestructura Nacional del Conocimiento de China, FAIRsharing y Google Académico, desde su inicio hasta el 31 de diciembre de 2024. Dos revisores, de forma independiente, revisaron los registros y extrajeron los datos utilizando una plantilla predefinida de Excel. Los datos incluyeron características de las guías (p. ej., métodos de desarrollo, público objetivo, dominio de IA), cumplimiento de las recomendaciones de la Red EQUATOR y metodologías de consenso. Un tercer revisor resolvió las discrepancias.
Resultados: Se incluyeron sesenta y ocho guías de informes de IA; el 48,5 % se centró en la IA general, mientras que solo el 7,4 % abordó la IA general/LLM. El rigor metodológico fue limitado; el 39,7 % describió los procesos de desarrollo, el 42,6 % involucró a expertos multidisciplinarios y el 33,8 % siguió las recomendaciones de EQUATOR. Existió una superposición significativa, especialmente en imágenes médicas (20,6 % de las guías). Las guías específicas para la IA general (14,7 %) carecieron de cobertura integral y transparencia metodológica.
Conclusión: Las guías actuales de informes de inteligencia artificial (IA) en medicina presentan un rigor metodológico deficiente, redundancia y una cobertura insuficiente de las aplicaciones de la IA general. Las guías futuras y actualizadas deberían priorizar los procesos de desarrollo estandarizados, la colaboración multidisciplinaria y un mayor enfoque en tecnologías de IA emergentes, como los modelos de lenguaje grande (LLM).
La revisión
Luo X, Wang B, Shi Q, Wang Z, Lai H, Liu H, Qin Y, Chen F, Song X, Ge L, Zhang L, Bian Z, Chen Y; ADVANCED working group. Lack of methodological rigor and limited coverage of generative artificial intelligence in existing artificial intelligence reporting guidelines: a scoping review. J Clin Epidemiol. 2025 Jul 18;186:111903. doi: 10.1016/j.jclinepi.2025.111903.
Disponible en: https://n9.cl/1ne2zc