Evaluación de referencia de los modelos de lenguaje grande de DeepSeek en la toma de decisiones clínicas

Nuestro estudio demuestra que los modelos de lenguaje amplio (LLM) de código abierto pueden proporcionar una vía escalable para el entrenamiento seguro de modelos, lo que permite aplicaciones médicas reales que cumplen con las normativas de privacidad de datos y atención sanitaria. Nature Medicine, 23 de abril de 2025

Los "Large Languages Models" (LLM, que se traduce al español como modelos "extensos", "amplios" o "grandes" de lenguaje) están transformando cada vez más las aplicaciones médicas. Sin embargo, los modelos propietarios, como GPT-4o, enfrentan importantes barreras para su adopción clínica, ya que no pueden implementarse in situ en instituciones sanitarias, lo que los hace incompatibles con las estrictas normativas de privacidad. Los avances recientes en LLM de código abierto, como los modelos DeepSeek, ofrecen una alternativa prometedora, ya que permiten un ajuste preciso y eficiente de los datos locales en hospitales con infraestructura de TI avanzada. Para demostrar la utilidad clínica de DeepSeek-V3 y DeepSeek-R1, comparamos su rendimiento en tareas de apoyo a la toma de decisiones clínicas con el de modelos propietarios, incluyendo GPT-4o y Gemini-2.0 Flash Thinking Experimental. Utilizando 125 casos de pacientes con suficiente potencia estadística, que abarcan una amplia gama de enfermedades frecuentes y raras, observamos que los modelos DeepSeek tienen un rendimiento igual de bueno, e incluso superior, que los LLM propietarios. Nuestro estudio demuestra que los modelos de lenguaje amplio(LLM) de código abierto pueden proporcionar una vía escalable para el entrenamiento seguro de modelos, lo que permite aplicaciones médicas reales que cumplen con las normativas de privacidad de datos y atención sanitaria.

El trabajo

Sandmann, S., Hegselmann, S., Fujarski, M. et al. Benchmark evaluation of DeepSeek large language models in clinical decision-making. Nat Med (2025). DOI: 10.1038/s41591-025-03727-2

Disponible en: https://n9.cl/ji9yl5

Compartir