La herramienta busca ampliar los conjuntos de datos para entrenar algoritmos en radiología, reducir sesgos y garantizar mayor precisión en la detección de enfermedades.
Un equipo de investigadores de la Universidad de Stanford, liderado por Curtis Langlotz y Akshay Chaudhari, ha creado RoentGen, un modelo de inteligencia artificial (IA) capaz de generar radiografías sintéticas a partir de descripciones médicas. La iniciativa busca responder a uno de los grandes retos de la investigación en salud como lo es la falta de bases de datos amplias y diversas que permitan entrenar con precisión a los sistemas de IA en el diagnóstico de enfermedades.
La idea surgió al observar cómo modelos generativos como DALL E o Stable Diffusion podían crear imágenes a partir de texto. El reto fue adaptar esta tecnología para producir radiografías con fidelidad clínica. Al inicio, los resultados parecían caricaturas de un tórax, pero tras un proceso de ajuste, los investigadores lograron que el sistema generara imágenes realistas. “Hay una gran brecha en el aprendizaje automático en medicina: no tenemos suficientes datos, especialmente de enfermedades poco comunes. Los datos sintéticos pueden ser una pieza clave de ese rompecabezas”, señaló Langlotz.
El modelo se basa en un proceso de “ruido” y “des-ruido” que permite, a partir de patrones preestablecidos y descripciones en informes médicos, recrear imágenes que imitan las radiografías reales. Chaudhari explicó: “Uno de los mayores desafíos en la investigación de IA radiológica es que no solemos contar con conjuntos de datos lo suficientemente grandes. Con RoentGen podemos generar imágenes sintéticas de alta calidad que representen, por ejemplo, cómo luciría un paciente con neumonía o con cardiomegalia”.
El potencial de la herramienta va más allá de suplir la falta de datos, por ejemplo, RoentGen podría reducir sesgos al generar imágenes de subgrupos poco representados, además de mejorar la privacidad de los pacientes al prescindir de datos sensibles. En su versión más reciente, incluso es posible condicionar las imágenes según la edad, el sexo o la raza del paciente para enriquecer los conjuntos de datos y entrenar algoritmos más inclusivos.
Langlotz destacó que el objetivo final es apoyar a los radiólogos: “La finalidad de RoentGen es producir datos adicionales que permitan entrenar sistemas de IA que ayuden a los médicos a identificar enfermedades más pronto y con mayor precisión”. Los investigadores también subrayan la importancia de que el proyecto sea de código abierto, lo que permitirá que otras instituciones en el mundo accedan a la herramienta. “No queremos que nuestros modelos se usen solo en Stanford. Queremos que beneficien a pacientes en todo el mundo”, enfatizó Chaudhari.
Con RoentGen, se busca abrir la puerta a los entrenamientos de sistemas más precisos, diversos y responsables, ofreciendo una alternativa para enfrentar la escasez de datos médicos y acelerando la innovación en la radiología. Para los investigadores, se trata de un paso clave hacia un futuro donde la IA y la medicina trabajen de manera conjunta para brindar diagnósticos más tempranos y mejorar la atención de los pacientes.




