El sistema, entrenado con más de 11 mil estudios de imagen cardiaca, alcanzó una precisión de 98.6% en el diagnóstico de miocardiopatía hipertrófica y superó a los modelos de AI de uso general en tareas clínicas especializadas.
Investigadores de la Cleveland Clinic y Carnegie Mellon publicaron en Nature Communications el desarrollo de CMR-CLIP, un modelo de artificial intelligence (AI) de tipo visión-lenguaje diseñado específicamente para la interpretación de resonancias magnéticas cardiovasculares (CMR, en inglés). El sistema fue entrenado con datos de más de 14,000 estudios de imagen y sus informes clínicos asociados, recopilados en una sola institución de salud entre 2008 y 2023.
La resonancia magnética cardiovascular es considerada la modalidad de referencia para el diagnóstico de diversas enfermedades cardiacas, entre ellas valvulopatías, miocardiopatías, enfermedad pericárdica y patologías de la aorta. Sin embargo, su interpretación puede tomar más de 40 minutos por estudio debido al volumen de información que genera, y su lectura especializada requiere hasta dos años de formación adicional. Esto, sumado al bajo volumen relativo de estudios de CMR comparado con otras modalidades de imagen cardíaca, ha dificultado históricamente el desarrollo de herramientas de inteligencia artificial para este campo.
A diferencia de los modelos convencionales que trabajan con pares de imagen individual y texto, CMR-CLIP trata las secuencias de imágenes de un estudio completo de CMR como si fueran un video, procesando simultáneamente distintos tipos de imagen y perspectivas del corazón que incluyen morfología, función y viabilidad del tejido miocárdico. El modelo se basa en una arquitectura de transformador espacio-temporal y fue entrenado sin necesidad de etiquetado manual de los datos, aprendiendo directamente de la relación entre las imágenes y la sección de impresión de los informes radiológicos.
En este sentido, Ding Zhao, profesor del Departamento de Ingeniería Mecánica de Carnegie Mellon e investigador principal del estudio, explicó que: “Este trabajo demuestra que los modelos de fundamento específicos de dominio pueden superar significativamente a los sistemas de inteligencia artificial de propósito general en aplicaciones clínicas especializadas. Al diseñar modelos que reflejan la estructura y complejidad de los datos de CMR, en lugar de adaptar modelos de imagen genéricos, podemos alcanzar nuevos niveles de rendimiento y utilidad clínica”.
En las pruebas de clasificación supervisada, CMR-CLIP alcanzó una precisión de 88.5% para miocardiopatía no isquémica, 88.0% para miocardiopatía isquémica, 96.2% para amiloidosis cardiaca y 98.6% para miocardiopatía hipertrófica. Al compararse directamente con lectores humanos en un conjunto de estudios con diagnóstico final confirmado, el modelo alcanzó 82.5% de precisión en el diagnóstico de amiloidosis cardiaca, frente a 77.3% de los radiólogos al considerar todas sus menciones, y 62.9% cuando solo se contabilizaron los casos en que los lectores expresaron alta confianza diagnóstica.
En las pruebas sin supervisión, es decir, sin haber sido entrenado con etiquetas específicas de enfermedad, el modelo obtuvo un área bajo la curva (AUC) promedio de 0.764 para siete hallazgos comunes en CMR, superando en 45.5% al modelo generalista de OpenAI CLIP y en 49.8% a BiomedCLIP, que es un modelo biomédico de imágenes estáticas. El sistema también demostró capacidad para recuperar estudios relevantes a partir de descripciones textuales y para generar borradores de informes clínicos estructurados.
Asimismo, el Dr. David Chen, investigador de Cleveland Clinic y coinvestigador principal del proyecto, subrayó el potencial de impacto en la atención: “La interpretación de CMR es altamente especializada y consume mucho tiempo. Sistemas como CMR-CLIP tienen el potencial de apoyar a las personas clínicas mediante el cribado automatizado y el apoyo a la interpretación, particularmente en entornos donde los lectores especializados son limitados. Estas herramientas de asistencia son fundamentales para mejorar el acceso de los pacientes a esta poderosa tecnología diagnóstica”.
Por su parte, Deborah Kwon, directora de CMR cardiaca en Cleveland Clinic y coautora del estudio, señaló que: “Este trabajo destaca una nueva dirección para la inteligencia artificial médica al mostrar cómo los datos clínicos a gran escala pueden utilizarse para entrenar modelos sin necesidad de etiquetado manual que consume mucho tiempo. Esta tecnología tiene el potencial de mejorar la eficiencia, pero también la calidad de los informes para apoyar interpretaciones más consistentes y clínicamente relevantes, además de servir como una herramienta de enseñanza importante en un campo de imagen altamente especializado y complejo”.
El equipo identificó como limitaciones del modelo el hecho de que CMR-CLIP procesa únicamente una fracción de los datos disponibles en un estudio completo de CMR, debido a restricciones computacionales en el tamaño del contexto de entrada. Los autores señalan que la incorporación futura de tipos de imagen adicionales, como mapeo paramétrico o imágenes de perfusión, podría mejorar la capacidad diagnóstica del sistema, particularmente para patologías que dependen de perspectivas anatómicas no incluidas en la versión actual.




