Investigadores desarrollan, ECG-CLIP un sistema capaz de identificar 18 afecciones cardíacas sin entrenamiento específico para cada una.
Un grupo de investigadores en Japón y Taiwán presentó un modelo de inteligencia artificial (IA) llamado ECG-CLIP, capaz de diagnosticar múltiples condiciones cardíacas a partir de un electrocardiograma (ECG) de 12 derivaciones utilizando únicamente descripciones clínicas en texto. El enfoque, publicado en npj Digital Medicine, propone una alternativa a los sistemas tradicionales, que necesitan bases de datos extensas y etiquetas específicas para cada diagnóstico.
El objetivo fue probar si un modelo basado en aprendizaje contrastivo, una técnica que vincula patrones entre dos tipos de información, podía aprender a relacionar las señales eléctricas del corazón con su correspondiente reporte clínico. Para ello, los autores entrenaron el sistema con 800,034 pares de ECG y reportes médicos extraídos del conjunto MIMIC-IV-ECG.
A diferencia de los modelos supervisados convencionales, que solo identifican las condiciones para las que fueron entrenados, ECG-CLIP puede responder a consultas en lenguaje natural y realizar diagnóstico “zero-shot”. Es decir, puede detectar una enfermedad aun cuando nunca recibió ejemplos etiquetados específicamente para esa condición.
Los resultados mostraron que el modelo tuvo alto rendimiento para arritmias, como fibrilación auricular, taquicardia sinusal o bradicardia sinusal, con áreas bajo la curva (AUROC) cercanas o superiores a 0.95. No obstante, su desempeño fue menor en anomalías morfológicas, como hipertrofia ventricular izquierda o cambios en el segmento ST-T, donde la precisión y la especificidad fueron inferiores.
La validación externa con otro conjunto de datos confirmó una consistencia alta en el orden relativo de desempeño entre condiciones, incluso en poblaciones no incluidas en el entrenamiento, como los pacientes pediátricos. Sin embargo, se observaron variaciones importantes según la edad: el rendimiento fue mejor en adultos de mediana edad y disminuyó tanto en jóvenes como en adultos mayores.
El modelo también mostró que puede confundirse en casos clínicamente complejos. Por ejemplo, la fibrilación auricular con respuesta ventricular lenta se clasificó con frecuencia como bradicardia sinusal, debido a patrones de ritmo similares.
Los autores destacan que esta tecnología podría reducir las barreras para implementar IA en cardiología, ya que elimina la necesidad de recolectar etiquetas específicas para cada diagnóstico y permite agregar nuevas condiciones mediante simple ajuste de texto. Sin embargo, reconocen las limitaciones de esta tecnología, por ejemplo, la dependencia de reportes automatizados muy estandarizados, el bajo desempeño en anomalías morfológicas y la necesidad de validación clínica prospectiva antes de cualquier uso real.
El estudio sugiere que el aprendizaje multimodal podría abrir la puerta a sistemas de diagnóstico más flexibles y escalables, aunque aún queda trabajo por hacer para garantizar su seguridad y precisión en distintos entornos clínicos.




