El modelo de deep learning, TRisk, superó a otras herramientas pronósticas al predecir con mayor precisión el riesgo de muerte en personas con insuficiencia cardíaca.
Un equipo de Oxford desarrolló un modelo de inteligencia artificial (IA) capaz de predecir con mayor precisión el riesgo de muerte en personas con insuficiencia cardíaca utilizando únicamente datos clínicos rutinarios. El estudio, publicado en npj Digital Medicine, presenta TRisk, un modelo basado en arquitectura Transformer que supera a las herramientas pronósticas convencionales y demuestra su utilidad tanto en Reino Unido como en Estados Unidos. Un artículo sobre TRisk fue publicado previamente en The Lancet Digital Health en junio del año pasado.
La insuficiencia cardiaca es un síndrome complejo con evolución impredecible. Aunque existen escalas de riesgo ampliamente utilizadas, como el modelo MAGGIC, muchas dependen de estudios especializados, por ejemplo la fracción de eyección ventricular izquierda o la clasificación funcional NYHA, que no siempre están disponibles en los registros electrónicos de salud.
Además, estos modelos suelen tener una capacidad discriminativa moderada para predecir resultados a mediano plazo, es decir, de uno o tres años, un periodo clave para ajustar tratamientos, planificar intervenciones y evaluar la calidad de la atención. En muchos pacientes, la mortalidad no depende solo del corazón, sino de múltiples comorbilidades acumuladas a lo largo del tiempo.
“Los pacientes con insuficiencia cardíaca tienen trayectorias de salud complejas que los modelos de riesgo tradicionales simplemente no estaban diseñados para captar. TRisk cambia eso: utiliza la información médica que ya figura en los registros de atención rutinaria para predecir la mortalidad y otros resultados clínicos con mayor precisión que las herramientas existentes, sin necesidad de pruebas adicionales ni derivaciones a especialistas”, expresó Kazem Rahimi, profesor de Medicina Cardiovascular y Salud de la Población en Oxford.
TRisk es un modelo de aprendizaje profundo o deep learning basado en Transformers, una arquitectura originalmente diseñada para procesar lenguaje natural, pero que en este caso se adapta a secuencias clínicas. El sistema analiza la trayectoria completa del paciente antes de un punto determinado, incorporando diagnósticos, medicamentos y procedimientos registrados a lo largo del tiempo.
En el estudio, los investigadores entrenaron el modelo con datos de más de 400 mil pacientes con insuficiencia cardiaca provenientes de 1,418 consultas de atención primaria en Inglaterra. Posteriormente validaron el desempeño en un subconjunto independiente de pacientes del mismo país y, de forma externa, en una base hospitalaria de Estados Unidos.
A diferencia de modelos tradicionales que utilizan un número limitado de variables seleccionadas, TRisk procesa miles de códigos clínicos y aprende patrones complejos sin necesidad de imputar datos faltantes ni restringirse a marcadores cardiológicos específicos.
En la cohorte del Reino Unido, TRisk alcanzó un índice C de 0.845 para predecir mortalidad a 36 meses, frente a 0.728 del modelo MAGGIC adaptado a registros electrónicos. En términos prácticos, esto significa una mejor capacidad para distinguir entre pacientes con alto y bajo riesgo.
El modelo también mostró mejor desempeño en análisis por subgrupos, con menor variabilidad entre hombres y mujeres, distintos rangos de edad y perfiles clínicos, lo que sugiere menor sesgo en las predicciones.
Cuando se aplicó a datos hospitalarios de Estados Unidos mediante técnicas de transferencia de aprendizaje, TRisk mantuvo un alto rendimiento, con un índice C de 0.802. Este resultado es relevante porque demuestra que el modelo puede adaptarse a distintos sistemas de salud y prácticas clínicas.
“Lo que realmente nos entusiasmó fue que TRisk funcionó de manera consistente en diferentes grupos de pacientes, según el sexo, la edad y las características clínicas. En una época en la que nos preocupa, con razón, el sesgo algorítmico en la atención sanitaria, este modelo demuestra que podemos crear herramientas de IA que funcionen de manera equitativa”, explicó el Dr. Shishir Rao, investigador científico y director de investigación de Deep Medicine AI.
Además, en análisis de impacto clínico, TRisk redujo de manera sustancial tanto los falsos positivos como los falsos negativos en comparación con el modelo convencional, lo que podría traducirse en decisiones más acertadas sobre derivaciones, cuidados paliativos o priorización de tratamientos.
Uno de los aportes del estudio es el análisis de explicabilidad del modelo. Mediante técnicas de atribución, los investigadores identificaron qué eventos clínicos contribuían más a las predicciones.
Entre los factores más influyentes se encontraron el paro cardiaco, la insuficiencia hepática, la insuficiencia respiratoria y, de forma consistente en ambos países, distintos tipos de cáncer. Llamativamente, los diagnósticos oncológicos mantuvieron valor pronóstico incluso cuando habían ocurrido más de diez años antes del punto de evaluación.
Este hallazgo sugiere que el riesgo en insuficiencia cardiaca no depende solo del estado cardiovascular actual, sino de la historia clínica completa del paciente, incluidas enfermedades previas y sus posibles secuelas a largo plazo, como inflamación crónica o efectos cardiotóxicos de ciertos tratamientos.
Los autores plantean que TRisk podría utilizarse como herramienta de apoyo a la decisión clínica sin requerir pruebas adicionales ni aumentar la carga de trabajo. A nivel poblacional, permitiría auditar la calidad de los servicios de insuficiencia cardiaca. A nivel individual, podría ayudar a identificar pacientes que necesitan seguimiento más estrecho o intervenciones anticipadas.
No obstante, también reconocen limitaciones, ya que el modelo requiere acceso a registros electrónicos completos y no puede simplificarse fácilmente a una puntuación breve. Además, aunque mostró buena generalización internacional, su implementación en nuevos entornos requeriría validación y recalibración local.
De esta manera, el estudio muestra que los modelos basados en IA son capaces de capturar la complejidad real de los pacientes con insuficiencia cardiaca mejor que las escalas tradicionales.




