Un modelo de machine learning ayuda a evaluar la penetrancia de mutaciones raras y a mejorar la precisión en medicina genética.
En genética clínica, no siempre es sencillo predecir si una persona que porta una mutación realmente desarrollará una enfermedad. Muchas veces, los estudios identifican variantes poco comunes en genes asociados a condiciones de salud, pero su impacto clínico permanece incierto. Este desafío complica la labor de médicos y pacientes al momento de tomar decisiones sobre prevención y tratamiento.
Un equipo de investigadores de Mount Sinai ha desarrollado un enfoque basado en machine learning o aprendizaje automático, que permite estimar la penetrancia de las variantes genéticas, es decir, la probabilidad de que una persona con una mutación presente la enfermedad correspondiente. Los resultados fueron publicados en Science.
Tradicionalmente, estos cálculos se han realizado con familias afectadas o grupos reducidos de pacientes, lo que limita la precisión y genera sesgos. En contraste, el nuevo modelo combina información genética con registros clínicos electrónicos de más de 1.3 millones de participantes, ofreciendo un análisis a gran escala y con mayor exactitud.
“Queríamos ir más allá de las respuestas en blanco y negro que a menudo dejan a los pacientes y a los proveedores sin saber qué significa realmente el resultado de una prueba genética”, detalló el Dr. Ron Do, autor principal del estudio y en la Facultad de Medicina Icahn de Mount Sinai. “Mediante el uso de inteligencia artificial y datos de laboratorio del mundo real, como los niveles de colesterol o los recuentos sanguíneos que ya forman parte de la mayoría de los historiales médicos, ahora podemos estimar mejor la probabilidad de que se desarrolle una enfermedad en un individuo con una variante genética específica. Es una forma mucho más matizada, escalable y accesible de apoyar la medicina de precisión, especialmente cuando se trata de hallazgos raros o ambiguos”.
Los investigadores entrenaron modelos de IA para diez enfermedades hereditarias, entre ellas: cáncer de mama familiar, enfermedad poliquística renal, cardiomiopatías, hipercolesterolemia familiar y síndrome de Lynch. Posteriormente, aplicaron los resultados a un conjunto independiente de secuencias genómicas, logrando calcular la penetrancia de 1,648 variantes raras en 31 genes asociados a enfermedades hereditarias dominantes.
El estudio expone que una puntuación más alta, cercana a 1, sugiere que una variante puede contribuir más a la enfermedad, mientras que una puntuación más baja indica un riesgo mínimo o nulo.
Los hallazgos mostraron que las variantes clasificadas previamente como patogénicas o de pérdida de función presentaron la mayor penetrancia. Asimismo, las variantes de significado incierto (VUS, en inglés) pudieron ser evaluadas con mayor claridad, ofreciendo datos sobre su riesgo real. Finalmente, la penetrancia estimada por IA se correlacionó con indicadores clínicos medibles. Por ejemplo, quienes portaban variantes altamente penetrantes en el gen de hipercolesterolemia familiar tenían en promedio 119 mg/dl más de colesterol LDL, y los portadores de variantes de poliquistosis renal mostraban un deterioro renal más acelerado.
“Aunque nuestro modelo de IA no pretende sustituir el juicio clínico, puede servir de guía importante, sobre todo cuando los resultados de las pruebas no están claros. En el futuro, los médicos podrían utilizar la puntuación de penetrancia de ML para decidir si los pacientes deben someterse a exámenes más tempranos o tomar medidas preventivas, o para evitar preocupaciones o intervenciones innecesarias si la variante es de bajo riesgo”, afirma el autor principal del estudio, el Dr. Iain S. Forrest, miembro del laboratorio del Dr. Do en la Icahn. “Si un paciente tiene una variante rara asociada al síndrome de Lynch, por ejemplo, y obtiene una puntuación alta, eso podría desencadenar un cribado precoz del cáncer, pero si el riesgo parece bajo, podrían evitarse las conclusiones precipitadas o el tratamiento excesivo”.
Los autores concluyen que el estudio plantea la posibilidad de que, en el futuro, la inteligencia artificial y los datos clínicos habituales se utilicen de manera conjunta para ofrecer información más clara, personalizada y útil a quienes reciben resultados de pruebas genéticas. La intención es que este enfoque pueda aplicarse a gran escala y sirva para tomar decisiones médicas mejor fundamentadas, facilitar la comunicación entre pacientes y especialistas y dar mayor certeza sobre el verdadero significado de la información genética.




