Filter by input type
Filter by category
Investigadores de Oxford publican un conjunto de datos y un modelo de IA para mejorar la predicción de interacciones entre fármacos y proteínas

El consorcio OpenBind lanzó imágenes cristalográficas y mediciones de 699 compuestos sobre una proteína viral, con el objetivo de subsanar la escasez de datos experimentales que ha limitado el avance de la inteligencia artificial en el diseño de medicamentos.

Investigadores de Oxford, en el marco del consorcio OpenBind, publicaron un nuevo conjunto de datos experimentales y un modelo predictivo de inteligencia artificial orientados a fortalecer las bases de información disponibles para el descubrimiento de fármacos mediante AI. Los datos fueron generados mediante procesos automatizados de alta producción en el laboratorio Diamond Light Source, en Oxfordshire, y combinan química automatizada, mediciones de unión molecular y cristalografía estructurada en formatos compatibles con el machine learning.

La publicación incluye imágenes de rayos X de 699 compuestos en interacción con una proteína del virus EV-A71, con mediciones de afinidad de unión para 601 de ellos, lo que constituye uno de los conjuntos de datos públicos más extensos para un único objetivo proteico. La mayoría de los medicamentos actúan uniéndose a proteínas específicas relacionadas con enfermedades, y predecir qué moléculas se unirán y con qué intensidad es un paso central en el diseño de fármacos en etapas tempranas. Aunque la AI ha transformado áreas como la predicción de estructuras proteicas, su impacto en la predicción de interacciones fármaco-diana ha sido más limitado, en gran parte por la escasez de datos experimentales sobre esas interacciones.

“Esta primera publicación es un paso importante porque demuestra que ahora podemos generar datos estandarizados y de alta calidad a escala, diseñados específicamente para la AI en el descubrimiento de fármacos. A medida que el conjunto de datos crezca, proporcionará a los investigadores el tipo de información consistente y fiable que se necesita para mejorar el rendimiento de estos modelos”, señaló Charlotte Deane, catedrática de Bioinformática Estructural en Oxford e investigadora principal de OpenBind.

El consorcio busca subsanar las limitaciones que afectan incluso a los sistemas de AI más avanzados en biología estructural, como AlphaFold y Boltz, cuyo desempeño depende directamente de los datos con los que fueron entrenados. Al generar grandes volúmenes de datos experimentales nuevos, OpenBind aspira a que los modelos puedan ir más allá del reconocimiento de patrones en datos existentes y realizar predicciones más fiables sobre nuevos fármacos. “Los datos experimentales de alta calidad son esenciales para desarrollar modelos de AI nuevos y mejorados. A medida que el rendimiento de la AI mejora, esto a su vez ayuda a orientar futuros experimentos, contribuyendo a acelerar el descubrimiento”, indicó el Dr. Fergus Imrie, profesor asociado del Departamento de Estadística de Oxford e investigador computacional de OpenBind.

El conjunto de datos y el modelo predictivo específico para EV-A71 están disponibles de forma abierta para investigadores de todo el mundo. OpenBind fue cofundado por la Universidad de Oxford y Diamond Light Source como el primer programa dedicado a producir conjuntos de datos para el descubrimiento de fármacos a escala industrial, diseñados específicamente para AI y publicados de forma continua. Cuenta con un financiamiento de ocho millones de libras esterlinas del Departamento de Ciencia, Innovation y Tecnología del Reino Unido. El consorcio también incluye investigadores de la Universidad de Columbia, el Memorial Sloan Kettering Cancer Center y la Universidad de Washington, entre otras instituciones. Está previsto un modelo predictivo general, OpenBind v1, para finales de mayo 2026.

Outstanding news

Stay updated

News by country

Related Content

Secured By miniOrange