Investigadores en EEUU desarrollaron un método que disminuye el tiempo en extracción de datos para la creación de fármacos.
Investigadores de la Universidad de Purdue en Indiana, EEUU, han creado un sistema para la extracción de datos biomoleculares, que funciona a través de machine learning para el diseño de medicamentos.
Para la creación y desarrollo de fármacos existe un proceso en el cual una computadora debe extraer información sobre un conjunto específico de datos. Los científicos relacionados a la industria farmacéutica utilizan datos biológicos para el entrenamiento del software, y de esta forma conocer cómo reaccionaría el cuerpo humano a nuevos medicamentos.
El equipo de la Universidad de Purdue, desarrolló un nuevo software para la extracción de datos, con el objetivo de mejorar y entrenar los modelos de machine learning y así extraer de manera más efectiva en Bases de datos de proteínas (PDB).
“El problema es que puede llevar una enorme cantidad de tiempo clasificar todos los datos acumulados. El aprendizaje automático puede ayudar, pero aún necesita un marco sólido desde el cual la computadora pueda analizar rápidamente los datos para ayudar en la creación de datos seguros y efectivos”, dijo Gaurav Chopra, profesor asistente de química analítica y física en la Facultad de Ciencias de dicha universidad, sobre la importancia de PDB para el desarrollo y descubrimiento de fármacos.
La plataforma que crearon fue llamada Lemon, una biblioteca rápida de C ++ 11 con enlaces de Python que extrae datos sobre PDB en cuestión de minutos. los archivos mmCIF tradicionales en una PDB tardan casi 4 horas, sin embargo, Lemon realiza esa tarea en seis minutos utilizando un procesador de 8 núcleos.
“Las estructuras experimentales depositadas en PDB han dado lugar a varios avances para las comunidades científicas y educativas de biología estructural y computacional que ayudan a avanzar en el desarrollo de fármacos y otras áreas” explicó Jonathan Fine, miembro del equipo de Chopra en el desarrollo del software.