Investigadores de Johns Hopkins demostraron que un modelo de IA entrenado con datos de tumores artificiales funciona tan bien como modelos entrenados con datos reales.
Los datos sintéticos son una herramienta clave en la investigación médica, especialmente cuando no existen datos reales suficientes para entrenar algoritmos de inteligencia artificial (IA) para la predicción de enfermedades como el cáncer. Un equipo de investigadores de la Universidad Johns Hopkins, diseñó un método para generar conjuntos de datos de tumores hepáticos artificiales, los cuales permiten entrenar modelos de inteligencia artificial (IA) y así identificar con precisión tumores reales sin ayuda de especialistas humanos.
Este método podría solucionar el problema de la escasez de datos de alta calidad, necesaria para entrenar algoritmos de IA. La falta de datos ocurre debido al difícil proceso de identificación de tumores en exploraciones médicas, ya que suelen depender de informes patológicos. Además, para el entrenamiento de esta clase de modelos se necesitan grandes cantidades de datos, por lo que posiblemente los datos públicos disponibles no sean suficientes para esta tarea.
El equipo de Jonhs Hopkins y diversos radiólogos idearon estos métodos de creación de tumores sintéticos realista en cuatro pasos. Primero, eligieron ubicaciones para los tumores artificiales que evitaran colisiones con los vasos sanguíneos circundantes. Después, patrones de “ruido” de manera aleatoria para poder generar las texturas irregulares que se encuentran en los tumores reales y luego generaron formas que reflejaban los variados contornos de los tumores reales. Por último, simularon la tendencia de los tumores a ejercer presión sobre su entorno, cambiando su apariencia.
Según los investigadores, los tumores sintéticos resultantes son hiperrealistas y pasaron el Test Visual de Turing, de tal manera que hasta profesionales médicos suelen tener dificultades para determinar que son sintéticos o incluso confundirlos con tumores reales en un examen visual.
Posteriormente, el equipo entrenó el modelo de IA utilizando solo estos tumores sintéticos, obteniendo resultados prometedores. “Nuestro método es apasionante porque, hasta la fecha, ningún trabajo existente que utilice únicamente tumores sintéticos ha logrado un rendimiento similar o incluso comparable al de la IA entrenada en tumores reales”, expresó el miembro del equipo Qixin Hu, investigador de la Universidad de Ciencia y Tecnología de Huazhong. Además, según explicó Hu, el método puede generar de manera automática grandes cantidades de ejemplos de tumores sintéticos con diferentes tamaños.
Alan Yuille, quien dirigió al equipo, expresó que este enfoque podría utilizarse para generar conjuntos de datos y entrenar modelos para identificar cáncer en otros órganos que experimentan falta de datos de tumores. El equipo se encuentra trabajando en la investigación de técnicas avanzadas de procesamiento de imágenes para generar tumores sintéticos de hígado, panares y riñones.
“El objetivo final de este proyecto es sintetizar todo tipo de anomalías (incluidos tumores) en el cuerpo humano para utilizarlas en el desarrollo de la IA, de modo que los radiólogos no tengan que perder su valioso tiempo realizando anotaciones manuales”, afirmó Hu.