Investigación de Mount Sinai muestra que la IA puede brindar apoyo a los médicos al igualar o superar a especialistas humanos en el manejo de retina y glaucoma.
Un estudio realizado por investigadores del New York Eye and Ear Infirmary of Mount Sinai (NYEE) revela que un gran modelo de lenguaje grande (LLM, en inglés) puede igualar, o en algunos casos superar, a oftalmólogos en el diagnóstico y tratamiento de pacientes con glaucoma y enfermedades de retina. Publicado en JAMA Ophthalmology, este estudio sugiere que herramientas avanzadas de inteligencia artificial (IA), entrenadas en grandes cantidades de datos, texto e imágenes, podrían desempeñar un papel importante al brindar apoyo en la toma de decisiones a los oftalmólogos en el diagnóstico y manejo de casos de glaucoma y trastornos de retina.
El estudio tuvo como propósito comparar el conocimiento de los especialistas oftalmólogos con las capacidades de la IA, GPT-4 (Generative Pre-Training–Model 4) de OpenAI, diseñado para replicar el rendimiento a nivel humano. El estudio detalla que, dentro de la medicina, las herramientas de IA se consideran potencialmente revolucionarias en diagnóstico y tratamiento debido a la precisión e integridad de sus respuestas generadas por LLM. La oftalmología, tiene un alto volumen de pacientes a menudo con enfermedades y condiciones complejas, por lo que podría ser un campo particularmente importante para la implementación de IA, ofreciendo apoyo a los especialistas en el manejo y tratamiento.
“Reconocimos el enorme potencial de este sistema de IA desde el momento en que empezamos a probarlo y nos fascinó observar que GPT-4 podía no solo ayudar, sino en algunos casos igualar o superar, la experiencia de especialistas oftalmológicos experimentados”, explicó el Dr. Andy Huang, residente de oftalmología del NYEE y autor principal del estudio.
El equipo de Mount Sinai reclutó a 12 especialistas asistentes y tres residentes del Departamento de Oftalmología de la Escuela de Medicina Icahn de Mount Sinai. Posteriormente seleccionaron de manera aleatoria un conjunto básico de 20 preguntas (10 cada una para glaucoma y retina) de la lista de preguntas comúnmente formuladas por los pacientes de la Academia Estadounidense de Oftalmología, junto con 20 casos de pacientes sin identificar seleccionados de clínicas oftalmológicas afiliadas a Mount Sinai.
Finalmente, las respuestas tanto del sistema GPT-4 como de los especialistas humanos fueron analizadas estadísticamente y calificadas por su precisión y exhaustividad utilizando una escala Likert, comúnmente utilizada en investigación clínica para puntuar respuestas.
De esta forma, los resultados revelaron que este LLM logró superar e igualar a los especialistas humanos tanto en la precisión como en la integridad de sus consejos médicos y evaluaciones. GPT-4 mostró un rendimiento superior en respuestas a preguntas sobre glaucoma y consejos de manejo de casos, y reflejó un resultado más equilibrado en preguntas sobre retina, donde la IA logró igualar a los especialistas en precisión, pero los superó en integridad/totalidad de sus respuestas.
“La IA sorprendió especialmente por su destreza en el manejo de casos de pacientes tanto de glaucoma como de retina, igualando la precisión y exhaustividad de los diagnósticos y sugerencias de tratamiento realizados por médicos humanos en un formato de nota clínica”, afirmó Louis R. Pasquale, MD, FARVO, subdirector de Investigación Oftalmológica del Departamento de Oftalmología y autor principal del estudio. Además, agregó que GPT-4 es capaz de ofrecer orientación sobre cómo ser mejores clínicos, especialmente en términos de cómo se documentan los hallazgos de los exámenes de los pacientes.