Filter by input type
Filter by category
Scientists develop model to train Artificial Intelligence through medical conversations

The Artificial Intelligence (AI), requiere entrenamiento para su aplicación, especialmente en el campo médico, la realización de entrevistas simuladas y el procesamiento de lenguaje natural (PLN), es útil para esta tarea.

Researchers published an article in Scientific Data of Nature, detailing the creation of datasets para el entrenamiento de AI a través de conversaciones médicas con un formato de Exámenes Clínico Estructurados Objetivos (OSCE, en inglés). La investigación se enfocó en casos respiratorios y su objetivo fue proporcionar un conjunto completo de datos o data set on medical talks to the medical research community.

Generalmente existen limitaciones en la investigación y aplicación de AI utilizando datos de conversaciones médicas, ya que estas requieren entrenamiento que puede interferir con la privacidad del paciente y regulaciones sobre el intercambio de datos.

De esta forma, los autores del artículo mencionado anteriormente, desarrollaron un método para la simulación de conversaciones médicas que sirve para entrenar IA aplicada en salud. Para ello un equipo de residentes en medicina interna, medicina física, patología anatómica, y medicina familiar, así como estudiantes de medicina, crearon este conjunto de datos simulando entrevistas médicas utilizando el formato OSCE.

The interviews were recorded and transcribed. More than 272 simulated conversations between doctors and patients were recorded and categorized into categories, however, most of them were simulated cases of respiratory cases.

Las transcripciones de las entrevistas son útiles para entrenar diversos modelos de PLN, para medir la precisión de las herramientas de transcripción, entre otros usos. En este sentido, el dataset presentado por esta investigación pudo corregir errores usuales en la transcripción de conversaciones médicas, en la grabación de audio, volviéndolo útil y aplicable para entrenar cualquier modelo de PLN.

“Y lo que es más importante, el acceso a datos de este calibre es un reto importante para muchos investigadores debido a la naturaleza confidencial de los datos, a las regulaciones gubernamentales que limitan el intercambio de datos en la investigación y a la cuestión de la monetización de los datos. Por lo tanto, el conjunto de datos presentado de conversaciones médicas completas en formato de audio y texto es un activo valioso para el mundo académico y la industria médica”, explican los autores.

However, one of the main limitations of this dataset is the small number of simulated cases of non-respiratory diseases. In fact, of the 272 simulated conversations, 214 corresponded to respiratory cases and the rest to cardiac, dermatological, gastrointestinal and musculoskeletal cases.

You can read the study in detail at the following link: https://www.nature.com/articles/s41597-022-01423-1

Outstanding news

Stay updated

News by country

Related Content

Secured By miniOrange