Las disparidades y sesgos raciales y de género son un desafío que enfrentan los algoritmos y los modelos de lenguaje, especialmente en el sector de la salud.
La integración de Grandes Modelos de Lenguaje (LLMs, por sus siglas en inglés) como ChatGPT y GPT-4 en la atención médica abre un nuevo panorama de posibilidades transformadoras. Sin embargo, este potencial no está exento de preocupaciones. A pesar de que estos modelos prometen soporte clínico y soluciones innovadoras de atención médica, su uso conlleva un riesgo sustancial de perpetuar sesgos, lo que podría llevar a diagnósticos incorrectos y atención comprometida al paciente. Un estudio publicado en The Lancet Digital Health evaluó el potencial de GPT-4 en perpetuar sesgos negativos en la atención médica.
El estudio tuvo como objetivo indagar si GPT-4 proporciona potenciales sesgos raciales y de género que podrían impactar su aplicación en la atención médica. Utilizando la interfaz de aplicación de Azure OpenAI, los investigadores evaluaron los sesgos de GPT-4 en educación médica, razonamiento diagnóstico, generación de planes clínicos y evaluaciones de pacientes. Se utilizaron viñetas clínicas e información de investigación para medir el rendimiento y los sesgos del modelo en cuanto a presentaciones demográficas.
En este sentido, GPT-4 mostró una tendencia preocupante de estereotipar presentaciones demográficas dentro de escenarios clínicos según los autores, ya que exhibió sesgos en diagnósticos diferenciales y planificación de tratamientos. Las recomendaciones del modelo tendían a estereotipar ciertas razas, etnias y géneros, mostrando posibles asociaciones entre atributos demográficos y procedimientos costosos, así como variaciones en la percepción del paciente.
Según los autores, estos hallazgos resaltan la necesidad crítica de evaluaciones rigurosas y transparentes de sesgos de LLMs como GPT-4 antes de su implementación en entornos clínicos. Abordar posibles fuentes de sesgo y emplear estrategias de mitigación antes de la integración clínica es crucial para prevenir la inadvertida perpetuación de sesgos en la atención médica.
Este estudio destaca la urgencia de realizar evaluaciones exhaustivas de modelos de IA, especialmente en el ámbito de la salud, donde los sesgos pueden impactar gravemente en los resultados de los pacientes. Los esfuerzos para identificar y rectificar sesgos en estos modelos antes de su integración en la práctica clínica son fundamentales para fomentar una entrega de atención médica equitativa e imparcial.
Consulta el estudio completo en el siguiente enlace:
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(23)00225-X/fulltext