{"id":39905,"date":"2023-07-25T09:01:23","date_gmt":"2023-07-25T15:01:23","guid":{"rendered":"https:\/\/saluddigital.com\/?p=39905"},"modified":"2025-10-19T22:25:31","modified_gmt":"2025-10-20T04:25:31","slug":"el-verdadero-potencial-de-la-ia-para-responder-preguntas-medicas","status":"publish","type":"post","link":"https:\/\/saluddigital.com\/en\/big-data\/el-verdadero-potencial-de-la-ia-para-responder-preguntas-medicas\/","title":{"rendered":"El verdadero potencial de la IA para responder preguntas m\u00e9dicas"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"39905\" class=\"elementor elementor-39905\" data-elementor-post-type=\"post\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-6f54a727 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"6f54a727\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-255aaef3\" data-id=\"255aaef3\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-72dcbddb elementor-widget elementor-widget-heading\" data-id=\"72dcbddb\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Google public\u00f3 un estudio en Nature en el cual investigadores examinaron el potencial real de los grandes modelos de lenguaje como PaLM.<\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-50bc07f8 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"50bc07f8\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-1bd24864\" data-id=\"1bd24864\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-2ec0fac6 elementor-widget elementor-widget-text-editor\" data-id=\"2ec0fac6\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Recientemente Google public\u00f3 un estudio en <em>Nature<\/em> en el cual investigadores analizaron qu\u00e9 tan grandes pueden ser los modelos de lenguaje (LLM, en ingl\u00e9s) de inteligencia artificial (IA) generativa y cu\u00e1l es su potencial en la respuesta de preguntas m\u00e9dicas.<\/p><p>El estudio examin\u00f3 los LLMs y el potencial de sus aplicaciones cl\u00ednicas en la medicina. Para ello crearon un nuevo conjunto de datos denominado MultiMedQA que combina seis conjuntos de datos existentes de preguntas y respuestas m\u00e9dicas, que abarcan consultas profesionales, investigaciones y consultas de consumidores. Los autores propusieron un marco de evaluaci\u00f3n humana para las respuestas del modelo en varios aspectos, como veracidad, comprensi\u00f3n, razonamiento, posibles da\u00f1os y sesgos.<\/p><p>Adem\u00e1s, se evalu\u00f3 el modelo Pathways Language Model (PaLM), un LLM con 540 mil millones de par\u00e1metros, y su variante ajustada para instrucciones, Flan-PaLM2, en MultiMedQA. En este sentido, Flan-PaLM logr\u00f3 una precisi\u00f3n en cada conjunto de datos de elecci\u00f3n m\u00faltiple de MultiMedQA, superando el estado anterior en m\u00e1s del 17%. Sin embargo, la evaluaci\u00f3n humana permiti\u00f3 revelar algunas limitaciones clave.<\/p><p>De esta manera, para abordar estas limitaciones, introdujeron un enfoque llamado \u201c<em>instruction prompt tuning<\/em>\u201d, que es una forma eficiente de alinear LLMs con nuevos dominios usando ejemplos espec\u00edficos. El modelo resultante, Med-PaLM, mostr\u00f3 resultados alentadores en su rendimiento sin embargo fue inferior al de los m\u00e9dicos.<\/p><p>Asimismo, el estudio destac\u00f3 que la comprensi\u00f3n, la recuperaci\u00f3n del conocimiento y el razonamiento mejoraron con el tama\u00f1o del modelo y el ajuste de las instrucciones, lo que sugiere la utilidad potencial de los LLMs en medicina. Sin embargo, tambi\u00e9n se revelaron limitaciones en los modelos actuales, subrayando la importancia de desarrollar marcos de evaluaci\u00f3n y m\u00e9todos para crear LLMs seguros y \u00fatiles para aplicaciones cl\u00ednicas.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-48d33070 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"48d33070\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-76292cd5\" data-id=\"76292cd5\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-4149bf0b elementor-widget elementor-widget-image\" data-id=\"4149bf0b\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1200\" height=\"630\" src=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/07\/07-23-35.jpg\" class=\"attachment-full size-full wp-image-39906\" alt=\"\" srcset=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/07\/07-23-35.jpg 1200w, https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/07\/07-23-35-660x347.jpg 660w, https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/07\/07-23-35-840x441.jpg 840w, https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/07\/07-23-35-768x403.jpg 768w, https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/07\/07-23-35-18x9.jpg 18w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-1ef2b622 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"1ef2b622\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-4652409e\" data-id=\"4652409e\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-2959f9b9 elementor-widget elementor-widget-text-editor\" data-id=\"2959f9b9\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Entre las contribuciones alcanzadas a trav\u00e9s de este estudio, los autores destacaron lo siguiente:<\/p><ul><li>La primera contribuci\u00f3n clave es un enfoque para evaluar los LLMs en el contexto de preguntas m\u00e9dicas. HealthSearchQA, fue definido como un conjunto de datos de 3,173 preguntas m\u00e9dicas de consumidores com\u00fanmente buscadas. Adem\u00e1s, presentaron otros seis conjuntos de datos abiertos existentes para responder preguntas m\u00e9dicas, que abarcan ex\u00e1menes m\u00e9dicos, investigaciones m\u00e9dicas y preguntas m\u00e9dicas de consumidores. Esto permitir\u00e1 evaluar el conocimiento cl\u00ednico y las capacidades de respuesta de los LLMs.<\/li><li>La segunda contribuci\u00f3n clave fue la capacidad de demostrar un rendimiento l\u00edder en los conjuntos de datos MedQA, MedMCQA, PubMedQA y MMLU utilizando Flan-PaLM. MedQA alcanz\u00f3 una precisi\u00f3n del 67.6%; MedMCQA del 57.6%; y PubMedQA de 79%.<\/li><li>Asimismo, la introducci\u00f3n del instruction prompt tuning, como una t\u00e9cnica sencilla y eficiente para alinear LLMs con el dominio m\u00e9dico de seguridad cr\u00edtica fue otro de los logros de esta investigaci\u00f3n. Esto permite conocer las limitaciones de cada modelo en t\u00e9rminos de fundamentos cient\u00edficos en sus respuestas.<\/li><\/ul><p>Los autores concluyeron que: \u201cEl advenimiento de los modelos b\u00e1sicos y los LLM presenta una oportunidad convincente para repensar el desarrollo de la IA m\u00e9dica y hacer que su uso sea m\u00e1s f\u00e1cil, seguro y equitativo. Al mismo tiempo, la medicina es un dominio especialmente complejo para las aplicaciones de los LLM\u201d.<\/p><p>Asimismo, destacaron que su investigaci\u00f3n ofrece una visi\u00f3n de las oportunidades desaf\u00edos en la aplicaci\u00f3n de estas soluciones a la medicina. De igual manera, reconocen que este estudio tambi\u00e9n pretende generar m\u00e1s conversaciones y colaboraciones entre los actores, como pacientes, consumidores, la comunidad cient\u00edfica, legisladores y otras partes interesadas.<\/p><p>Check the full study at the following link:<\/p><p><a href=\"https:\/\/www.nature.com\/articles\/s41586-023-06291-2\">https:\/\/www.nature.com\/articles\/s41586-023-06291-2<\/a><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-4b71ae68 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"4b71ae68\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-460b30b8\" data-id=\"460b30b8\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-f2fd1e6 elementor-widget elementor-widget-toggle\" data-id=\"f2fd1e6\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"toggle.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-2541\" class=\"elementor-tab-title\" data-tab=\"1\" role=\"button\" aria-controls=\"elementor-tab-content-2541\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a class=\"elementor-toggle-title\" tabindex=\"0\"> BIBLIOGRAPHY<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-2541\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"1\" role=\"region\" aria-labelledby=\"elementor-tab-title-2541\"><p><strong>NATURE<\/strong><\/p><p><a href=\"https:\/\/www.nature.com\/articles\/s41586-023-06291-2\">https:\/\/www.nature.com\/articles\/s41586-023-06291-2<\/a><\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>Google public\u00f3 un estudio en Nature en el cual investigadores examinaron el potencial real de los grandes modelos de lenguaje como PaLM. Recientemente Google public\u00f3 un estudio en Nature en el cual investigadores analizaron qu\u00e9 tan grandes pueden ser los modelos de lenguaje (LLM, en ingl\u00e9s) de inteligencia artificial (IA) generativa y cu\u00e1l es su potencial en la respuesta de preguntas m\u00e9dicas. El estudio examin\u00f3 los LLMs y el potencial de sus aplicaciones cl\u00ednicas en la medicina. Para ello crearon un nuevo conjunto de datos denominado MultiMedQA que combina seis conjuntos de datos existentes de preguntas y respuestas m\u00e9dicas, que abarcan consultas profesionales, investigaciones y consultas de consumidores. Los autores propusieron un marco de evaluaci\u00f3n humana para las respuestas del modelo en varios aspectos, como veracidad, comprensi\u00f3n, razonamiento, posibles da\u00f1os y sesgos. Adem\u00e1s, se evalu\u00f3 el modelo Pathways Language Model (PaLM), un LLM con 540 mil millones de par\u00e1metros, y su variante ajustada para instrucciones, Flan-PaLM2, en MultiMedQA. En este sentido, Flan-PaLM logr\u00f3 una precisi\u00f3n en cada conjunto de datos de elecci\u00f3n m\u00faltiple de MultiMedQA, superando el estado anterior en m\u00e1s del 17%. Sin embargo, la evaluaci\u00f3n humana permiti\u00f3 revelar algunas limitaciones clave. De esta manera, para abordar estas limitaciones, introdujeron un enfoque llamado \u201cinstruction prompt tuning\u201d, que es una forma eficiente de alinear LLMs con nuevos dominios usando ejemplos espec\u00edficos. El modelo resultante, Med-PaLM, mostr\u00f3 resultados alentadores en su rendimiento sin embargo fue inferior al de los m\u00e9dicos. Asimismo, el estudio destac\u00f3 que la comprensi\u00f3n, la recuperaci\u00f3n del conocimiento y el razonamiento mejoraron con el tama\u00f1o del modelo y el ajuste de las instrucciones, lo que sugiere la utilidad potencial de los LLMs en medicina. Sin embargo, tambi\u00e9n se revelaron limitaciones en los modelos actuales, subrayando la importancia de desarrollar marcos de evaluaci\u00f3n y m\u00e9todos para crear LLMs seguros y \u00fatiles para aplicaciones cl\u00ednicas. Entre las contribuciones alcanzadas a trav\u00e9s de este estudio, los autores destacaron lo siguiente: La primera contribuci\u00f3n clave es un enfoque para evaluar los LLMs en el contexto de preguntas m\u00e9dicas. HealthSearchQA, fue definido como un conjunto de datos de 3,173 preguntas m\u00e9dicas de consumidores com\u00fanmente buscadas. Adem\u00e1s, presentaron otros seis conjuntos de datos abiertos existentes para responder preguntas m\u00e9dicas, que abarcan ex\u00e1menes m\u00e9dicos, investigaciones m\u00e9dicas y preguntas m\u00e9dicas de consumidores. Esto permitir\u00e1 evaluar el conocimiento cl\u00ednico y las capacidades de respuesta de los LLMs. La segunda contribuci\u00f3n clave fue la capacidad de demostrar un rendimiento l\u00edder en los conjuntos de datos MedQA, MedMCQA, PubMedQA y MMLU utilizando Flan-PaLM. MedQA alcanz\u00f3 una precisi\u00f3n del 67.6%; MedMCQA del 57.6%; y PubMedQA de 79%. Asimismo, la introducci\u00f3n del instruction prompt tuning, como una t\u00e9cnica sencilla y eficiente para alinear LLMs con el dominio m\u00e9dico de seguridad cr\u00edtica fue otro de los logros de esta investigaci\u00f3n. Esto permite conocer las limitaciones de cada modelo en t\u00e9rminos de fundamentos cient\u00edficos en sus respuestas. Los autores concluyeron que: \u201cEl advenimiento de los modelos b\u00e1sicos y los LLM presenta una oportunidad convincente para repensar el desarrollo de la IA m\u00e9dica y hacer que su uso sea m\u00e1s f\u00e1cil, seguro y equitativo. Al mismo tiempo, la medicina es un dominio especialmente complejo para las aplicaciones de los LLM\u201d. Asimismo, destacaron que su investigaci\u00f3n ofrece una visi\u00f3n de las oportunidades desaf\u00edos en la aplicaci\u00f3n de estas soluciones a la medicina. De igual manera, reconocen que este estudio tambi\u00e9n pretende generar m\u00e1s conversaciones y colaboraciones entre los actores, como pacientes, consumidores, la comunidad cient\u00edfica, legisladores y otras partes interesadas. Consulta el estudio completo en el siguiente enlace: https:\/\/www.nature.com\/articles\/s41586-023-06291-2 BIBLIOGRAF\u00cdA NATURE https:\/\/www.nature.com\/articles\/s41586-023-06291-2<\/p>","protected":false},"author":1,"featured_media":39906,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[156,160],"tags":[145],"class_list":["post-39905","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-big-data","category-noticias","tag-noticias"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/39905","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/comments?post=39905"}],"version-history":[{"count":0,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/39905\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media\/39906"}],"wp:attachment":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media?parent=39905"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/categories?post=39905"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/tags?post=39905"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}