{"id":63959,"date":"2025-10-27T09:56:25","date_gmt":"2025-10-27T15:56:25","guid":{"rendered":"https:\/\/saluddigital.com\/?p=63959"},"modified":"2025-10-27T09:59:20","modified_gmt":"2025-10-27T15:59:20","slug":"modelos-de-ia-superan-el-rendimiento-humano-promedio-en-habilidades-sociales-medicas","status":"publish","type":"post","link":"https:\/\/saluddigital.com\/en\/big-data\/modelos-de-ia-superan-el-rendimiento-humano-promedio-en-habilidades-sociales-medicas\/","title":{"rendered":"Modelos de IA superan el rendimiento humano promedio en habilidades sociales m\u00e9dicas"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"63959\" class=\"elementor elementor-63959\" data-elementor-post-type=\"post\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-1ca75c07 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"1ca75c07\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-45bc3556\" data-id=\"45bc3556\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-734da407 elementor-widget elementor-widget-heading\" data-id=\"734da407\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">El modelo de razonamiento o1 de OpenAI obtuvo una precisi\u00f3n del 97.5% en preguntas del examen de licencia m\u00e9dica de Estados Unidos, superando a estudiantes y m\u00e9dicos en evaluaci\u00f3n de comunicaci\u00f3n, \u00e9tica y profesionalismo.<\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-4f3e43a1 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"4f3e43a1\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-6d6090bf\" data-id=\"6d6090bf\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-689ecb6c elementor-widget elementor-widget-text-editor\" data-id=\"689ecb6c\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>A study published in <em>Scientific Reports<\/em> revela que los grandes modelos de lenguaje (LLM, en ingl\u00e9s), m\u00e1s recientes, especialmente aquellos dise\u00f1ados para razonar paso a paso, pueden desempe\u00f1arse mejor que los humanos en la resoluci\u00f3n de situaciones cl\u00ednicas que exigen habilidades sociales. Estas habilidades, como la comunicaci\u00f3n con pacientes, la \u00e9tica m\u00e9dica y la toma de decisiones profesionales, son clave para la pr\u00e1ctica m\u00e9dica y forman parte de los ex\u00e1menes de licencia en medicina de Estados Unidos.<\/p><p>Investigadores de la Universidad King Saud, en Arabia Saudita, compararon el desempe\u00f1o de cinco modelos de lenguaje: <strong>GPT-4, GPT-4o y o1<\/strong> de OpenAI, adem\u00e1s de <strong>Gemini 1.5 Pro<\/strong> de Google y una versi\u00f3n preliminar llamada <strong>o1-preview<\/strong>. Para ello, utilizaron 40 preguntas del banco de datos UWORLD del United States Medical Licensing Examination (USMLE), que eval\u00faan la capacidad de los aspirantes para aplicar principios \u00e9ticos y comunicativos en contextos m\u00e9dicos reales.<\/p><p>El modelo o1, basado en razonamiento encadenado, obtuvo el mejor resultado al acertar 39 de 40 preguntas (97.5%), superando el promedio de los usuarios humanos del banco UWORLD (64%). Los modelos GPT-4o y Gemini 1.5 Pro empataron en segundo lugar con un 87.5%, seguidos por o1-preview (77.5%) y GPT-4 (75%).<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-472b0232 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"472b0232\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-4b94d324\" data-id=\"4b94d324\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-7fde99a7 elementor-widget elementor-widget-image\" data-id=\"7fde99a7\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1200\" height=\"630\" src=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2025\/10\/10-25-38.jpg\" class=\"attachment-full size-full wp-image-63961\" alt=\"\" srcset=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2025\/10\/10-25-38.jpg 1200w, https:\/\/saluddigital.com\/wp-content\/uploads\/2025\/10\/10-25-38-660x347.jpg 660w, https:\/\/saluddigital.com\/wp-content\/uploads\/2025\/10\/10-25-38-840x441.jpg 840w, https:\/\/saluddigital.com\/wp-content\/uploads\/2025\/10\/10-25-38-768x403.jpg 768w, https:\/\/saluddigital.com\/wp-content\/uploads\/2025\/10\/10-25-38-18x9.jpg 18w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-6d71da06\" data-id=\"6d71da06\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-78037fdf elementor-widget elementor-widget-text-editor\" data-id=\"78037fdf\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Al analizar las categor\u00edas espec\u00edficas, o1 logr\u00f3 puntajes perfectos en \u00e9tica m\u00e9dica, seguridad del paciente y pol\u00edtica sanitaria. GPT-4o destac\u00f3 en comunicaci\u00f3n e interacci\u00f3n interpersonal, mientras que Gemini 1.5 Pro se distingui\u00f3 en \u00e1reas de pol\u00edtica y calidad del sistema de salud. Estos resultados sugieren que, aunque los modelos de IA pueden tener distintos puntos fuertes, todos superaron el desempe\u00f1o promedio de los m\u00e9dicos y estudiantes evaluados.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-1e4e02bd elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"1e4e02bd\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-e58a266\" data-id=\"e58a266\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-275cde15 elementor-widget elementor-widget-text-editor\" data-id=\"275cde15\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Seg\u00fan, los autores, se registraron diferencias en la consistencia de los modelos. Por ejemplo, mientras <strong>o1<\/strong> mantuvo respuestas firmes y coherentes, <strong>o1-preview<\/strong> cambi\u00f3 sus decisiones en un 30% de los casos tras ser cuestionado con la pregunta \u201c\u00bfEst\u00e1s seguro?\u201d, lo que redujo su puntuaci\u00f3n final. Este hallazgo muestra c\u00f3mo el razonamiento estructurado mejora la estabilidad y confianza de las respuestas.<\/p><p>El estudio destaca el creciente potencial de los modelos de lenguaje con capacidad de razonamiento para complementar la educaci\u00f3n m\u00e9dica y apoyar la formaci\u00f3n en habilidades sociales, un aspecto hist\u00f3ricamente reservado a los humanos. Los autores advierten, sin embargo, que a\u00fan deben abordarse riesgos como los sesgos culturales y la dependencia excesiva de la IA en la toma de decisiones \u00e9ticas.<\/p><p>El avance de estos sistemas marca un punto de inflexi\u00f3n en la inteligencia artificial aplicada a la medicina, al demostrar que las m\u00e1quinas pueden aprender no solo a diagnosticar, sino tambi\u00e9n a comunicarse y razonar con empat\u00eda y juicio moral.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-400b9d4c elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"400b9d4c\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-66355067\" data-id=\"66355067\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-4fa1cbf2 elementor-widget elementor-widget-toggle\" data-id=\"4fa1cbf2\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"toggle.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-1331\" class=\"elementor-tab-title\" data-tab=\"1\" role=\"button\" aria-controls=\"elementor-tab-content-1331\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a class=\"elementor-toggle-title\" tabindex=\"0\"> BIBLIOGRAPHY<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-1331\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"1\" role=\"region\" aria-labelledby=\"elementor-tab-title-1331\"><p><strong>NATURE<\/strong><\/p><p><a href=\"https:\/\/www.nature.com\/articles\/s41598-025-20496-7\">https:\/\/www.nature.com\/articles\/s41598-025-20496-7<\/a><\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>Modelos de lenguaje de IA como ChatGPT y Gemini superan el rendimiento humano promedio en habilidades sociales m\u00e9dicas.<\/p>","protected":false},"author":1,"featured_media":63961,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[156,160],"tags":[145],"class_list":["post-63959","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-big-data","category-noticias","tag-noticias"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/63959","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/comments?post=63959"}],"version-history":[{"count":0,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/63959\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media\/63961"}],"wp:attachment":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media?parent=63959"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/categories?post=63959"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/tags?post=63959"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}