{"id":44886,"date":"2024-05-06T09:32:06","date_gmt":"2024-05-06T15:32:06","guid":{"rendered":"https:\/\/saluddigital.com\/?p=44886"},"modified":"2025-10-18T21:41:38","modified_gmt":"2025-10-19T03:41:38","slug":"investigadores-evaluan-el-rendimiento-academico-de-gpt-4","status":"publish","type":"post","link":"https:\/\/saluddigital.com\/en\/noticias\/investigadores-evaluan-el-rendimiento-academico-de-gpt-4\/","title":{"rendered":"Investigadores eval\u00faan el rendimiento acad\u00e9mico de GPT-4"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"44886\" class=\"elementor elementor-44886\" data-elementor-post-type=\"post\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-275a9027 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"275a9027\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-3a8906f0\" data-id=\"3a8906f0\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-34b0be49 elementor-widget elementor-widget-heading\" data-id=\"34b0be49\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Un estudio de la Universidad de Florida mostr\u00f3 que GPT-4 tuvo un rendimiento mejor que el promedio de estudiantes en siete de nueve ex\u00e1menes de ciencias biom\u00e9dicas.<\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-b9a3c72 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"b9a3c72\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-63f1488d\" data-id=\"63f1488d\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-61e4a35b elementor-widget elementor-widget-text-editor\" data-id=\"61e4a35b\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p class=\"p1\">Un <a href=\"https:\/\/www.nature.com\/articles\/s41598-024-55568-7\"><span class=\"s1\">study<\/span><\/a> published in <i>Scientific Reports<\/i> por investigadores de la Universidad de Florida (UF) evalu\u00f3 el desempe\u00f1o de GPT-4 el modelo de lenguaje (LLM, en ingl\u00e9s) que impulsa ChatGPT, uno de los chatbots m\u00e1s conocidos, en ex\u00e1menes de posgrado en ciencias biom\u00e9dicas.<\/p><p class=\"p1\">GPT-4 ha tenido un buen desempe\u00f1o en ex\u00e1menes estandarizados de opci\u00f3n m\u00faltiple, no obstante, los investigadores explican que es necesaria una evaluaci\u00f3n adicional de la confiabilidad y precisi\u00f3n de las respuestas del chatbot en varios dominios de conocimiento antes de utilizarlo como un recurso de referencia.<\/p><p class=\"p1\">El estudio evalu\u00f3 el desempe\u00f1o de GPT-4 en nueve ex\u00e1menes de posgrado en ciencias biom\u00e9dicas, y los resultaron mostraron que los puntajes del GPT-4 superaron el promedio de los estudiantes en siete de nueve casos y superaron todos los puntajes de los estudiantes en cuatro ex\u00e1menes.<\/p><p class=\"p1\"><br \/>Asimismo, GPT-4 tuvo un gran desempe\u00f1o en preguntas para completar espacios en blanco, de respuesta corta y de ensayo, y respondi\u00f3 correctamente a varias preguntas sobre figuras extra\u00eddas de manuscritos publicados. No obstante, obtuvo malos resultados en preguntas con figuras que contienen datos simulados y aquellas que requieren una respuesta dibujada a mano.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-45be5400 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"45be5400\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-43cffaaf\" data-id=\"43cffaaf\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-624bf967 elementor-widget elementor-widget-text-editor\" data-id=\"624bf967\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p class=\"p1\">Adem\u00e1s, dos conjuntos de respuestas de GPT-4 se marcaron como plagio de acuerdo con la similitud de las respuestas y algunas respuestas modelo inclu\u00edan \u201calucinaciones\u201d detalladas o desvar\u00edos claros en las respuestas, es decir que gener\u00f3 datos ficticios. Los investigadores, tambi\u00e9n analizaron patrones y limitaciones en las capacidades de GPT-4 con el objetivo de informar el dise\u00f1o de futuros ex\u00e1menes acad\u00e9micos en la era de los chatbots.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-5bf05ff7\" data-id=\"5bf05ff7\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-3b0536da elementor-widget elementor-widget-image\" data-id=\"3b0536da\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1200\" height=\"630\" src=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/05\/05-24-05.jpg\" class=\"attachment-full size-full wp-image-44888\" alt=\"\" srcset=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/05\/05-24-05.jpg 1200w, https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/05\/05-24-05-660x347.jpg 660w, https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/05\/05-24-05-840x441.jpg 840w, https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/05\/05-24-05-768x403.jpg 768w, https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/05\/05-24-05-18x9.jpg 18w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-788dfec1 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"788dfec1\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-4f8add1b\" data-id=\"4f8add1b\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-633b9dd0 elementor-widget elementor-widget-text-editor\" data-id=\"633b9dd0\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p class=\"p1\">\u201cAunque las respuestas sobre temas de nivel experto tuvieron una precisi\u00f3n muy alta en promedio, no recomendar\u00edamos confiar todav\u00eda en ChatGPT\/GPT-4 para proporcionar informaci\u00f3n precisa como \u00fanico recurso\u201d, explic\u00f3 el autor principal Daniel Stribling, de Facultad de Medicina de la UF.<\/p><p class=\"p1\">El estudio mostr\u00f3 que GPT-4 cuenta con una capacidad excepcional para responder preguntas de nivel experto en disciplinas de ciencias biom\u00e9dicas sin ning\u00fan entrenamiento previo. \u201cDe manera similar a la llegada de la imprenta, en la era de los chatbots es posible que necesitemos adaptar nuestros paradigmas a estas nuevas tecnolog\u00edas y evaluar cr\u00edticamente si ahora existe una frontera distinguible entre &#8216;herramienta de edici\u00f3n&#8217; y &#8216;coautor&#8217;, lo que tendr\u00e1 implicaciones significativas en las evaluaciones educativas en el futuro\u201d, dijo Stribling.<\/p><p class=\"p1\">Finalmente, el estudio destaca la importancia de debates abiertos acerca del uso apropiado de estas herramientas emergentes en la ciencia y en la educaci\u00f3n. Esta clase de modelos tienen el potencial de convertirse en herramientas de consulta sobre cualquier tipo de informaci\u00f3n, sin embargo, aunque la mayor\u00eda de la informaci\u00f3n que genere el chatbot ser\u00e1 fiable, es posible que genere tambi\u00e9n informaci\u00f3n incorrecta y la presente de manera convincente. Por ello es necesario validarse sus capacidades y confiablidad antes de su adopci\u00f3n generalizada en la academia.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-56b008a6 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"56b008a6\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-7e876797\" data-id=\"7e876797\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-9ed2474 elementor-widget elementor-widget-toggle\" data-id=\"9ed2474\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"toggle.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-1661\" class=\"elementor-tab-title\" data-tab=\"1\" role=\"button\" aria-controls=\"elementor-tab-content-1661\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a class=\"elementor-toggle-title\" tabindex=\"0\"> BIBLIOGRAPHY<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-1661\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"1\" role=\"region\" aria-labelledby=\"elementor-tab-title-1661\"><p class=\"p1\"><b>NATURE<\/b><\/p><p class=\"p2\"><span class=\"s1\"><a href=\"https:\/\/doi.org\/10.1038\/s41598-024-55568-7\">https:\/\/doi.org\/10.1038\/s41598-024-55568-7<\/a><\/span><\/p><p class=\"p1\"><b>UF HEALTH<\/b><\/p><p class=\"p2\"><span class=\"s1\"><a href=\"https:\/\/ufhealth.org\/news\/2024\/uf-researchers-evaluate-academic-performance-of-chatbots\">https:\/\/ufhealth.org\/news\/2024\/uf-researchers-evaluate-academic-performance-of-chatbots<\/a><\/span><\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>Un estudio de la Universidad de Florida mostr\u00f3 que GPT-4 tuvo un rendimiento mejor que el promedio de estudiantes en siete de nueve ex\u00e1menes de ciencias biom\u00e9dicas. Un estudio publicado en Scientific Reports por investigadores de la Universidad de Florida (UF) evalu\u00f3 el desempe\u00f1o de GPT-4 el modelo de lenguaje (LLM, en ingl\u00e9s) que impulsa ChatGPT, uno de los chatbots m\u00e1s conocidos, en ex\u00e1menes de posgrado en ciencias biom\u00e9dicas. GPT-4 ha tenido un buen desempe\u00f1o en ex\u00e1menes estandarizados de opci\u00f3n m\u00faltiple, no obstante, los investigadores explican que es necesaria una evaluaci\u00f3n adicional de la confiabilidad y precisi\u00f3n de las respuestas del chatbot en varios dominios de conocimiento antes de utilizarlo como un recurso de referencia. El estudio evalu\u00f3 el desempe\u00f1o de GPT-4 en nueve ex\u00e1menes de posgrado en ciencias biom\u00e9dicas, y los resultaron mostraron que los puntajes del GPT-4 superaron el promedio de los estudiantes en siete de nueve casos y superaron todos los puntajes de los estudiantes en cuatro ex\u00e1menes. Asimismo, GPT-4 tuvo un gran desempe\u00f1o en preguntas para completar espacios en blanco, de respuesta corta y de ensayo, y respondi\u00f3 correctamente a varias preguntas sobre figuras extra\u00eddas de manuscritos publicados. No obstante, obtuvo malos resultados en preguntas con figuras que contienen datos simulados y aquellas que requieren una respuesta dibujada a mano. Adem\u00e1s, dos conjuntos de respuestas de GPT-4 se marcaron como plagio de acuerdo con la similitud de las respuestas y algunas respuestas modelo inclu\u00edan \u201calucinaciones\u201d detalladas o desvar\u00edos claros en las respuestas, es decir que gener\u00f3 datos ficticios. Los investigadores, tambi\u00e9n analizaron patrones y limitaciones en las capacidades de GPT-4 con el objetivo de informar el dise\u00f1o de futuros ex\u00e1menes acad\u00e9micos en la era de los chatbots. \u201cAunque las respuestas sobre temas de nivel experto tuvieron una precisi\u00f3n muy alta en promedio, no recomendar\u00edamos confiar todav\u00eda en ChatGPT\/GPT-4 para proporcionar informaci\u00f3n precisa como \u00fanico recurso\u201d, explic\u00f3 el autor principal Daniel Stribling, de Facultad de Medicina de la UF. El estudio mostr\u00f3 que GPT-4 cuenta con una capacidad excepcional para responder preguntas de nivel experto en disciplinas de ciencias biom\u00e9dicas sin ning\u00fan entrenamiento previo. \u201cDe manera similar a la llegada de la imprenta, en la era de los chatbots es posible que necesitemos adaptar nuestros paradigmas a estas nuevas tecnolog\u00edas y evaluar cr\u00edticamente si ahora existe una frontera distinguible entre &#8216;herramienta de edici\u00f3n&#8217; y &#8216;coautor&#8217;, lo que tendr\u00e1 implicaciones significativas en las evaluaciones educativas en el futuro\u201d, dijo Stribling. Finalmente, el estudio destaca la importancia de debates abiertos acerca del uso apropiado de estas herramientas emergentes en la ciencia y en la educaci\u00f3n. Esta clase de modelos tienen el potencial de convertirse en herramientas de consulta sobre cualquier tipo de informaci\u00f3n, sin embargo, aunque la mayor\u00eda de la informaci\u00f3n que genere el chatbot ser\u00e1 fiable, es posible que genere tambi\u00e9n informaci\u00f3n incorrecta y la presente de manera convincente. Por ello es necesario validarse sus capacidades y confiablidad antes de su adopci\u00f3n generalizada en la academia. BIBLIOGRAF\u00cdA NATURE https:\/\/doi.org\/10.1038\/s41598-024-55568-7 UF HEALTH https:\/\/ufhealth.org\/news\/2024\/uf-researchers-evaluate-academic-performance-of-chatbots<\/p>","protected":false},"author":1,"featured_media":44888,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[160,3396],"tags":[145],"class_list":["post-44886","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-noticias","category-uso-de-plataformas-digitales","tag-noticias"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/44886","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/comments?post=44886"}],"version-history":[{"count":0,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/44886\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media\/44888"}],"wp:attachment":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media?parent=44886"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/categories?post=44886"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/tags?post=44886"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}