{"id":40580,"date":"2023-08-31T09:42:43","date_gmt":"2023-08-31T15:42:43","guid":{"rendered":"https:\/\/saluddigital.com\/?p=40580"},"modified":"2025-10-19T00:44:36","modified_gmt":"2025-10-19T06:44:36","slug":"las-capacidades-y-limitaciones-de-los-grandes-modelos-de-lenguaje-en-el-resumen-de-evidencia-clinica","status":"publish","type":"post","link":"https:\/\/saluddigital.com\/en\/noticias\/las-capacidades-y-limitaciones-de-los-grandes-modelos-de-lenguaje-en-el-resumen-de-evidencia-clinica\/","title":{"rendered":"Las capacidades y limitaciones de los grandes modelos de lenguaje en el resumen de evidencia cl\u00ednica"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"40580\" class=\"elementor elementor-40580\" data-elementor-post-type=\"post\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-718850f0 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"718850f0\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-1c454f5f\" data-id=\"1c454f5f\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-4f425c89 elementor-widget elementor-widget-heading\" data-id=\"4f425c89\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Un estudio compar\u00f3 los res\u00famenes de evidencia cl\u00ednica generados por humanos con res\u00famenes generados por ChatGPT.<\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-12d2a6be elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"12d2a6be\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-c328861\" data-id=\"c328861\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-acaf52a elementor-widget elementor-widget-text-editor\" data-id=\"acaf52a\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Los grandes modelos de lenguaje (LLM, en ingl\u00e9s) han demostrado un gran avance en tiempos recientes. Los LLM, han emergido como una tecnolog\u00eda revolucionaria en el campo de la inteligencia artificial (IA) y el procesamiento del lenguaje natural (PLN). Estos modelos representan una nueva generaci\u00f3n de herramientas que son capaces de entender y generar lenguaje humano con un alto nivel de precisi\u00f3n y coherencia.<\/p><p>Este tipo de modelos a menudo son utilizados para realizar res\u00famenes de textos, sin embargo, tambi\u00e9n existen LLM pre entrenados que realizan ese tipo de tareas. En este sentido, los LLM pueden aplicarse al campo m\u00e9dico y cl\u00ednico, especialmente para reducir tiempos en el resumen de informaci\u00f3n y evidencia m\u00e9dica. Un estudio reciente realiz\u00f3 un an\u00e1lisis de uno de los LLM m\u00e1s populares, como lo es GPT-3.5, en la realizaci\u00f3n de res\u00famenes de evidencia m\u00e9dica en dominios cl\u00ednicos.<\/p><p>En el art\u00edculo publicado en <em>npj Digital Medicine journal<\/em>, los autores llevaron a cabo evaluaciones autom\u00e1ticas y humanas para analizar la calidad de los res\u00famenes generados por ChatGPT en diferentes aspectos. Adem\u00e1s, encontraron que las m\u00e9tricas autom\u00e1ticas no siempre coinciden con la calidad real de los res\u00famenes e identificaron tipos de errores en los res\u00famenes m\u00e9dicos generados por LLM, como inconsistencias objetivas y declaraciones enga\u00f1osas o inciertas.<\/p><p>Estos hallazgos destacan la posibilidad de que los LLM generen informaci\u00f3n incorrecta o imprecisa. De igual forma identificaron que los LLM tienen dificultades para identificar informaci\u00f3n relevante y pueden cometer m\u00e1s errores al resumir textos m\u00e1s largos.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-72fc6a90 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"72fc6a90\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-512009ae\" data-id=\"512009ae\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-5a7559f7 elementor-widget elementor-widget-image\" data-id=\"5a7559f7\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1200\" height=\"630\" src=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/08\/08-23-47.jpg\" class=\"attachment-full size-full wp-image-40581\" alt=\"\" srcset=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/08\/08-23-47.jpg 1200w, https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/08\/08-23-47-660x347.jpg 660w, https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/08\/08-23-47-840x441.jpg 840w, https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/08\/08-23-47-768x403.jpg 768w, https:\/\/saluddigital.com\/wp-content\/uploads\/2023\/08\/08-23-47-18x9.jpg 18w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-54e028c2\" data-id=\"54e028c2\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-1ffebaf1 elementor-widget elementor-widget-text-editor\" data-id=\"1ffebaf1\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Los investigadores se enfocaron en resumir <em>Cochrane Reviews<\/em>, una revisi\u00f3n sistem\u00e1tica de investigaci\u00f3n en atenci\u00f3n m\u00e9dica y pol\u00edticas de salud que se publica en Cochrane Library una colecci\u00f3n independiente de evidencia cient\u00edfica sobre atenci\u00f3n en salud. Los LLM resumieron Cochrane Reviews de seis dominios cl\u00ednicos, como enfermedad de Alzheimer, enfermedad renal, c\u00e1ncer de es\u00f3fago, condiciones neurol\u00f3gicas, trastornos de la piel e insuficiencia card\u00edaca. De esta manera, analizaron res\u00famenes de estudios en estos campos, los cuales son utilizados como fuentes clave de informaci\u00f3n para los profesionales de la salud y la investigaci\u00f3n m\u00e9dica.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-1d704265 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"1d704265\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-20dc8971\" data-id=\"20dc8971\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-4b965654 elementor-widget elementor-widget-text-editor\" data-id=\"4b965654\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>En la comparaci\u00f3n entre los res\u00famenes redactados por humanos y los generados por LLM los autores observaron que los res\u00famenes generados por humanos contienen una mayor proporci\u00f3n (28%) de errores fabricados, lo que se traduce en una mayor incoherencia. No obstante, tambi\u00e9n destacan que es necesario abordar esos hallazgos con cautela ya que la evaluaci\u00f3n humana de los res\u00famenes generados por personas se basa \u00fanicamente en los res\u00famenes de las revisiones Cochrane. Es decir, que existe la posibilidad de que las afirmaciones que se consideren que contienen errores fabricados puedan ser validadas por otras secciones dentro de las mismas revisiones sistem\u00e1ticas Cochrane completas.<\/p><p>Adem\u00e1s, la evaluaci\u00f3n de res\u00famenes de los seis dominios requiere conocimientos espec\u00edficos, lo que dificulta su realizaci\u00f3n por parte de personas no expertas, lo que limit\u00f3 la cantidad total de res\u00famenes realizados. Asimismo, los autores utilizaron s\u00f3lo los res\u00famenes de las revisiones Cochrane para evaluar los res\u00famenes generados por personas ya que examinar las revisiones sistem\u00e1ticas completas es un proceso que requiere mucho tiempo. Por lo tanto, como se mencion\u00f3 antes es posible que algunos de los errores identificados en los res\u00famenes de referencia humanos est\u00e9n en realidad corroborados por otras secciones de la revisi\u00f3n completa.<\/p><p>You can consult the full study at the following link:<\/p><p><a href=\"https:\/\/www.nature.com\/articles\/s41746-023-00896-7\">https:\/\/www.nature.com\/articles\/s41746-023-00896-7<\/a><\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-79ec7638 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"79ec7638\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-5039c3da\" data-id=\"5039c3da\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-37e48ee5 elementor-widget elementor-widget-toggle\" data-id=\"37e48ee5\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"toggle.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-9371\" class=\"elementor-tab-title\" data-tab=\"1\" role=\"button\" aria-controls=\"elementor-tab-content-9371\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a class=\"elementor-toggle-title\" tabindex=\"0\"> BIBLIOGRAPHY<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-9371\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"1\" role=\"region\" aria-labelledby=\"elementor-tab-title-9371\"><p><strong>NATURE<\/strong><\/p><p><a href=\"https:\/\/www.nature.com\/articles\/s41746-023-00896-7\">https:\/\/www.nature.com\/articles\/s41746-023-00896-7<\/a><\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>Un estudio compar\u00f3 los res\u00famenes de evidencia cl\u00ednica generados por humanos con res\u00famenes generados por ChatGPT. Los grandes modelos de lenguaje (LLM, en ingl\u00e9s) han demostrado un gran avance en tiempos recientes. Los LLM, han emergido como una tecnolog\u00eda revolucionaria en el campo de la inteligencia artificial (IA) y el procesamiento del lenguaje natural (PLN). Estos modelos representan una nueva generaci\u00f3n de herramientas que son capaces de entender y generar lenguaje humano con un alto nivel de precisi\u00f3n y coherencia. Este tipo de modelos a menudo son utilizados para realizar res\u00famenes de textos, sin embargo, tambi\u00e9n existen LLM pre entrenados que realizan ese tipo de tareas. En este sentido, los LLM pueden aplicarse al campo m\u00e9dico y cl\u00ednico, especialmente para reducir tiempos en el resumen de informaci\u00f3n y evidencia m\u00e9dica. Un estudio reciente realiz\u00f3 un an\u00e1lisis de uno de los LLM m\u00e1s populares, como lo es GPT-3.5, en la realizaci\u00f3n de res\u00famenes de evidencia m\u00e9dica en dominios cl\u00ednicos. En el art\u00edculo publicado en npj Digital Medicine, los autores llevaron a cabo evaluaciones autom\u00e1ticas y humanas para analizar la calidad de los res\u00famenes generados por ChatGPT en diferentes aspectos. Adem\u00e1s, encontraron que las m\u00e9tricas autom\u00e1ticas no siempre coinciden con la calidad real de los res\u00famenes e identificaron tipos de errores en los res\u00famenes m\u00e9dicos generados por LLM, como inconsistencias objetivas y declaraciones enga\u00f1osas o inciertas. Estos hallazgos destacan la posibilidad de que los LLM generen informaci\u00f3n incorrecta o imprecisa. De igual forma identificaron que los LLM tienen dificultades para identificar informaci\u00f3n relevante y pueden cometer m\u00e1s errores al resumir textos m\u00e1s largos. Los investigadores se enfocaron en resumir Cochrane Reviews, una revisi\u00f3n sistem\u00e1tica de investigaci\u00f3n en atenci\u00f3n m\u00e9dica y pol\u00edticas de salud que se publica en Cochrane Library una colecci\u00f3n independiente de evidencia cient\u00edfica sobre atenci\u00f3n en salud. Los LLM resumieron Cochrane Reviews de seis dominios cl\u00ednicos, como enfermedad de Alzheimer, enfermedad renal, c\u00e1ncer de es\u00f3fago, condiciones neurol\u00f3gicas, trastornos de la piel e insuficiencia card\u00edaca. De esta manera, analizaron res\u00famenes de estudios en estos campos, los cuales son utilizados como fuentes clave de informaci\u00f3n para los profesionales de la salud y la investigaci\u00f3n m\u00e9dica. En la comparaci\u00f3n entre los res\u00famenes redactados por humanos y los generados por LLM los autores observaron que los res\u00famenes generados por humanos contienen una mayor proporci\u00f3n (28%) de errores fabricados, lo que se traduce en una mayor incoherencia. No obstante, tambi\u00e9n destacan que es necesario abordar esos hallazgos con cautela ya que la evaluaci\u00f3n humana de los res\u00famenes generados por personas se basa \u00fanicamente en los res\u00famenes de las revisiones Cochrane. Es decir, que existe la posibilidad de que las afirmaciones que se consideren que contienen errores fabricados puedan ser validadas por otras secciones dentro de las mismas revisiones sistem\u00e1ticas Cochrane completas. Adem\u00e1s, la evaluaci\u00f3n de res\u00famenes de los seis dominios requiere conocimientos espec\u00edficos, lo que dificulta su realizaci\u00f3n por parte de personas no expertas, lo que limit\u00f3 la cantidad total de res\u00famenes realizados. Asimismo, los autores utilizaron s\u00f3lo los res\u00famenes de las revisiones Cochrane para evaluar los res\u00famenes generados por personas ya que examinar las revisiones sistem\u00e1ticas completas es un proceso que requiere mucho tiempo. Por lo tanto, como se mencion\u00f3 antes es posible que algunos de los errores identificados en los res\u00famenes de referencia humanos est\u00e9n en realidad corroborados por otras secciones de la revisi\u00f3n completa. Puedes consultar el estudio completo en el siguiente enlace: https:\/\/www.nature.com\/articles\/s41746-023-00896-7 BIBLIOGRAF\u00cdA NATURE https:\/\/www.nature.com\/articles\/s41746-023-00896-7<\/p>","protected":false},"author":1,"featured_media":40581,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[160,3396],"tags":[145],"class_list":["post-40580","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-noticias","category-uso-de-plataformas-digitales","tag-noticias"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/40580","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/comments?post=40580"}],"version-history":[{"count":0,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/40580\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media\/40581"}],"wp:attachment":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media?parent=40580"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/categories?post=40580"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/tags?post=40580"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}