{"id":50131,"date":"2024-10-23T09:49:16","date_gmt":"2024-10-23T15:49:16","guid":{"rendered":"https:\/\/saluddigital.com\/?p=50131"},"modified":"2025-10-18T00:27:35","modified_gmt":"2025-10-18T06:27:35","slug":"cientificos-de-google-presentan-avances-sobre-la-mejora-de-los-modelos-de-lenguaje","status":"publish","type":"post","link":"https:\/\/saluddigital.com\/en\/big-data\/cientificos-de-google-presentan-avances-sobre-la-mejora-de-los-modelos-de-lenguaje\/","title":{"rendered":"Cient\u00edficos de Google presentan avances sobre la mejora de los modelos de lenguaje"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"50131\" class=\"elementor elementor-50131\" data-elementor-post-type=\"post\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-2d22bc99 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"2d22bc99\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-306c78a4\" data-id=\"306c78a4\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-371009cf elementor-widget elementor-widget-heading\" data-id=\"371009cf\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Google present\u00f3 recientemente nuevos avances sobre el razonamiento probabil\u00edstico en grandes modelos de lenguaje o LLMs.<\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-693504fd elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"693504fd\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-55c085f4\" data-id=\"55c085f4\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-21a68b28 elementor-widget elementor-widget-text-editor\" data-id=\"21a68b28\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>El avance de Google sobre el razonamiento probabil\u00edstico en grandes modelos de lenguaje (LLMs, en ingl\u00e9s) se enfoca en mejorar su capacidad para trabajar con tareas matem\u00e1ticas y num\u00e9ricas, espec\u00edficamente al entender y trabajar con distribuciones estad\u00edsticas. Por ejemplo, modelos de lenguaje, como <a href=\"https:\/\/saluddigital.com\/es\/?s=GPT\">GPT<\/a> y otros de \u00faltima generaci\u00f3n como <a href=\"https:\/\/saluddigital.com\/es\/?s=Gemini\">Gemini<\/a> o Llama 2, son buenos realizando tareas relacionadas con el lenguaje, como resumir textos complejos o entender el contexto de una conversaci\u00f3n. Sin embargo, cuando se trata de hacer c\u00e1lculos num\u00e9ricos, como estimar probabilidades, suelen tener dificultades. Esto se debe en parte a que estos modelos no fueron dise\u00f1ados espec\u00edficamente para realizar c\u00e1lculos matem\u00e1ticos, sino para predecir la siguiente palabra en una oraci\u00f3n basada en el contexto.<\/p><p>En este sentido, el razonamiento probabil\u00edstico es una forma de entender c\u00f3mo se comportan los datos y es esencial en muchas \u00e1reas, como la salud o el clima. Por ejemplo, si se quiere saber si es normal que una persona de cierta edad duerma 8 horas al d\u00eda, necesitamos entender c\u00f3mo se distribuye el tiempo de sue\u00f1o entre personas de esa edad. En este caso, el razonamiento probabil\u00edstico permite usar estad\u00edsticas para hacer inferencias y no realizar un an\u00e1lisis de cada dato de manera individual.<\/p><p>Para la mejora de estos aspectos, Google investig\u00f3 c\u00f3mo mejorar esta habilidad en los LLMs. Primero evaluaron las capacidades de modelos como Gemini y GPT para tres tareas clave relacionadas con la probabilidad:<\/p><ol><li>Estimar percentiles: Determinar en qu\u00e9 posici\u00f3n de una distribuci\u00f3n se encuentra un valor espec\u00edfico.<\/li><li>Generar muestras: Crear ejemplos de datos que sigan el mismo patr\u00f3n que la distribuci\u00f3n original.<\/li><li>Calcular probabilidades: Estimar la probabilidad de que algo ocurra dentro de una distribuci\u00f3n dada.<\/li><\/ol>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-6912e2cd elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"6912e2cd\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-7f7bf905\" data-id=\"7f7bf905\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-c23a87c elementor-widget elementor-widget-image\" data-id=\"c23a87c\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1200\" height=\"630\" src=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/10\/10-24-30.jpg\" class=\"attachment-full size-full wp-image-50133\" alt=\"\" srcset=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/10\/10-24-30.jpg 1200w, https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/10\/10-24-30-660x347.jpg 660w, https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/10\/10-24-30-840x441.jpg 840w, https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/10\/10-24-30-768x403.jpg 768w, https:\/\/saluddigital.com\/wp-content\/uploads\/2024\/10\/10-24-30-18x9.jpg 18w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-67cf13f4 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"67cf13f4\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-1e068ecc\" data-id=\"1e068ecc\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-61828e13 elementor-widget elementor-widget-text-editor\" data-id=\"61828e13\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Al no contar con un conjunto de datos espec\u00edfico para esta evaluaci\u00f3n, los investigadores de Google crearon uno nuevo que incluye tanto datos reales, de \u00e1reas como salud, finanzas y clima, como distribuciones simuladas. Posteriormente, utilizaron estos datos para ver qu\u00e9 tan bien los modelos pod\u00edan entender y trabajar con estos tipos de informaci\u00f3n.<\/p><p>Para ayudar a los LLMs a mejorar su desempe\u00f1o, probaron diferentes estrategias:<\/p><ul><li>Ejemplos de referencia: Proporcionaron ejemplos de una misma distribuci\u00f3n para que el modelo pueda aprender patrones y hacer mejores estimaciones.<\/li><li>Contexto del mundo real: A\u00f1adieron datos espec\u00edficos del mundo real, como los precios de renta en Estados Unidos, para que los modelos pudieran usar esta informaci\u00f3n al calcular percentiles.<\/li><li>Simplificaci\u00f3n con estad\u00edsticas: Usaron aproximaciones simples, como tratar una distribuci\u00f3n compleja (como los ingresos) como si fuera normal, para que el modelo pudiera hacer c\u00e1lculos de manera m\u00e1s efectiva.<\/li><\/ul><p>De esta forma, la investigaci\u00f3n demostr\u00f3 que los modelos pueden mejorar significativamente si se les proporciona contexto y ejemplos. Por ejemplo, cuando se les daban algunos ejemplos adicionales, la precisi\u00f3n en la estimaci\u00f3n de percentiles aumentaba un 59%, mientras que la capacidad para generar muestras mejoraba un 55%. Esto sugiere que los modelos tienen una capacidad innata para entender distribuciones, pero necesitan un poco de ayuda para hacerlo de manera m\u00e1s eficiente.<\/p><p>Adem\u00e1s, encontraron que los modelos pod\u00edan hacer inferencias m\u00e1s precisas al simplificar ciertas distribuciones complejas del mundo real, aunque estas simplificaciones no fueran completamente exactas.<\/p><p>Este estudio sugiere que los LLMs, como GPT, Gemini y otros, tienen la capacidad de razonar sobre distribuciones y probabilidades, pero su desempe\u00f1o mejora notablemente con la ayuda de ejemplos espec\u00edficos y contexto del mundo real. Esto abre la puerta a futuras investigaciones que puedan hacer que estos modelos sean m\u00e1s \u00fatiles y precisos en tareas que requieren un entendimiento profundo de la probabilidad y las estad\u00edsticas.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-7fb50acb elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"7fb50acb\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-4ad97220\" data-id=\"4ad97220\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-52d7d811 elementor-widget elementor-widget-toggle\" data-id=\"52d7d811\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"toggle.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-1381\" class=\"elementor-tab-title\" data-tab=\"1\" role=\"button\" aria-controls=\"elementor-tab-content-1381\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a class=\"elementor-toggle-title\" tabindex=\"0\"> BIBLIOGRAPHY<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-1381\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"1\" role=\"region\" aria-labelledby=\"elementor-tab-title-1381\"><p><strong>GOOGLE<\/strong><\/p><p><a href=\"https:\/\/research.google\/blog\/evaluating-and-enhancing-probabilistic-reasoning-in-language-models\/\">https:\/\/research.google\/blog\/evaluating-and-enhancing-probabilistic-reasoning-in-language-models\/<\/a><\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>Cient\u00edficos de Google presentaron avances sobre la mejora de los grandes modelos de lenguaje en el razonamiento probabil\u00edstico.<\/p>","protected":false},"author":1,"featured_media":50133,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[156,160],"tags":[145],"class_list":["post-50131","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-big-data","category-noticias","tag-noticias"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/50131","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/comments?post=50131"}],"version-history":[{"count":0,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/50131\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media\/50133"}],"wp:attachment":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media?parent=50131"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/categories?post=50131"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/tags?post=50131"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}