{"id":67743,"date":"2026-02-23T10:13:12","date_gmt":"2026-02-23T16:13:12","guid":{"rendered":"https:\/\/saluddigital.com\/?p=67743"},"modified":"2026-02-23T10:17:35","modified_gmt":"2026-02-23T16:17:35","slug":"cancerllm-un-modelo-de-lenguaje-especializado-en-oncologia-que-busca-eficiencia-y-precision-clinica","status":"publish","type":"post","link":"https:\/\/saluddigital.com\/en\/big-data\/cancerllm-un-modelo-de-lenguaje-especializado-en-oncologia-que-busca-eficiencia-y-precision-clinica\/","title":{"rendered":"CancerLLM, un modelo de lenguaje especializado en oncolog\u00eda que busca eficiencia y precisi\u00f3n cl\u00ednica"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"67743\" class=\"elementor elementor-67743\" data-elementor-post-type=\"post\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-7bb919ea elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"7bb919ea\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-5ef31a25\" data-id=\"5ef31a25\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-64851eda elementor-widget elementor-widget-heading\" data-id=\"64851eda\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Un nuevo estudio presenta un modelo de 7 mil millones de par\u00e1metros entrenado con millones de notas cl\u00ednicas y reportes de patolog\u00eda para tareas espec\u00edficas en c\u00e1ncer.<\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-198844f6 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"198844f6\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-4aa00c4d\" data-id=\"4aa00c4d\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-5dd9824e elementor-widget elementor-widget-text-editor\" data-id=\"5dd9824e\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Un equipo de investigadores de la University of Minnesota Twin Cities y otras instituciones desarroll\u00f3 CancerLLM, un gran modelo de lenguaje o LLM, dise\u00f1ado espec\u00edficamente para el dominio oncol\u00f3gico. El trabajo parte de una limitaci\u00f3n reconocida en los modelos generales y biom\u00e9dicos existentes, que no siempre incorporan conocimiento detallado sobre c\u00e1ncer ni est\u00e1n optimizados para tareas cl\u00ednicas concretas como la extracci\u00f3n de fenotipos o la generaci\u00f3n de diagn\u00f3sticos. El estudio fue publicado en <a href=\"https:\/\/www.nature.com\/articles\/s41746-026-02441-8\"><em>npj Digital Medicine journal<\/em><\/a>.<\/p><p>CancerLLM fue construido sobre la arquitectura Mistral de 7 mil millones de par\u00e1metros y posteriormente ajustado con t\u00e9cnicas de adaptaci\u00f3n eficiente. Para su entrenamiento se utilizaron 2,676,642 notas cl\u00ednicas oncol\u00f3gicas y 515,524 reportes de patolog\u00eda correspondientes a 17 tipos de c\u00e1ncer, obtenidos de un repositorio cl\u00ednico institucional.<\/p><p>Despu\u00e9s del preentrenamiento, el modelo fue afinado mediante instrucci\u00f3n supervisada en dos tareas, de extracci\u00f3n de fenotipos tumorales y de generaci\u00f3n de diagn\u00f3sticos a partir de notas cl\u00ednicas estructuradas.<\/p><p>En la tarea de extracci\u00f3n de fenotipos, el modelo deb\u00eda identificar entidades como tipo y estado de receptores hormonales, tama\u00f1o y localizaci\u00f3n del tumor, grado, subtipo histol\u00f3gico, lateralidad y estadio. En generaci\u00f3n diagn\u00f3stica, se le proporcionaba informaci\u00f3n cl\u00ednica como motivo de consulta, hallazgos objetivos y resultados de laboratorio, y deb\u00eda producir el diagn\u00f3stico oncol\u00f3gico correspondiente.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-4837a1b7 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"4837a1b7\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-7084b0ef\" data-id=\"7084b0ef\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-11da9116 elementor-widget elementor-widget-text-editor\" data-id=\"11da9116\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Los resultados mostraron que CancerLLM alcanz\u00f3 un F1 de 91.78% en extracci\u00f3n de fenotipos y de 86.81% en generaci\u00f3n de diagn\u00f3stico en los conjuntos de evaluaci\u00f3n internos. Seg\u00fan los autores, el modelo super\u00f3 a diversos modelos biom\u00e9dicos y generales, incluidos sistemas con 13 mil y 70 mil millones de par\u00e1metros, con una mejora promedio de 9.23 puntos porcentuales en F1 frente a las l\u00edneas base evaluadas. En un cohorte independiente de 2 mil pacientes, mantuvo el mejor desempe\u00f1o absoluto, con un F1 promedio de 85.08% bajo separaci\u00f3n estricta a nivel paciente.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-59874d4b\" data-id=\"59874d4b\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-2b2eb907 elementor-widget elementor-widget-image\" data-id=\"2b2eb907\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1200\" height=\"630\" src=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2026\/02\/02-26-30.jpg\" class=\"attachment-full size-full wp-image-67746\" alt=\"\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-99aaa44 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"99aaa44\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-7fff94be\" data-id=\"7fff94be\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-5789f5b5 elementor-widget elementor-widget-text-editor\" data-id=\"5789f5b5\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>El estudio tambi\u00e9n evalu\u00f3 la robustez ante escenarios realistas. En pruebas con anotaciones incorrectas simuladas, el desempe\u00f1o disminuy\u00f3 conforme aumentaba la proporci\u00f3n de errores, aunque el modelo mantuvo ventaja frente a su versi\u00f3n base. En experimentos con errores ortogr\u00e1ficos introducidos artificialmente en las notas cl\u00ednicas, tanto CancerLLM como otros modelos comparables mostraron ca\u00eddas relevantes en m\u00e9tricas de coincidencia exacta, lo que pone de relieve la sensibilidad de estos sistemas a variaciones ling\u00fc\u00edsticas frecuentes en la pr\u00e1ctica cl\u00ednica.<\/p><p>Otro aspecto destacado es la eficiencia computacional, ya que frente a modelos de mayor tama\u00f1o, CancerLLM requiri\u00f3 menos memoria de GPU y menor tiempo de inferencia. Por ejemplo, mientras algunos modelos de 70 mil millones de par\u00e1metros demandaron m\u00e1s de 37 GB de memoria y tiempos de inferencia superiores a dos horas y media en el conjunto completo de prueba, CancerLLM utiliz\u00f3 alrededor de 5.5 GB y redujo el tiempo total de generaci\u00f3n de manera considerable.<\/p><p>Los autores tambi\u00e9n exploraron una versi\u00f3n con recuperaci\u00f3n de informaci\u00f3n, en la que el modelo incorpora ejemplos relevantes recuperados de un corpus de entrenamiento antes de generar la respuesta. En tareas de generaci\u00f3n diagn\u00f3stica, ciertos recuperadores especializados mejoraron el rendimiento, mientras que en extracci\u00f3n de fenotipos el modelo sin recuperaci\u00f3n adicional se mantuvo competitivo.<\/p><p>En el an\u00e1lisis de errores se identificaron dificultades recurrentes, como la tendencia a simplificar diagn\u00f3sticos complejos, omitir informaci\u00f3n sobre met\u00e1stasis o estadificaci\u00f3n, y problemas para interpretar abreviaturas y errores tipogr\u00e1ficos comunes en notas cl\u00ednicas. Estos hallazgos apuntan a la necesidad de estrategias adicionales de normalizaci\u00f3n y control de calidad de datos en entornos reales.<\/p><p>El equipo concluye que un modelo de tama\u00f1o moderado, entrenado con datos espec\u00edficos del dominio oncol\u00f3gico y evaluado con conjuntos dise\u00f1ados para tareas cl\u00ednicas concretas, puede ofrecer un equilibrio entre desempe\u00f1o, robustez y viabilidad operativa. Aunque los resultados no sustituyen la evaluaci\u00f3n m\u00e9dica especializada, el estudio sugiere que herramientas de este tipo podr\u00edan apoyar investigaci\u00f3n cl\u00ednica y procesos asistenciales en oncolog\u00eda bajo marcos regulatorios y \u00e9ticos adecuados.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-57cf9de5 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-equal-height-no\" data-id=\"57cf9de5\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-5e9cdb0a\" data-id=\"5e9cdb0a\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-2c42fd60 elementor-widget elementor-widget-toggle\" data-id=\"2c42fd60\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"toggle.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-7421\" class=\"elementor-tab-title\" data-tab=\"1\" role=\"button\" aria-controls=\"elementor-tab-content-7421\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a class=\"elementor-toggle-title\" tabindex=\"0\"> BIBLIOGRAPHY<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-7421\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"1\" role=\"region\" aria-labelledby=\"elementor-tab-title-7421\"><p><strong>NATURE<\/strong><\/p><p><a href=\"https:\/\/www.nature.com\/articles\/s41746-026-02441-8\">https:\/\/www.nature.com\/articles\/s41746-026-02441-8<\/a><\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>CancerLLM, un modelo de lenguaje especializado en oncolog\u00eda que busca eficiencia y precisi\u00f3n cl\u00ednica fue presentado por investigadores.<\/p>","protected":false},"author":1,"featured_media":67746,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[156,160],"tags":[145],"class_list":["post-67743","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-big-data","category-noticias","tag-noticias"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/67743","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/comments?post=67743"}],"version-history":[{"count":5,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/67743\/revisions"}],"predecessor-version":[{"id":67751,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/67743\/revisions\/67751"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media\/67746"}],"wp:attachment":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media?parent=67743"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/categories?post=67743"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/tags?post=67743"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}