{"id":69317,"date":"2026-05-12T10:00:55","date_gmt":"2026-05-12T16:00:55","guid":{"rendered":"https:\/\/saluddigital.com\/?p=69317"},"modified":"2026-05-12T10:05:52","modified_gmt":"2026-05-12T16:05:52","slug":"modelo-detecta-cancer-de-cabeza-y-cuello-mediante-proteinas-en-saliva-con-datos-sinteticos-generados-por-ia","status":"publish","type":"post","link":"https:\/\/saluddigital.com\/en\/big-data\/modelo-detecta-cancer-de-cabeza-y-cuello-mediante-proteinas-en-saliva-con-datos-sinteticos-generados-por-ia\/","title":{"rendered":"Modelo detecta c\u00e1ncer de cabeza y cuello mediante prote\u00ednas en saliva con datos sint\u00e9ticos generados por IA"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"69317\" class=\"elementor elementor-69317\" data-elementor-post-type=\"post\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-4c6f73d1 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"4c6f73d1\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-2b404e88\" data-id=\"2b404e88\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-28971bdd elementor-widget elementor-widget-heading\" data-id=\"28971bdd\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Investigadores de las universidades de Bristol, Manchester, Exeter y Newcastle entrenaron el modelo con datos prote\u00f3micos de plasma sangu\u00edneo del UK Biobank y lo evaluaron en muestras de saliva de 156 participantes, obteniendo un \u00e1rea bajo la curva de 0.88. <\/h2>\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-62fdaf14 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"62fdaf14\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-714646ce\" data-id=\"714646ce\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-922da95 elementor-widget elementor-widget-text-editor\" data-id=\"922da95\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Investigadores de las universidades de Bristol, Manchester, Exeter y Newcastle entrenaron el modelo con datos prote\u00f3micos de plasma sangu\u00edneo del UK Biobank. En un estudio publicado en <a href=\"https:\/\/www.nature.com\/articles\/s41746-026-02658-7\"><em>npj Digital Medicine journal<\/em><\/a> presentaron un marco de aprendizaje profundo o <em>deep learning <\/em>capaz de detectar c\u00e1ncer de cabeza y cuello a partir de perfiles prote\u00f3micos en saliva, sin haber sido entrenado con ese tipo de muestra. El enfoque combina transferencia entre tipos de muestras biol\u00f3gicas y generaci\u00f3n de datos sint\u00e9ticos para superar desaf\u00edos recurrentes en el desarrollo de biomarcadores para c\u00e1nceres poco frecuentes como el tama\u00f1o reducido de los conjuntos de datos y el desequilibrio entre casos y controles.<\/p><p>El modelo, denominado CNN-Synth, fue entrenado con datos prote\u00f3micos de plasma sangu\u00edneo de 13,208 casos pancancer\u00edgenos y 39,806 controles del UK Biobank, una cohorte poblacional que midi\u00f3 2,941 prote\u00ednas en m\u00e1s de 53 mil individuos. Para compensar el desequilibrio entre el n\u00famero de casos y controles, los investigadores entrenaron un autoencoder variacional (VAE, en ingl\u00e9s) capaz de generar 10 mil perfiles proteicos sint\u00e9ticos de c\u00e1ncer, que se sumaron al conjunto de entrenamiento. El modelo resultante fue evaluado en el estudio SensOrPass, un conjunto independiente de 156 participantes, 64 con c\u00e1ncer de cabeza y cuello y 92 controles, en quienes se midieron 92 prote\u00ednas en muestras de saliva.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-7c7c6b23 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"7c7c6b23\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-4d31c630\" data-id=\"4d31c630\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-5980f376 elementor-widget elementor-widget-text-editor\" data-id=\"5980f376\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>El estudio mostr\u00f3 que CNN-Synth alcanz\u00f3 un \u00e1rea bajo la curva (AUC, en ingl\u00e9s) de 0.88, frente a 0.77 del modelo entrenado sin datos sint\u00e9ticos el CNN-Raw. La reducci\u00f3n en errores de clasificaci\u00f3n fue considerable, ya que los falsos positivos disminuyeron de 17 a 8 y los falsos negativos de 25 a 18. Ambos modelos fueron capaces de detectar casos en todos los estadios tumorales, incluyendo enfermedad en etapa temprana, aunque la tasa de error fue m\u00e1s alta en el estadio III para los dos. CNN-Synth mantuvo su ventaja sobre CNN-Raw tambi\u00e9n al aplicar ajuste fino sobre los datos de saliva mediante validaci\u00f3n cruzada estratificada.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-50 elementor-top-column elementor-element elementor-element-7daef6a4\" data-id=\"7daef6a4\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-3a608cc6 elementor-widget elementor-widget-image\" data-id=\"3a608cc6\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1200\" height=\"630\" src=\"https:\/\/saluddigital.com\/wp-content\/uploads\/2026\/05\/05-26-08.jpg\" class=\"attachment-full size-full wp-image-69319\" alt=\"\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-5065c319 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"5065c319\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-4f5e4f90\" data-id=\"4f5e4f90\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-2cf6182b elementor-widget elementor-widget-text-editor\" data-id=\"2cf6182b\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t<p>Asimismo, al comparar CNN-Synth con una serie de modelos convencionales no neuronales, incluyendo regresi\u00f3n log\u00edstica, an\u00e1lisis discriminante lineal, redes de vecinos m\u00e1s cercanos, \u00e1rboles de decisi\u00f3n, m\u00e1quinas de soporte vectorial y XGBoost, todos entrenados con los mismos datos del UK Biobank m\u00e1s los casos sint\u00e9ticos, la red convolucional super\u00f3 a todos en el escenario de transferencia entre tipos de muestra. XGBoost fue el de mejor desempe\u00f1o entre los m\u00e9todos no neuronales, con un AUC de 0.69.<\/p><p>Para interpretar qu\u00e9 prote\u00ednas contribuyeron m\u00e1s a las predicciones del modelo, los investigadores aplicaron el m\u00e9todo SHapley Additive exPlanations (SHAP). En CNN-Synth, las prote\u00ednas con mayor peso fueron IL6, CXCL17, CXCL13, IGF1R y FASLG, todas con roles documentados en biolog\u00eda del c\u00e1ncer. El an\u00e1lisis de enriquecimiento funcional de las 20 prote\u00ednas con mayor valor SHAP mostr\u00f3 representaci\u00f3n significativa en procesos relacionados con la progresi\u00f3n tumoral, incluyendo morfog\u00e9nesis, diferenciaci\u00f3n de c\u00e9lulas inmunes, desarrollo vascular, remodelaci\u00f3n de la matriz extracelular y v\u00edas de se\u00f1alizaci\u00f3n.<\/p><p>No obstante, los autores se\u00f1alan varias limitaciones, principalmente con la cohorte de prueba, la cual es peque\u00f1a y \u00e9tnicamente homog\u00e9nea, con 98.9% de participantes de origen brit\u00e1nico blanco, lo que restringe la generalizaci\u00f3n del modelo a otras poblaciones. De igual forma, este fue entrenado con todos los tipos de c\u00e1ncer disponibles en el UK Biobank, dado que los casos espec\u00edficos de c\u00e1ncer de cabeza y cuello representan solo el 14% del total, lo que implica que los patrones aprendidos reflejan se\u00f1ales pancancer\u00edgenas m\u00e1s que caracter\u00edsticas propias de este tumor. Adem\u00e1s, los autores tampoco exploraron si arquitecturas m\u00e1s simples podr\u00edan haber logrado resultados similares, ni contaron con mediciones de otras mol\u00e9culas como expresi\u00f3n g\u00e9nica o metilitos que podr\u00edan haber mejorado el desempe\u00f1o.<\/p>\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-c6d7f88 elementor-section-boxed elementor-section-height-default elementor-section-height-default wpr-particle-no wpr-jarallax-no wpr-parallax-no wpr-sticky-section-no wpr-column-slider-no wpr-equal-height-no\" data-id=\"c6d7f88\" data-element_type=\"section\" data-e-type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-2990df17\" data-id=\"2990df17\" data-element_type=\"column\" data-e-type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-1ea64274 elementor-widget elementor-widget-toggle\" data-id=\"1ea64274\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"toggle.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle\">\n\t\t\t\t\t\t\t<div class=\"elementor-toggle-item\">\n\t\t\t\t\t<div id=\"elementor-tab-title-5141\" class=\"elementor-tab-title\" data-tab=\"1\" role=\"button\" aria-controls=\"elementor-tab-content-5141\" aria-expanded=\"false\">\n\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon elementor-toggle-icon-left\" aria-hidden=\"true\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-closed\"><i class=\"fas fa-caret-right\"><\/i><\/span>\n\t\t\t\t\t\t\t\t<span class=\"elementor-toggle-icon-opened\"><i class=\"elementor-toggle-icon-opened fas fa-caret-up\"><\/i><\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<\/span>\n\t\t\t\t\t\t\t\t\t\t\t\t<a class=\"elementor-toggle-title\" tabindex=\"0\"> BIBLIOGRAPHY<\/a>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<div id=\"elementor-tab-content-5141\" class=\"elementor-tab-content elementor-clearfix\" data-tab=\"1\" role=\"region\" aria-labelledby=\"elementor-tab-title-5141\"><p><strong>NATURE<\/strong><\/p><p><a href=\"https:\/\/www.nature.com\/articles\/s41746-026-02658-7\">https:\/\/www.nature.com\/articles\/s41746-026-02658-7<\/a><\/p><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>Modelo, entrenado con UK Biobank, detecta c\u00e1ncer de cabeza y cuello mediante prote\u00ednas en saliva con datos sint\u00e9ticos generados por IA<\/p>","protected":false},"author":1,"featured_media":69319,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[156,160],"tags":[145],"class_list":["post-69317","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-big-data","category-noticias","tag-noticias"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/69317","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/comments?post=69317"}],"version-history":[{"count":5,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/69317\/revisions"}],"predecessor-version":[{"id":69323,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/posts\/69317\/revisions\/69323"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media\/69319"}],"wp:attachment":[{"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/media?parent=69317"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/categories?post=69317"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/saluddigital.com\/en\/wp-json\/wp\/v2\/tags?post=69317"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}