Filtrar por tipo de entrada
Filtrar por categorías
Modelo de deep learning predice el destino de las células durante su desarrollo

Investigadores del Helmholtz Munich y Oxford presentan RegVelo, un marco computacional que combina la velocidad del ARN con información regulatoria para simular y predecir el efecto de la eliminación de genes en la diferenciación celular.

Un equipo de investigadores del Centro de Biología Computacional del Helmholtz Munich, la Universidad Técnica de Múnich y el Instituto de Medicina Molecular Weatherall de la Universidad de Oxford desarrolló RegVelo, un marco de aprendizaje profundo o deep learning generativo que modela de manera conjunta la dinámica del empalme del ARN y las interacciones regulatorias entre genes en células individuales. El estudio será publicado en la revista Cell.

La profesora Sauka Spengler, una de las coautoras del estudio explicó que: “Lo que realmente queremos comprender es cómo las células toman decisiones y pasan de un estado a otro. RegVelo modela cómo se codifican esas decisiones sobre el destino celular en las redes de regulación génica a lo largo del tiempo, y qué es lo que las impulsa”.

Las técnicas existentes para reconstruir trayectorias de diferenciación celular utilizan modelos de velocidad del ARN, para estimar cambios en el estado celular a partir de la proporción entre ARN mensajero sin empalmar y empalmado, ignoran los mecanismos de regulación génica que determinan las tasas de transcripción. En cambio, los métodos de inferencia de redes de regulación génica (GRN, en inglés) no incorporan la naturaleza dinámica de los sistemas biológicos. RegVelo aborda esta brecha al integrar ambos enfoques en un modelo unificado que infiere simultáneamente la red regulatoria, el tiempo latente de cada célula y la distribución de velocidades a partir de datos de secuenciación de ARN unicelular.

En biología del desarrollo, el destino celular se refiere al tipo de célula especializada en la que se convertirá una célula durante el proceso de diferenciación. Cuando un organismo se desarrolla a partir de una célula inicial, las células hijas van adquiriendo identidades específicas, es decir, se convierten en neuronas, células musculares, células del páncreas, entre otras. Este proceso está regulado por redes de genes que se activan o se silencian en momentos precisos, y determina tanto la función que cumplirá la célula como los tejidos y órganos que formará. Es por ello que este tema es de suma importancia en la investigación biomédica, ya que favorece la comprensión de enfermedades del desarrollo o el cáncer y ayuda al diseño de posibles terapias regenerativas.

El modelo presentado en el estudio muestra la GRN como una matriz de pesos parametrizada por una red neuronal superficial, donde cada entrada describe el efecto de un regulador sobre la transcripción de sus genes diana, en la que los valores positivos indican activación y los negativos indican represión. A diferencia de los enfoques previos que resuelven ecuaciones diferenciales ordinarias de forma independiente para cada gen, RegVelo resuelve un sistema de alta dimensión acoplado a través de la regulación génica, lo que permite capturar las relaciones entre genes durante la diferenciación. Integrado con CellRank 2, el marco estima las probabilidades de transición celular y predice el efecto de eliminar reguladores individuales sobre el destino final de las células mediante simulaciones computacionales, sin necesidad de experimentos previos.

El equipo validó el modelo en múltiples sistemas biológicos, incluidos ciclos celulares, hematopoyesis humana, desarrollo pancreático endocrino murino y miógenesis embrionaria humana, con resultados consistentemente superiores o equivalentes a los métodos anteriores como scVelo y veloVI en la identificación de estados terminales, la precisión de la inferencia de tiempo latente y la predicción de genes conductores de linaje. Una aplicación central del trabajo fue el estudio del desarrollo de la cresta neural craneal del pez cebra, para el que el equipo generó mil 180 células perfiladas en siete puntos temporales mediante la técnica Smart-seq3.

Las perturbaciones computacionales identificaron a tfec como un regulador temprano del destino de las células pigmentarias y a elf1, un factor de transcripción de la familia ETS, como un regulador pro-pigmentario previamente no caracterizado en ese contexto. Ambas predicciones fueron validadas experimentalmente mediante eliminación génica con CRISPR-Cas9 y secuenciación unicelular de perturbaciones en vivo.

Las “perturbaciones computacionales” son simulaciones en las que, dentro de un modelo matemático del sistema biológico, los investigadores apagan virtualmente un gen para ver qué pasa. Por ejemplo, es como desconectar un fusible en un tablero eléctrico para saber qué controla. Así se identificaron dos genes de interés: tfec, que ya tenía cierto historial en la literatura pero aquí se confirma como regulador temprano, y elf1, un factor de transcripción de la familia ETS que no había sido asociado antes al desarrollo de células pigmentarias.

Un factor de transcripción es una proteína que actúa como interruptor, es decir que se pega al ADN y activa o silencia otros genes. La familia ETS es un grupo de estos interruptores que comparten una estructura similar y participan en muchos procesos del desarrollo celular.

Por otro lado para la fase experimental fue necesario confirmar que las predicciones computacionales eran correctas en organismos reales. Para ello, los investigadores recurrieron a dos herramientas. Con CRISPR-Cas9 eliminaron físicamente cada gen en células o embriones vivos y observaron qué ocurría con las células pigmentarias. La secuenciación unicelular de perturbaciones en vivo o in vivo perturbation single-cell sequencing, les permitió ver, gen por gen y célula por célula, cómo cambia el comportamiento molecular cuando se elimina un gen específico, con una resolución muy alta.

En términos generales el estudio mostró que tfec y elf1 son reguladores relevantes en la formación de células pigmentarias, siendo elf1 un descubrimiento nuevo en el contexto de la biología celular.

Aunque el estudio tiene limitaciones reconocidas por los autores, por ejemplo, el modelo asume un tiempo latente global obtenido promediando tiempos específicos por gen, lo que puede no capturar toda la variabilidad temporal. El marco regulatorio actual se restringe a interacciones lineales simples y no incorpora la actividad de factores de transcripción inferida desde motivos de secuencia ni datos de accesibilidad de cromatina. Además, la estimación de la incertidumbre regulatoria requiere múltiples ejecuciones del modelo, lo que implica un costo computacional elevado. El código y los datos del estudio están disponibles de forma abierta en GitHub.

Noticias destacadas

Mantente actualizado

Noticias por país

Contenidos Relacionados

Secured By miniOrange