Un grupo de investigadores de Johns Hopkins ha creado y probado un modelo estadístico de aprendizaje automático que predeciría qué personas son naturalmente resistentes a una infección de SARS-CoV-2.
Investigadores de Johns Hopkins Medicine y Johns Hopkins University han creado un modelo preliminar de aprendizaje automático que, a través de datos de registros médicos electrónicos, sería capaz de predecir que personas tienen una resistencia natural a COVID-19.
“Si podemos identificar qué personas son capaces de evitar de forma natural la infección por el SARS-CoV-2, podremos saber -además de los factores sociales y de comportamiento- qué diferencias genéticas y ambientales influyen en su defensa contra el virus”, explicó la autora principal del estudio Kai-Wen Yang.
Para llevar a cabo este estudio, el equipo ideó un modelo estadístico basado en aprendizaje automático, que fuera capaz de utilizar características almacenadas en registros médicos electrónicos de los pacientes. Por ejemplo, información acerca de comorbilidades, medicamentos prescritos, entre otra información que pudiera dar detalles para la identificación de personas con capacidad natural para evitar la infección por SARS-CoV-2.
Según explican los autores, es importante identificar a estas personas, ya que podrían estudiarse para entender de mejor forma, qué factores permiten su resistencia al virus.
Las características del aprendizaje automático sin ideales para encontrar patrones estadísticos en fuentes de información como los registros médicos. “El uso de un sistema de aprendizaje automático para reconocer patrones complejos en un gran número de personas con COVID-19 permitió a otro equipo de investigadores de Johns Hopkins Medicine en 2021 predecir el curso del caso de un paciente individual y determinar la probabilidad de que se agravara”, detalló el coautor principal del estudio, el Dr. Stuart Ray.
Al basarse en la mencionada investigación previa, el equipo decidió aplicar el mismo enfoque para predecir quién podría estar expuesto al virus en espacios reducidos y no infectarse. En este sentido, para demostrar las capacidades del modelo para predecir la resistencia a COVID-19, los investigadores recolectaron datos del registro clínico Johns Hopkins COVID-19 Precision Medicine Analytics Platform Registry (JH-CROWN). Esta gran base de información contiene datos de pacientes atendidos en el sistema de salud de Johns Hopkins bajo sospechas o confirmación de infección por SARS-CoV-2.
Las personas incluidas en el estudio, fueron aquellas que se aplicaron una prueba COVID-19 entre el 10 de junio y el 15 diciembre de 2020, cuando comenzaron las campañas de vacunación en Estados Unidos, y que informaron una exposición potencial al virus. En total participaron 8,536 personas y fueron divididos entre personas que no compartían residencia u hogar y personas que vivían en el mismo hogar. El primer grupo de 8,476 participantes, se designó como un conjunto de entrenamiento y prueba, mientras que el segundo de 60 participantes fue denominado conjunto de índice de hogares y fue utilizado con conjunto de prueba independiente.
Ambos conjuntos fueron analizados utilizando Maximal-frequent All-confident pattern Selection Pattern-based Clustering o MASPC un algoritmo diseñado para el análisis de registros médicos electrónicos, que combinan información demográfica como edad, sexo y raza, así como códigos de diagnóstico médico de la Clasificación Estadística Internacional de Enfermedades y Problemas Relacionados con la Salud (CIE).
“Nuestra hipótesis era que MASPC nos permitiría agrupar pacientes con patrones similares en sus datos para definirlos como resistentes y no resistentes al SARS-CoV-2, y con la esperanza de que el algoritmo aprendiera con cada análisis a mejorar la precisión y fiabilidad de futuras asignaciones”, explicó el Dr. Ray.
“Este estudio inicial con datos de JH-CROWN se realizó para dar vida a esa hipótesis, un ensayo de prueba de concepto de nuestro modelo estadístico para demostrar que la resistencia a COVID-19 podría predecirse basándose en el perfil clínico y demográfico de un paciente”, agregó.
El estudio que valida la investigación realizada por los investigadores fue publicado recientemente en la revista científica PLOS ONE y está disponible abiertamente para su consulta en el siguiente enlace:
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0278466