Home » Esta herramienta de IA podría predecir la próxima variante del coronavirus

Esta herramienta de IA podría predecir la próxima variante del coronavirus

by admin
Esta herramienta de IA podría predecir la próxima variante del coronavirus

A pesar de haber existido por menos de tres años, el virus SARS-CoV-2, que causa el COVID, es quizás el patógeno más estudiado y secuenciado genéticamente de la historia. Los equipos de vigilancia de enfermedades de todo el mundo han cargado millones de secuencias virales en bases de datos públicas que permiten a los investigadores rastrear cómo se propaga el virus.

Un nuevo modelo computacional extrajo esta cantidad de datos sin precedentes (más de 6,4 millones de secuencias de SARS-CoV-2) para encontrar patrones entre las mutaciones que ayudan a que una nueva cepa viral se propague por todo el mundo. El modelo, llamado PyR0, analizó cómo surgieron y se propagaron diferentes linajes virales entre diciembre de 2019 y enero de 2022. A partir de estos datos, aprendió a identificar las combinaciones de mutaciones y la cantidad de tiempo requerida para que variantes como Delta u Omicron se vuelvan predominantes. El modelo, que un equipo de investigadores describió en Ciencias en mayo, podría avisar con anticipación a los programas de salud pública sobre qué linajes son potencialmente peligrosos y permitir que los funcionarios planifiquen con anticipación.

PyR0 usó datos hasta mediados de diciembre de 2021 para predecir correctamente que la subvariante BA.2 de Omicron, que era rara en gran parte del mundo en ese momento, pronto se extendería rápidamente. Para marzo de 2022, BA.2 se había convertido en la cepa dominante a nivel mundial. Si el modelo se hubiera ejecutado en noviembre de 2020, también habría predicho correctamente que la variante Alpha pronto se volvería dominante: la Organización Mundial de la Salud no identificó a Alpha como una variante preocupante hasta diciembre de ese año.

La mayoría de las vacunas contra el COVID se dirigen a la proteína espiga del virus, que utiliza para ingresar a las células. Las mutaciones en esta proteína parecen permitir que ciertas variantes escapen a la respuesta inmunitaria del cuerpo al virus de la vacunación o de una infección previa. El PyR0 El modelo descubrió que el simple hecho de tener numerosas mutaciones de la proteína espiga no necesariamente hacía que una cepa se adaptara más evolutivamente. Pero algunas mutaciones de pico específicas a fines de 2021 ayudaron a las subvariantes BA.1 y BA.2 de Omicron a evadir el sistema inmunológico.

PyR0 también descubrió que un conjunto de mutaciones sin picos en el genoma de BA.2 que afectan la forma en que el virus se replica podría contribuir a su rápida propagación. La capacidad del modelo para analizar rápidamente genomas completos, dicen los investigadores, podría ayudar a los científicos a saber qué áreas del genoma del virus estudiar para desarrollar futuras terapias.

Científico americano habló con el coautor del estudio Jacob Lemieux, investigador de enfermedades infecciosas en el Instituto Broad del Instituto de Tecnología de Massachusetts y la Universidad de Harvard y médico en el Hospital General de Massachusetts en Boston, sobre cómo los algoritmos que “aprenden” de grandes conjuntos de datos pueden predecir el el futuro de la pandemia.

[An edited transcript of the interview follows.]

¿Qué puede PyR0 cuéntanos sobre las próximas variantes predominantes?

No podemos decir necesariamente lo que sucederá a continuación en términos de mutaciones. Podemos decir lo que sucederá a continuación en términos de qué linajes es más probable que aumenten en frecuencia.

En otras palabras, si un automóvil viaja a 70 millas por hora y otro automóvil viaja a 35 millas por hora, podemos hacer una predicción de que en una cierta cantidad de tiempo, el automóvil a 70 millas por hora va a alcanzar y adelantar al otro coche. Pero esas predicciones solo son buenas en el futuro cercano porque la forma en que funciona la pandemia es que, de repente, hay un automóvil de 210 millas por hora que sale de la nada y cambia la dinámica por completo.

Lo sorprendente es que ha sucedido una y otra vez. Primero, fue la variante D614G, luego fue Alpha, luego fue Delta, luego fue Omicron; ahora es Omicron BA.2 y sus primos cercanos BA.4 y BA.5. Entonces, este tipo de dinámica parece ser una característica general de la pandemia.

Pero las cosas que permiten que los autos vayan rápido, las propiedades que confieren esta ventaja física, parecen haber cambiado con el tiempo. Omicron, en particular, parece ser muy inmune a la evasión, en particular al escapar de la respuesta de anticuerpos humanos. Esa propiedad ha sido cada vez más importante para el virus, y eso tiene sentido porque muchas personas han tenido COVID o han sido vacunadas, o ambas cosas.

Parece que esta creciente evasión inmune se ha estado gestando continuamente durante la pandemia, y ahora realmente ha alcanzado su máxima expresión. Este no es el primer estudio que muestra eso, pero lo demuestra sistemáticamente. Y parece probable que ese escape inmunológico continúe siendo parte de lo que hace que un linaje crezca. No podemos predecir, dentro del contexto de este estudio, qué mutaciones surgirán en el futuro y conferirán un escape inmunológico adicional.

¿Cómo ayuda su modelo a predecir y rastrear nuevas variantes?

Lo que estamos modelando es cómo las diferentes combinaciones de mutaciones en diferentes linajes afectan la tasa de crecimiento de las variantes virales individuales en la población. [Editor’s note: A lineage is a group of variants with a common ancestor.] Debido a que cada nuevo linaje tiene una constelación de mutaciones, algunas de las cuales hemos visto antes en otros linajes, podemos comenzar a preguntarnos “¿Qué mutaciones están impulsando esto?”

Estamos modelando esta pregunta en muchas regiones diferentes del mundo y luego agregando la información en un solo modelo. La razón por la que podemos hacer esto es porque personas de todo el mundo están secuenciando el virus y están etiquetando las secuencias con la fecha y la región de la colección. Entonces sabemos, en diferentes regiones, qué linajes están aumentando en frecuencia en relación con los demás. Esta información es increíblemente valiosa: no habríamos podido crear nuestro modelo sin este tipo de información.

Es un verdadero desafío computacional implementar ese modelo y ajustarlo a los datos. El autor principal del estudio, Fritz Obermeyer, llegó al Instituto Broad desde Uber AI, donde los investigadores desarrollaron un lenguaje de programación y un marco de software que utiliza el aprendizaje automático para modelar probabilidades y aplicarlas a grandes conjuntos de datos. Fue realmente sorprendente poder aplicar estos métodos a la escala de datos que nunca antes habíamos tenido.

Estamos tratando de mejorar el modelo y tenemos una nueva versión. De hecho, creemos que los linajes exitosos son impulsados ​​por una pequeña cantidad de mutaciones, y los demás simplemente están en el camino. Un desafío relacionado es tratar de estudiar la interacción genética o estadística entre mutaciones. Tal vez la Mutación 1 hace que el virus esté más en forma; tal vez Mutation 2 lo haga más en forma. Pero tal vez la combinación de 1 y 2 juntos en realidad lo hace menos adecuado. Ese tipo de interacciones son realmente difíciles de manejar porque el número de ellas crece muy rápidamente.

¿Cómo puede ayudarnos este modelo a planificar nuestra respuesta a la pandemia?

Una de las cosas que estamos aprendiendo es que la secuenciación del genoma de los virus emergentes es parte de la respuesta al brote. Estamos viendo mucha secuenciación del genoma, por ejemplo, con el brote de viruela del mono que está ocurriendo en este momento.

Hay tantos datos que no podemos permitir que un ser humano los revise todos. Necesitamos programas de aprendizaje automático sistemáticos y estadísticos que ayuden a los humanos a detectar nuevas variantes. Como herramienta de apoyo a la vigilancia de enfermedades, este tipo de enfoque puede ser realmente útil. Estamos tratando de automatizar este modelo para poder ejecutarlo regularmente y ver si podemos marcar las cosas que nos deberían preocupar.

Descubrimos que al modelar mutaciones en lugar de solo linajes, el modelo era más inteligente y aprende más rápido. Y cuanto más rápido aprenda sobre las propiedades de un linaje, más sabrá qué tan preocupado debe estar.

No creo que este modelo reemplace a los programas bien estructurados, como los que ejecutan los gobiernos y las organizaciones internacionales, para llevar a cabo la vigilancia de enfermedades. Es una herramienta de apoyo para dichos programas que les permite filtrar y clasificar sistemáticamente los linajes que están aumentando. Creo que este tipo de enfoque será factible en el futuro a medida que se acumulen datos sobre la influenza y otros virus.

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More

Privacy & Cookies Policy