Esta disciplina científica se convirtió en una herramienta clave para la detección veloz de las nuevas variantes del virus. En el mundo ya se secuenciaron más de un millón de muestras.
Desde el comienzo de la pandemia se avanzó considerablemente en el conocimiento del enemigo: el virus SARS-CoV-2 que causa la enfermedad Covid-19. En poco tiempo, se logró secuenciar el genoma de este patógeno, interpretar cómo ataca al sistema inmunitario y, a partir de ahí, desarrollar pruebas de diagnóstico y vacunas en tiempo récord. En todos esos avances fue vital el rol de la bioinformática, una de las disciplinas científicas que más protagonismo y proyección tomó desde la aparición del coronavirus.
Esta consiste en la aplicación intensiva de aproximaciones informáticas y cálculos matemáticos y estadísticos al estudio y resolución de los problemas biológicos y médicos. Su labor consiste en investigar, desarrollar y aplicar herramientas que reúnen, almacenan, organizan, analizan y permiten interpretar los datos biológicos.
Aliada en la lucha contra el Covid-19
La bioinformática nació a comienzos de 1960 con la aplicación de métodos computarizados al análisis de la secuencia de proteínas. Su crecimiento fue ligado al desarrollo de la biología molecular, el descubrimiento del ADN y a los avances en computación.
En la actualidad, se la considera una disciplina emergente que se hizo indispensable para el manejo del enorme volumen de datos que generan las nuevas tecnologías denominadas “ómicas”, como la genómica, proteómica, metabolómica, entre otras, haciendo del concepto de “big data” un activo fundamental en la biomedicina actual.
Entre los problemas más relevantes que se vieron beneficiados del desarrollo de la bioinformática están, entre muchos otros, el estudio de las enfermedades raras de origen genético, la identificación de las mutaciones asociadas a tumores, la identificación del patógeno causante de un brote infeccioso o el descubrimiento de nuevos virus, como el SARS-CoV-2.
Por eso, esta rama de la ciencia se convirtió en una aliada en la lucha contra el Covid-19, ya que es clave para vigilar las variantes más agresivas frente a las vacunas.
La secuenciación es una prioridad: identificó preocupantes variantes en Gran Bretaña (Alpha), Sudáfrica (Beta), Brasil (Gamma) y en India (Delta). La alerta temprana no impidió su propagación -decenas de países las detectaron ya- pero permitió a otros prepararse.
Millones de secuencias, millones de datos
Mediante técnicas de secuenciación masiva (NGS, Next-Generation Secuencing), se obtienen, en forma simultánea, millones de genomas del virus, que se traducen en millones de datos que son almacenados. Y aquí es donde entra en juego la bioinformática: se utilizan diferentes programas para analizar y comparar estas secuencias, aportando datos que permiten conocer las características del virus, el seguimiento de su evolución y propagación, su ciclo y maquinaria vital, la realización de estudios filogenéticos que ayudan a entender las similitudes y diferencias con otros virus, los mecanismos de entrada del virus en la célula y la posibilidad de identificar opciones potenciales de intervención.
Más de 1,2 millones de secuencias del genoma del SARS-CoV-2 procedentes de 172 países se han compartido a través de GISAID, la mayor base de datos genéticos sobre el nuevo coronavirus y sus variantes a nivel global.
Ante los nuevos desafíos que plantea la pandemia, las bases de datos públicos desempeñan un papel fundamental para poder rastrear a los virus. Existen varias para las secuencias del genoma, pero GISAID, por sus siglas en inglés Global Initiative on Sharing All Influenza Data, es la más popular para el SARS-CoV-2.
Esta plataforma online es la mayor base de datos genéticos sobre el nuevo coronavirus y sus variantes a nivel global. Fue creada en 2006 como un depósito de datos genómicos del virus causante de la gripe y a partir de acuerdos de intercambio entre naciones, dos años después se lanzó tal como se conoce hoy.
Según datos publicados por la prestigiosa revista internacional de ciencia Nature, más de 1,2 millones de secuencias del genoma del SARS-CoV-2 procedentes de 172 países se compartieron a través de GISAID.
La secuenciación genómica del virus es crucial no solo para poder estudiar sus orígenes, sino también la epidemiología de los brotes y movimiento de las nuevas variantes en todo el planeta.
En Argentina, ya se secuenciaron más de 1.000 muestras desde el inicio de la pandemia, según informa el Proyecto PAIS (Proyecto Argentino Interinstitucional de genómica de SARS-CoV-2), creado desde el Ministerio de Ciencia, Tecnología e Innovación de la Nación. Además, con la estrategia de vigilancia de variantes, obtuvieron más 890 secuencias parciales de la proteína spike del coronavirus. Todas estas secuencias están publicadas en la base de datos GISAID.
GISAID (Global Initiative on Sharing All Influenza Data); Revista Nature; Proyecto PAIS (Proyecto Argentino Interinstitucional de genómica de SARS-CoV-2)