O Brasil tem três supercomputadores entre os 500 mais potentes do mundo. Dois são da Petrobras — Atlas e Fênix. O terceiro, o Santos Dumont, localizado no Laboratório Nacional de Computação Científica (LNCC), em Petrópolis (RJ), desde o ano passado tem sido usado nos esforços para combater a pandemia de covid-19 no Brasil.
Entre outras atribuições, ele é utilizado no sequenciamento genético de amostras do vírus que chegam de diferentes regiões do país.
Foi com a ajuda dele que a equipe coordenada pela bióloga Ana Tereza Ribeiro de Vasconcelos, responsável pelo Laboratório de Bioinformática do LNCC, identificou em dezembro uma variante nova do coronavírus no Rio de Janeiro, posteriormente batizada de P.2.
A cientista trabalha no laboratório há quase 40 anos. Ela é uma das pioneiras no país da bioinformática — ciência que usa computação, matemática e estatística para processar e interpretar dados da biologia e responder questões em aberto na Ciência.
Essa é uma área muito recente do conhecimento, ampliada exponencialmente nas últimas décadas graças ao avanço da tecnologia.
Isso porque, quando se fala em genética — um dos campos que têm se beneficiado da bioinformática e a especialidade de Ana Tereza —, existe a necessidade de processamento de um oceano de dados. O DNA, apesar de microscópico, guarda um volume imenso de informação.
No caso do genoma humano, o “receituário” de todas as nossas características físicas está descrito em três bilhões de pares de bases nitrogenadas, estas representadas por quatro letras — C (citosina), G (guanina), A (adenina) e T (timina), os blocos que compõem a fita do DNA.
Entender o genoma e a função dos genes (uma sequência específica do DNA que contém a informação para fabricação de uma proteína ou uma molécula de RNA — o que os biólogos chamam de “produto funcional específico”) pode auxiliar na prevenção de doenças, no desenvolvimento de medicamentos e terapias.
Também tem uma larga aplicação na agricultura e pecuária, no melhoramento genético de plantas e animais, e tem se mostrado um ingrediente fundamental no combate à pandemia. O “retrato” do vírus obtido pelo sequenciamento genético permite entender como ele funciona e como se propaga — informações fundamentais para subsidiarem a tomada de decisão das autoridades de saúde.
‘Ciência do século 21’
Ana Tereza começou a trabalhar no LNCC em 1984, um ano depois de se formar em Ciências Biológicas, para atuar com modelagem matemática. Nessa época, o laboratório ainda estava na cidade do Rio — desde 1998 ele funciona em Petrópolis (RJ).
O trabalho naquela época era completamente diferente, já que a Ciência nem havia codificado o primeiro genoma completo ainda, apenas fragmentos sequenciais de DNA.
O primeiro genoma completo viria em1995, o da bactéria Haemophilus influenzae, sequenciado nos Estados Unidos. Relativamente pequeno, tinha pouco mais de 5% do tamanho do genoma humano, que seria decodificado cinco anos mais tarde, no ano 2000, pelo geneticista americano Craig Venter.
A bióloga entrou nesse mundo pouco depois de ingressar no LNCC, quando seu caminho se cruzou com o do cientista Darcy Fontoura de Almeida, precursor na área de genética no país e àquela altura um nome conhecido na comunidade científica brasileira.
Formado em Medicina, ele fora orientado por Carlos Chagas Filho, fundador do Instituto de Biofísica da UFRJ (à época, Universidade do Brasil) e um dos que contribuíram para institucionalizar a pesquisa científica no país.
Em uma entrevista em 2009 à revista Ciência Hoje, Almeida, falecido em 2014, explica como foi parar no LNCC:
“Por volta de 1989, concluí que a análise de DNA ia evoluir e explodir. Era lógico, óbvio. No IB [Instituto de Biofísica] não poderíamos fazer isso, pois precisaríamos de uma computação poderosa. Lembrei-me então do LNCC e fui falar com o Antônio Olinto, que à época era o diretor. Expliquei o que estava acontecendo na biologia e disse que achava um absurdo não haver ali uma única linha de pesquisa em biologia, ‘a ciência do século 21’. Ele quis saber então o que poderia ser feito. Disse que queria conversar com o pessoal jovem do LNCC.”
O “pessoal jovem” era Ana Tereza. Ela e Darcy passaram então a trabalhar juntos. O cientista foi seu orientador no mestrado em biofísica e no doutorado em genética.
Naquela época, a internet não havia chegado ainda ao Brasil. O computador que a dupla usava era um mainframe, uma máquina de grande porte, e as informações eram compartilhadas entre os cientistas por meio de disquetes.
“O professor Darcy tinha assinatura do GenBank [banco de dados público de sequências criado em 1982 nos EUA] e, como não tinha internet, a gente recebia tudo pelo correio, naqueles disquetes grandes. E o arquivo não vinha em texto, tinha que programar pra extrair as informações.”
Por volta de 1998, ela conta, começaram a chegar ao país sequenciadores genéticos mais potentes, capazes de sequenciar fragmentos maiores de genoma.
Foi aí que teve início o primeiro projeto nacional de sequenciamento de genoma de um organismo, em que Ana Tereza organizou a formação de uma “rede do genoma nacional”, com a capacitação de 25 laboratórios em 15 Estados.
O primeiro organismo sequenciado foi a Chromobacterium violaceum, bactéria encontrada em regiões tropicais e subtropicais e que vive nas águas ácidas do rio Negro, no Amazonas. Ela é até hoje estudada no Brasil e lá fora por seu potencial biotecnológico, com possíveis aplicações em medicamentos e cosméticos.
O projeto genoma nacional ajudou a capacitar grupos em diferentes regiões do país e a formar recursos humanos que contribuiriam para descentralizar a pesquisa em bioinformática no país.
A primeira pós-graduação na área foi criada pela Capes em 2003. Hoje há cursos em instituições como Fiocruz, Universidade de São Paulo (USP), Universidade Federal de Minas Gerais (UFMG), Universidade Federal do Paraná (UFPR) e, mais recentemente, na Universidade Federal do Rio Grande do Norte (UFRN).
Força-tarefa contra o Sars-CoV-2
Desde então, os cientistas trabalham em rede e compartilham informações entre si, o que tem ajudado na atual crise sanitária. Um estudo publicado em setembro do ano passado na revista Science analisando a evolução da pandemia de covid-19 no Brasil é assinado por pesquisadores das mais diversas instituições, inclusive do LNCC.
A bioinformática e a genética têm tido papel importante nos esforços contra o novo coronavírus.
Graças aos avanços nessas áreas, cientistas de todo o mundo já compartilharam mais de 700 mil genomas do Sars-Cov-2, disponíveis na plataforma pública Gisaid.
Essa escala sem precedentes tem permitido ao planeta entender a disseminação do vírus e acompanhar as mutações que ele tem acumulado à medida que se espalha pelo globo. É quase como assistir à evolução em tempo real.
Algumas dessas variantes, como a encontrada em janeiro em Manaus e batizada de P.1, preocupam porque podem estar ligadas a um aumento da transmissibilidade do vírus. A cepa identificada no Amazonas tem duas mutações — a N501Y e E484K — localizadas em genes que codificam a espícula, a proteína responsável por interagir com a célula do hospedeiro, e que, na prática, facilita a entrada do coronavírus nas células humanas.
A P.2, encontrada no Rio de Janeiro pela equipe coordenada por Ana Tereza, que conta com cerca de 25 pessoas, também apresenta a mutação E484K — estudos têm apontado que ela pode driblar a ação de anticorpos.
Antes de ser aplicado nos esforços contra a covid-19, o supercomputador Santos Dumont já foi usado para estudar os vírus que causam a dengue e a zika. Ele é utilizado não apenas pelo laboratório de bioinformática, mas também por outras especialidades — e está aberto a toda a comunidade científica brasileira.
Ana Tereza diz que seu laboratório tem hoje entre 15 e 20 projetos simultâneos em andamento. Um deles, mais recente, visa entender porque algumas pessoas têm manifestações mais graves da covid-19. Para isso, a equipe vai começar a sequenciar DNA de pacientes, e não apenas o material genético do vírus.
“Precisamos entender a resposta imune do hospedeiro, a carga genética do paciente.”
“A gente vê casos em que um casal vive junto, mas apenas um desenvolve a doença”, exemplifica.
Fazer Ciência no Brasil
Ana Tereza participou da criação e foi a primeira presidente da Associação Brasileira de Bioinformática e Biologia Computacional (AB3C) e foi membro do conselho da Sociedade Brasileira para o Progresso da Ciência entre 2015 e 2019.
Para ela, um dos aspectos mais difíceis de ser pesquisador no Brasil são os repentinos e frequentes cortes no financiamento da Ciência no país.
“É um horror a gente não ter continuidade de trabalho, não saber se no próximo ano vai ter o mesmo edital para pedir financiamento para a pesquisa. As coisas são muito instáveis”, afirma.
“Tem picos em que há investimentos em laboratório, mas depois não tem material de consumo, de bancada. Ou não tem aluno porque as bolsas estão cortadas. Quem sobrevive na pesquisa no Brasil são heróis, estão ali por uma causa em que acreditam.”
Desde 2016, segundo ela, a área de genômica vem sofrendo sucessivas restrições de recursos. E os cortes recentes no orçamento da Ciência e Tecnologia só agravaram o problema.
Como o Brasil não produz os insumos usados na pesquisa (os reagentes usados no sequenciamento genético, por exemplo, são todos importados), fica refém das flutuações cambiais — em um momento como o atual, em que o dólar custa cerca de R$ 5,60, fazer ciência custa ainda mais caro.
O quadro é agravado pela redução de bolsas de pesquisa, de mestrado e doutorado, de concursos para novos professores, o que tem cada vez mais estimulado cientistas brasileiros a buscarem melhores condições de trabalho em outros países, a famosa “fuga de cérebros”.
“O Brasil investe muito na formação, tem uma formação de recursos humanos muito boa, e depois não cria condições propícias para que os alunos fiquem aqui.”
Crédito: Camilla Veras Mota / BBC News Brasil – @internet 10/03/2021