Cientistas utilizaram inteligência artificial para descobrir novos vírus
Pesquisadores usaram inteligência artificial (IA) para descobrir cerca de 6.000 espécies de vírus antes desconhecidas. O trabalho, apresentado no dia 15 de março em uma reunião organizada pelo Departamento de Energia dos EUA (DOE) e explicado na revista Nature, ilustra uma ferramenta emergente para explorar a enorme e desconhecida diversidade de vírus na Terra.
Embora os vírus influenciem tudo, desde a saúde humana até a degradação do lixo, eles são difíceis de estudar. Os cientistas não conseguem cultivar a maioria dos vírus no laboratório, e tentativas de identificar suas sequências genéticas são muitas vezes frustradas porque seus genomas são minúsculos e evoluem rapidamente.
Nos últimos anos, os pesquisadores caçaram vírus desconhecidos, sequenciando o DNA em amostras retiradas de vários ambientes. Para identificar os micróbios presentes, os pesquisadores buscam as assinaturas genéticas de vírus e bactérias conhecidos - assim como a função "encontrar" de um processador de textos realça palavras contendo letras específicas em um documento. Mas esse método geralmente falha, porque os virologistas não podem procurar o que não sabem. Uma forma de IA chamada de "machine learning" contorna esse problema porque pode encontrar padrões emergentes em montanhas de informação. Algoritmos de machine learning analisam dados, aprendem com eles e então classificam as informações de forma autônoma.
"Antes, as pessoas não tinham um método para estudar bem os vírus", diz Jie Ren, biólogo computacional da Universidade do Sul da Califórnia, em Los Angeles. "Mas agora temos ferramentas para encontrá-los."
Para o último estudo, Simon Roux, um biólogo computacional do DOE Joint Genome Institute (JGI) em Walnut Creek, Califórnia, treinou computadores para identificar as sequências genéticas de vírus de uma família incomum, Inoviridae. Esses vírus vivem em bactérias e alteram o comportamento de seus hospedeiros: por exemplo, eles tornam as bactérias causadoras da cólera, Vibrio cholerae, mais tóxicas. Mas Roux, que apresentou seu trabalho na reunião em São Francisco, Califórnia, organizada pelo JGI, estima que menos de 100 espécies foram identificadas antes de sua pesquisa começar.
Roux apresentou um algoritmo de machine learning com dois conjuntos de dados - um contendo 805 sequências genômicas de Inoviridae conhecido, e outro com cerca de 2.000 sequências de bactérias e outros tipos de vírus - de modo que o algoritmo pudesse encontrar formas de distinguir entre eles.
Em seguida, Roux alimentou o modelo de conjuntos de dados metagenômicos em massa. O computador recuperou mais de 10.000 genomas de Inoviridae e agrupou-os em grupos indicativos de diferentes espécies. A variação genética entre alguns desses grupos era tão grande que Inoviridae é provavelmente muitas famílias, disse ele.
Aprendizagem viral
Em um estudo separado, Deyvid Amgarten, bioinformático da Universidade de São Paulo, implantou machine learning para encontrar vírus em pilhas de compostagem no zoológico da cidade. Ele programou seu algoritmo para procurar algumas características distintivas dos genomas de vírus, como a densidade de genes em filamentos de DNA de um determinado comprimento. Após o treinamento, o computador recuperou vários genomas que parecem ser novos, diz Amgarten, que apresentou seus resultados na reunião do JGI. O passo final será aprender quais proteínas esses vírus produzem e ver se algum deles acelera a taxa de decomposição da matéria orgânica. "Queremos melhorar a eficiência da compostagem", diz ele.
Amgarten seguiu sua sugestão de uma ferramenta de aprendizado de máquina relatada no ano passado, chamada VirFinder , da equipe de Ren. O VirFinder é programado para notar combinações de letras de DNA, como AT ou CG, em fitas de DNA. Ren aplicou o algoritmo a amostras metagenômicas de fezes de pessoas saudáveis e com cirrose hepática, uma condição causada por doenças que variam de hepatite a alcoolismo crônico. Uma vez que a máquina classificou grupos de vírus nas amostras, a equipe notou que tipos particulares eram mais ou menos comuns em pessoas saudáveis em comparação àqueles com cirrose - sugerindo que alguns vírus podem ter um papel na doença.
Pesquisadores biomédicos há muito tempo se perguntam se os vírus contribuem para os sintomas de várias condições ilusórias, como a síndrome da fadiga crônica (também conhecida como encefalomielite miálgica) e a doença inflamatória intestinal. Derya Unutmaz, imunologista do Laboratório Jackson de Medicina Genômica em Farmington, Connecticut, especula que o vírus pode desencadear uma reação inflamatória destrutiva - ou pode modificar o comportamento das bactérias no microbioma de uma pessoa, o que pode desestabilizar o metabolismo e o sistema imunológico .
Com o machine learning, diz Unutmaz, os pesquisadores podem identificar vírus em pacientes que permaneceram ocultos. Além disso, como a IA tem a capacidade de encontrar padrões em conjuntos de dados massivos, diz ele, a abordagem pode conectar dados sobre vírus a bactérias e depois a mudanças de proteínas em pessoas com sintomas. Unutmaz diz: “O aprendizado de máquina pode revelar conhecimento sobre o qual nem pensamos”.