Estudo de viabilidade do algoritmo Codon Based Unsupervised Classifications (CBUC)
Data
Autores
Orientador
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Este trabalho validou o algoritmo CBUC para identificação de sequências de arbovírus, com ênfase no vírus Zika. Desenvolvido pelo Dr. Diego Gervásio Frias Suaréz, o CBUC utiliza aprendizado de máquina baseado no algoritmo PSRM para detectar padrões e agrupamentos genéticos. Utilizou-se um dataset do ABVdb contendo sequências genotipadas de Zika para agrupar genótipos de arbovírus e identificar novas sequências do Zika. Foram desenvolvidas duas interfaces, uma desktop e outra web, para uso do CBUC. Os resultados mostraram que o CBUC identificou 100% das sequências completas de até 8000 bases no dataset de teste, sugerindo sua eficácia na identificação de sequências completas do vírus Zika quando de tamanho similar às utilizadas no treinamento. Para avaliação da precisão, os resultados do CBUC foram comparados com os do Genome Detective, uma ferramenta que emprega métodos tradicionais. A comparação demonstrou que o CBUC apresenta resultados promissores e competitivos na identificação precisa de genótipos do Zika