Estudo de viabilidade do algoritmo Codon Based Unsupervised Classifications (CBUC)

dc.contributor.advisorRestovic, Maria Inês Valderrama
dc.contributor.authorSilva, Rickson
dc.contributor.refereeSuaréz, Diego Gervásio Frias
dc.contributor.refereeFonseca, Vagner de Souza
dc.date.accessioned2024-07-15T13:44:56Z
dc.date.available2024-07-15T13:44:56Z
dc.date.issued2024-07-09
dc.description.abstractEste trabalho validou o algoritmo CBUC para identificação de sequências de arbovírus, com ênfase no vírus Zika. Desenvolvido pelo Dr. Diego Gervásio Frias Suaréz, o CBUC utiliza aprendizado de máquina baseado no algoritmo PSRM para detectar padrões e agrupamentos genéticos. Utilizou-se um dataset do ABVdb contendo sequências genotipadas de Zika para agrupar genótipos de arbovírus e identificar novas sequências do Zika. Foram desenvolvidas duas interfaces, uma desktop e outra web, para uso do CBUC. Os resultados mostraram que o CBUC identificou 100% das sequências completas de até 8000 bases no dataset de teste, sugerindo sua eficácia na identificação de sequências completas do vírus Zika quando de tamanho similar às utilizadas no treinamento. Para avaliação da precisão, os resultados do CBUC foram comparados com os do Genome Detective, uma ferramenta que emprega métodos tradicionais. A comparação demonstrou que o CBUC apresenta resultados promissores e competitivos na identificação precisa de genótipos do Zika
dc.description.abstract2This study validated the CBUC algorithm for arbovirus sequence identification, focusing on the Zika virus. Developed by Dr. Diego Gervásio Frias Suaréz, CBUC employs machine learning based on the PSRM algorithm to detect genetic patterns and clusters. A dataset from ABVdb containing Zika genotyped sequences was used to cluster arbovirus genotypes and identify new Zika sequences. Two interfaces, a desktop and a web version, were developed for CBUC usage. Results demonstrated that CBUC identified 100% of complete sequences up to 8000 bases in the test dataset, suggesting its effectiveness in identifying complete Zika virus sequences of similar length to those used in training. To assess its accuracy, CBUC results were compared with those from Genome Detective, a tool utilizing traditional methods. The comparison showed that CBUC delivers promising and competitive outcomes in precise Zika genotype identification.
dc.format.mimetypeapplication/pdf
dc.identifier.citationRESTOVIC, Maria Inês Valderrama. Estudo de viabilidade do algoritmo Codon Based Unsupervised Classification (CBUC). Orientadora: Maria Inês Valderrama Restovic. 2024. 50fls. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Departamento de Ciências Exatas, Campus I, Universidade do Estado da Bahia. Salvador-BA, 2024.
dc.identifier.urihttps://saberaberto.uneb.br/handle/20.500.11896/5686
dc.language.isopor
dc.publisherUniversidade do Estado da Bahia
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.rights2Attribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.subject.keywordsBioinformatica
dc.subject.keywordsArbovírus
dc.subject.keywordsGenotipagem
dc.subject.keywordsFilogenia
dc.titleEstudo de viabilidade do algoritmo Codon Based Unsupervised Classifications (CBUC)
dc.title.alternativeFeasibility Study of the Codon Based Unsupervised Classifications (CBUC) Algorithm
dc.typeinfo:eu-repo/semantics/bachelorThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Estudo de viabilidade do algoritmo_Rickson da Silva.pdf
Tamanho:
848.65 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
462 B
Formato:
Item-specific license agreed upon to submission
Descrição: