Análise da proteína spike do sars-cov-2 utilizando o algoritmo CBUC

dc.contributor.advisorRestovic, Maria Inés Valderrama
dc.contributor.authorNascimento Júnior, Cândido Luiz do
dc.contributor.refereeSuárez, Diego Gervasio Frías
dc.contributor.refereeLenz, Alexandre
dc.date.accessioned2024-11-04T13:23:52Z
dc.date.available2024-11-04T13:23:52Z
dc.date.issued2021-07-12
dc.description.abstractAs árvores filogenéticas têm um papel importante na biologia moderna porque elas provêm uma maneira concisa de visualizar a evolução dos descendentes partindo de ancestrais comuns. Durante a evolução da linhagem de um organismo os descendentes podem se divergir e “separar”, esses eventos são conhecidos como cladogênese, no qual se refere a origem de um novo ramo. Um clado é um pedaço de uma árvore filogenética que contém uma linhagem ancestral e todos os descendentes dessa linhagem. Os clados formados em uma árvore filogenética nos passam uma importante informação sobre os agrupamentos das sequências. O procedimento de classificação feito atualmente pode levar muito tempo. O algoritmo CBUC - Codon Based Unsupervised Classification, inicialmente implementado em Scilab pelo Prof. Dr. Diego Gervasio Frías Suárez, nesse trabalho foi implementado em Python, consegue genotipar as sequências e encontrar agrupamentos. O SARS-CoV-2 - Severe Acute Respiratory Syndrome Coronavirus 2, vírus causador da doença COVID-19 - Coronavirus Disease-2019, é um vírus altamente transmissível e se espalhou rapidamente pelo mundo, escalando de um surto para uma pandemia. O objetivo geral deste trabalho compreende a análise da proteína spike do SARS-CoV-2 utilizando o algoritmo CBUC e confrontar os agrupamentos gerados pelo CBUC com os agrupamentos gerados pelo método Maximum Likelihood. Nesse trabalho também foi desenvolvida uma ferramenta para a coleta das sequências que foram analisadas pelas implementações do CBUC. Os resultados da implementação em Python conseguiram encontrar agrupamentos coerentes com a árvore filogenética em um curto período de tempo e indica que a proposta do CBUC é promissora em genotipagem de sequências genéticas.
dc.description.abstract2Phylogenetic trees play an important role in modern biology because they provide a concise way to visualize evolution as descendants from common ancestors. During evolution, evolutionary lineages may diverge and “split”, these events are known as cladogenesis, which refers to the origin of a new branch. A clade is a piece of a phylogenetic tree that includes an ancestral lineage and all descendants of that lineage. The clades formed in a phylogenetic tree provide us an important information about the grouped sequences. Current used methods of classification may take a lot of time. The CBUC - Codon Based Unsupervised Classification algorithm, initially implemented in Scilab by Prof. Dr. Diego Gervasio Frías Suárez, in this work, implemented in Python, it manages to genotype sequences and find clusters. SARS-CoV-2 - Severe Acute Respiratory Syndrome Coronavirus 2, the organism that causes COVID-19 - Coronavirus Disease2019, is a highly transmissible virus that has spread rapidly around the world, escalating from an outbreak to a pandemic. The general objective of this work comprises the analysis of the spike protein of SARS-CoV-2 using the CBUC algorithm and confronting the clusters generated by CBUC with the clusters generated by the Maximum Likelihood method. In this work, a tool was also developed to collect the sequences that were analyzed by the CBUC implementations. The results of the Python implementation were able to find clusters consistent with the phylogenetic tree in a short period of time and indicate that the CBUC proposal is promising in genotyping genetic sequences.
dc.format.mimetypeapplication/pdf
dc.identifier.citationNASCIMENTO JÚNIOR, Cândido Luiz do. Análise da proteína spike do sars-cov-2 utilizando o algoritmo CBUC. 2021. 60 f.Trabalho de conclusão de curso (Bacharelado em Sistemas de Informação) - Departamento de Ciências Exatas e da Terra, Campus I, Universidade do Estado da Bahia. Salvador- BA, 2021.
dc.identifier.urihttps://saberaberto.uneb.br/handle/20.500.11896/6573
dc.language.isopor
dc.publisherUniversidade do Estado da Bahia
dc.publisher.programGraduação
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.rights2Attribution 3.0 Brazilen
dc.subject.keywordsBioinformática
dc.subject.keywordsSARS-CoV-2
dc.subject.keywordsÁrvore Filogenética
dc.subject.keywordsCodon Based Unsupervised Classification.
dc.titleAnálise da proteína spike do sars-cov-2 utilizando o algoritmo CBUC
dc.title.alternativeAnalysis of the sars-cov-2 spike protein using the CBUC algorithm
dc.typeinfo:eu-repo/semantics/bachelorThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Análise da proteína spike_Cândido Nascimento Júnior.pdf
Tamanho:
2.04 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
462 B
Formato:
Item-specific license agreed upon to submission
Descrição: