Bacharelado em Sistemas de Informação - DCET1
URI Permanente para esta coleção
Navegar
Navegando Bacharelado em Sistemas de Informação - DCET1 por Orientador "Restovic, Maria Ines Valderrama"
Agora exibindo 1 - 12 de 12
Resultados por página
Opções de Ordenação
- ItemAnálise comparativa de containers para ferramentas de alinhamento de bioinformática(Universidade do Estado da Bahia, 2023-12-14) Britto, Murilo Batista Improta; Restovic, Maria Ines Valderrama; Atta, Antônio Carlos Fontes; Mascarenhas, Ana Patrícia Fontes MagalhãesÀ medida que o poder computacional aumenta e se torna mais acessível, a era da bioinformática acelera a nossa capacidade de entender e enfrentar os desafios que o grande volume de dados gerados por áreas como genética e epidemiologia impõem. Várias promessas já estão surgindo, afinal a bioinformática é um campo extremamente vasto que combina diversas áreas como matemática, estatística, ciência da computação e biologia para a condução de análises de dados. No entanto nota-se uma carência muito grande de estudos comparativos entre ambientes de virtualização para ferramentas de bioinformática. Este trabalho tem como proposta um estudo analítico entre as principais ferramentas de containers da atualidade e como as ferramentas de alinhamento de alto nível de processamento impactam sobre esses ambientes. Foram comparados os containers docker e singularity com base nas métricas de tempo de execução, máximo de utilização de recursos por núcleo de cpu, média de utilização por núcleo de cpu e, gasto médio de memória do sistema durante o período de execução das ferramentas. Concluiu-se com este trabalho que ambos os containers possuem diferenças mínimas mas que, não alteram os resultados de maneira significativa, correspondendo a menos de um porcento, sendo as maiores diferenças registradas, entre os algoritmos escolhidos entre as ferramentas de alinhamento.
- ItemAnálise comparativa do desempenho de técnicas de data mining com atríbutos mistos sob uma base de dados epdemiológica(Universidade do Estado da Bahia, 2020-03-19) Conceição, Fábio Ramos da Silva; Restovic, Maria Ines Valderrama; Suárez, Diego Gervasio Frías; Araujo, Murilo Freire OliveiraA maioria dos algoritmos não conseguem trabalhar com Datasets de tipo misto. Esse problema perpassa um contexto, ao qual a massiva produção de dados é nutrida de muitas informações, a quais são definidas por dados tanto numéricos quanto categóricos. Essa realidade induz às técnicas de mineração a realizar a conversão para um único tipo de dado, o problema desta conversão remete a perda de sua consistência. A fim de propor algoritmos consistentes e bem avaliados, este trabalho tem por objetivo analisar o desempenho de algoritmos de mineração para o tratamento de dados mistos utilizando uma base de dados de epidemiologia molecular. Dessa forma, será possível eleger qual técnica apresentou o melhor desempenho. No desenvolvimento da pesquisa foram implementados três algoritmos com base nas fundamentações teóricas fornecidas pelos autores Huang (1997) e Cao et al. (2012). Além disso, realizou-se todo o processo de tratamento de dados respaldado pelo processo de descoberta de conhecimento nas bases de dados descritos por Camilo e Silva (2009). O procedimento de análise do desempenho dos algoritmos foi feito com base na aplicação de três métricas avaliativas que foram citadas por Szepannek (2019), sendo elas: Índice de Jaccard, F-Measure e Índice de Rand Ajustado
- ItemAnálise da epidemiologia molecular do vírus chikungunya relacionando as variáveis socioeconômicas e sintomatológicas utilizando o k-prototype(UNEB, 2021-07-12) Furtado, Filipe Bomfim Santos; Restovic, Maria Ines ValderramaEsta monografia apresenta uma metodologia que utiliza conceitos e ferramentas de Data Science para analisar casos confirmados do vírus Chikungunya em um banco de dados de epidemiologia molecular entre o período de 2004 a 2018. O objetivo do projeto é relacionar variáveis em torno deste arbovírus, como os genótipos e a variedade dos seus sintomas, com fatores socioeconômicos das nações onde as ocorrências foram registradas. O Data Mining é uma das abordagens do Data Science, e fornece métodos como a clusterização, que pode agrupar conjuntos de dados que possuem características semelhantes. Os algoritmos k-means e k-prototype oferecem os recursos necessários para o estabelecimento destas relações. Após o levantamento dos resultados, a informação será mostrada de forma visual e o conhecimento obtido após o projeto será registrado.
- ItemAnálise da proteína spike do sars-cov-2 utilizando o algoritmo CBUC(Universidade do Estado da Bahia, 2021-07-12) Nascimento Júnior, Cândido Luiz do; Restovic, Maria Ines Valderrama; Suárez, Diego Gervasio Frías; Lenz, Alexandre RafaelAs árvores filogenéticas têm um papel importante na biologia moderna porque elas provêm uma maneira concisa de visualizar a evolução dos descendentes partindo de ancestrais comuns. Durante a evolução da linhagem de um organismo os descendentes podem se divergir e “separar”, esses eventos são conhecidos como cladogênese, no qual se refere a origem de um novo ramo. Um clado é um pedaço de uma árvore filogenética que contém uma linhagem ancestral e todos os descendentes dessa linhagem. Os clados formados em uma árvore filogenética nos passam uma importante informação sobre os agrupamentos das sequências. O procedimento de classificação feito atualmente pode levar muito tempo. O algoritmo CBUC - Codon Based Unsupervised Classification, inicialmente implementado em Scilab pelo Prof. Dr. Diego Gervasio Frías Suárez, nesse trabalho foi implementado em Python, consegue genotipar as sequências e encontrar agrupamentos. O SARS-CoV-2 - Severe Acute Respiratory Syndrome Coronavirus 2, vírus causador da doença COVID-19 - Coronavirus Disease-2019, é um vírus altamente transmissível e se espalhou rapidamente pelo mundo, escalando de um surto para uma pandemia. O objetivo geral deste trabalho compreende a análise da proteína spike do SARS-CoV-2 utilizando o algoritmo CBUC e confrontar os agrupamentos gerados pelo CBUC com os agrupamentos gerados pelo método Maximum Likelihood. Nesse trabalho também foi desenvolvida uma ferramenta para a coleta das sequências que foram analisadas pelas implementações do CBUC. Os resultados da implementação em Python conseguiram encontrar agrupamentos coerentes com a árvore filogenética em um curto período de tempo e indica que a proposta do CBUC é promissora em genotipagem de sequências genéticas.
- ItemAnálise do algoritmo Random Forest na classificação de sintomas das doenças arbovirais(Universidade do Estado da Bahia, 2022-07-01) Santos, Diego dos; Restovic, Maria Ines Valderrama; Suárez, Diego Gervasio Frías; Atta, Antônio Carlos FontesAs mudanças climáticas provocadas pelo aquecimento global aumentam a temperatura do planeta, beneficiando a proliferação dos vírus. Os mosquitos Aedes Aegypti e Aedes Albopictus são os principais transmissores de arbovírus, especificamente dos vírus da dengue (DENV) e vírus da chikungunya (CHIKV). Os pacientes infectados por essas arboviroses apresentam sintomas semelhantes que dificultam o trabalho inicial do diagnóstico médico. A integração da tecnologia na área médica traz uma série de benefícios, desde o atendimento médico até em momentos cirúrgicos. A introdução do aprendizado de máquina vem crescendo em termos de relevância nos últimos anos, graças à quantidade massiva de dados gerados. Vários algoritmos são analisados e comparados para identificar padrões e correlações com dados das arboviroses. O uso do Random Forest (RF) para o entendimento das arboviroses está em fase inicial e não foi utilizado em uma análise conjunta com DENV e CHIKV. De todo modo, os estudos na sua maior parte são executados de forma isolada com DENV. As características do algoritmo RF chamam bastante atenção por resolver problemas comuns dos algoritmos de aprendizado de máquina, com a criação de árvores de decisão que trabalham de forma isolada, mas têm fator decisivo no resultado final do modelo, além do seu processo de aleatoriedade das amostras para gerar as árvores de decisão. Neste estudo foi desenvolvido um modelo classificador com a RF que apresentou comportamento muito sensível em relação ao conjunto de dados, onde os rótulos imprecisos reduziram as métricas de desempenho. Os ajustes realizados inicialmente com o conjunto de dados, demonstraram evolução nas métricas de desempenho. Outras características marcantes foram: o alto consumo de recursos computacionais e o curto tempo de treinamento para obter um modelo. No primeiro momento, o modelo teve uma acurácia de 59%, mas com todos os ajustes realizados durante o desenvolvimento, obteve-se 76% de acurácia no classificador final. Apesar do resultado geral, as métricas de desempenho foram melhores para CHIKV, pois os sintomas característicos foram presentes em muitas amostras de pacientes rotulados por esse arbovírus.
- ItemArbominer: uma ferramenta de extração e mineração de texto para arbovírus(Universidade do Estado da Bahia, 2020-03-11) Santos, Wellington Correia dos; Restovic, Maria Ines Valderrama; Suárez, Diego Gervasio Frías; Oliveira, Murilo FreireOs arbovírus dengue, zika e chikungunya representam uma grande ameaça à saúde humana. Mudanças climáticas, ambientais em conjunto com o desmatamento florestal, favorecem a disseminação e transmissão dos vírus nas regiões subtropicais. Esses vírus têm evoluído através do tempo, progressivamente em linhagens mais complexas e virulentas. Ferramentas que permitam reunir todas as informações relacionadas para o estudo destes vírus são fundamentais para a bioinformática. Este trabalho consiste em pesquisa e desenvolvimento um minerador de textos científicos que permita extrair as informações clinicas, epidemiológicas e genéticas dos arbovírus dengue, zika e chikungunya dos bancos de dados do National Institute of Health, USA (NIH), com objetivo de popular o banco de dados de epidemiologia molecular Arthropode Borne Virus Database (ABVdb) com o maior número de informações que permitam aos pesquisadores realizar estudos de impacto populacional e vigilância epidemiológica entre outros, para melhor compreender a evolução destas arboviroses
- ItemDesenho e análise de interfaces geográficas para representações de dados virais(Universidade do Estado da Bahia, 2023-07-12) Jesus, Eugênio Santos de; Restovic, Maria Ines Valderrama; Fonseca, Vagner de Souza; Massa, Mônica de SouzaEsta monografia descreve o desenvolvimento de um artefato de representação geográfica aprimorada no ABVdb, focado nos vírus dengue, zika e chikungunya. O trabalho envolveu a extração, processamento e apresentação de dados georreferenciados em uma interface web renovada, com destaque para a funcionalidade de exportação de metadados clusterizados conforme filtros específicos e regiões geográficas. A avaliação do projeto, realizada com base na metodologia Design Science Research, incluiu uma comparação com a versão anterior do ABVdb e a aplicação de um grupo focal de profissionais, juntamente com a avaliação da usabilidade da interface utilizando o questionário Post-Study System Usability Questionnaire (PSSUQ). O resultado é uma plataforma que oferece representações geográficas mais precisas e detalhadas, otimizadas conforme os feedbacks recebidos, e que contribui para uma representação geográfica mais precisa e detalhada dos dados virais no ABVdb
- ItemEstudo de viabilidade do algoritmo Codon Based Unsupervised Classifications (CBUC)(Universidade do Estado da Bahia, 2024-07-09) Silva, Rickson; Restovic, Maria Ines Valderrama; Suárez, Diego Gervasio Frías; Fonseca, Vagner de SouzaEste trabalho validou o algoritmo CBUC para identificação de sequências de arbovírus, com ênfase no vírus Zika. Desenvolvido pelo Dr. Diego Gervásio Frias Suaréz, o CBUC utiliza aprendizado de máquina baseado no algoritmo PSRM para detectar padrões e agrupamentos genéticos. Utilizou-se um dataset do ABVdb contendo sequências genotipadas de Zika para agrupar genótipos de arbovírus e identificar novas sequências do Zika. Foram desenvolvidas duas interfaces, uma desktop e outra web, para uso do CBUC. Os resultados mostraram que o CBUC identificou 100% das sequências completas de até 8000 bases no dataset de teste, sugerindo sua eficácia na identificação de sequências completas do vírus Zika quando de tamanho similar às utilizadas no treinamento. Para avaliação da precisão, os resultados do CBUC foram comparados com os do Genome Detective, uma ferramenta que emprega métodos tradicionais. A comparação demonstrou que o CBUC apresenta resultados promissores e competitivos na identificação precisa de genótipos do Zika
- ItemGamebook guardiões da floresta: Identificação de perfis de usuário através de mineração de dados(UNEB, 2018-07-06) Lima, Tarsis Nascimento; Restovic, Maria Ines Valderrama; Alves, Lynn Rosalina Gama; Correia, Leandro CoelhoEsta monografia relata a aplicação de mineração de dados através de um algoritmo de agrupamento a fim identificar a existência de perfis de usuário no Gamebook Guardiões da Floresta relacionados com funções executivas. Para tanto foi desenvolvido um sistema para coleta de informações das interações no Gamebook, utilizando medidas inspiradas em testes que verificam o controle inibitório, passando pela modelagem de um banco de dados e aplicação do processo de Knowledge Discovery in Databases para mineração.
- ItemMineração de dados educacionais na base de dados SAEB para suporte na tomada de decisão à educação básica(Universidade do Estado da Bahia, 2023-07-12) Almeida, Jeferson Santos de; Restovic, Maria Ines Valderrama; Chaves, Débora Alcina RegoEste trabalho propõe o desenvolvimento de um ambiente de experimentação acessível a educadores e gestores, que permita a extração de informações úteis para aprimorar a educação básica brasileira, com base nos dados do SAEB. A partir da coleta e tratamento dos dados SAEB 2019 e seguinte, foram implementadas técnicas de mineração de dados para extração de conhecimento desta base. A avaliação foi realizada a partir da análise preliminar da ferramenta com a participação de um grupo de educadores e gestores educacionais. O objetivo final foi disponibilizar um ambiente de experimentação com base nos feedbacks recebidos e contribuir para melhorias no sistema educacional brasileiro a partir do uso de tecnologias.
- ItemProxy reverso como serviço(UNEB, 2013-01-05) Guimarães, Daniele Santos; Restovic, Maria Ines Valderrama; Santos, Trícia Souto; Atta, Antônio Carlos FontesO trabalho a seguir tem o objetivo de apresentar uma solução de segurança para as empresas que possuem redes internas com servidores web conectados a Internet. Motivado pelo grande desprendimento de recursos humanos, altos investimentos em infraestrutura e considerável gasto de tempo com instalação, manutenção e automação de ambientes internos dentro da maioria das empresas, será implementado o Cloud Reverse, um proxy reverso como serviço, que tem o mesmo papel de um proxy reverso, mas apresenta características de computação em nuvens e portanto será utilizado como um serviço e não como um produto. Inicialmente é feito um estudo teórico dos temas envolvidos e depois é apresentada a documentação do Cloud Reverse, bem como resultado de testes e considerações relevantes.
- ItemTécnicas de análise de dados textuais em bases de dados científicos para coleta de metadados para os genomas presentes no ABVDB(Universidade do Estado da Bahia, 2023-12-06) Mercês, Ramon Campos; Restovic, Maria Ines Valderrama; Fonseca, Vagner de Souza; Suárez, Diego Gervasio FríasEsta monografia propõe o desenvolvimento de um artefato, criado no âmbito da metodologia Design Science Research (DSR), que emprega o modelo Bidirectional Encoder Representations from Transformers (BERT) para identificar e classificar quadros sintomatológicos em textos científicos disponíveis no PubMed. Este artefato é desenvolvido tendo como referência os sintomas fornecidos pelo ABVdb. A aplicação desta técnica visa facilitar o acesso e a compreensão de informações pertinentes ao estudo de arbovírus, contribuindo assim para avanços significativos na área da saúde pública. O objetivo central é validar a eficácia do modelo BERT na identificação e análise semântica de artigos científicos, estabelecendo correlações com sintomas específicos de arbovírus