Aplicação de self-querying para filtragem dinâmica de metadados em sistemas de busca híbrido acadêmico

dc.contributor.advisorJorge, Eduardo Manuel de Freitas
dc.contributor.authorSeger, Eduardo Ikeda
dc.contributor.refereeMascarenhas, Ana Patrícia Fontes Magalhães
dc.contributor.refereeCardoso, Hugo Saba Pereira
dc.date.accessioned2025-12-16T14:42:04Z
dc.date.available2025-12-16T14:42:04Z
dc.date.issued2025-12-10
dc.description.abstractOs sistemas de busca acadêmica tradicionais, que implementam filtros no fluxo da busca, frequentemente enfrentam desafios significativos de manutenibilidade e evolução, principalmente devido à lógica de filtragem de metadados ser rigidamente acoplada ao código fonte. Este trabalho investiga e propõe uma arquitetura de software que utiliza Large Language Models (LLMs) com a técnica de self-querying para desacoplar essa lógica. A abordagem permite a realização de uma busca híbrida e a tradução de consultas em linguagem natural, que incluem filtros complexos, em requisições estruturadas para bancos de dados vetoriais de forma dinâmica e autônoma. Adotando a metodologia Design Science Research, foi desenvolvido um artefato computacional que realiza buscas de publicações acadêmicas em uma base de dados de pesquisadores vinculados ao Grupo de pesquisa: Núcleo de Pesquisa Aplicada e Inovação. Para validação, foi feita a comparação entre o artefato desenvolvido e o sistema do Sistema de Mapeamento de Competências Científicas (SIMCC) por meio de duas etapas. A primeira é uma análise quantitativa por métricas como: linhas de código e complexidade ciclomática e a análise qualitativa verificando questões como a coesão e acoplamento dos métodos e classes envolvidas na busca desses dois sistemas. Na segunda parte, foi realizada uma simulação de 2 cenários de implementação para verificar como ambos os sistemas se comportam diante de manutenções e evoluções. Os resultados da validação evidenciaram que a arquitetura self-query conseguiu promover maior manutenibilidade no sistema sem adicionar complexidade ciclomática durante as simulações, contribuindo com um modelo de software mais sustentável e adaptável para sistemas acadêmicos de recuperação de informação.
dc.description.abstract2Traditional academic search systems that implement in-stream search filters often face significant maintainability and evolution challenges, primarily because the metadata filtering logic is rigidly coupled with the source code. This work investigates and proposes a software architecture that utilizes Large Language Models (LLMs) with the self-querying technique to decouple this logic. The approach enables hybrid search and the translation of natural language queries, including complex filters, into structured requests for vector databases dynamically and autonomously. Adopting the Design Science Research methodology, a computational artifact was developed to search for academic publications in a database of researchers affiliated with the Núcleo de Pesquisa Aplicada e Inovação (NPAI - Center for applied research and innovation) Research Group. For validation, a two-stage comparison was conducted between the developed artifact and the existing Sistema de Mapeamento de Competências Científicas (SIMCC - Scientific Competency Mapping System) system. The first stage involved a quantitative analysis using metrics such as lines of code and cyclomatic complexity, and a qualitative analysis examining the cohesion and coupling of the methods and classes involved in the search functionality of both systems. In the second stage, a simulation of two implementation scenarios was conducted to observe how both systems behave when facing maintenance and evolution tasks. The validation results demonstrated that the self-querying architecture successfully enhanced system maintainability without increasing cyclomatic complexity during the simulations, contributing to a more sustainable and adaptable software model for academic information retrieval systems. Keywords: Large Language Models. Software Maintainability. Software Architecture. Information Retrieval.
dc.format.mimetypeapplication/pdf
dc.identifier.citationSEGER, Eduardo Ikeda. Aplicação de self-querying para filtragem dinâmica de metadados em sistemas de busca híbrido acadêmico. Orientador: Eduardo Manuel de Freitas Jorge. 2025. 79f. Trabalho de conclusão de curso (Bacharelado em Sistema de informação) – Departamento de Ciências Exatas e da terra, Campus I, Universidade do Estado da Bahia, Salvador - BA, 2025
dc.identifier.urihttps://saberaberto.uneb.br/handle/20.500.11896/10232
dc.language.isopor
dc.publisherUniversidade do Estado da Bahia
dc.publisher.programColegiado de Sistema de Informação
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc/3.0/br/
dc.rights2Attribution-NonCommercial 3.0 Brazilen
dc.subject.keywordsLarge Language Models
dc.subject.keywordsManutenibilidade de Software
dc.subject.keywordsArquitetura de Software
dc.subject.keywordsRecuperação de Informação
dc.titleAplicação de self-querying para filtragem dinâmica de metadados em sistemas de busca híbrido acadêmico
dc.title.alternativeApplication of self-querying for dynamic metadata filtering in academic hybrid search systems
dc.typeinfo:eu-repo/semantics/bachelorThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Aplicação de self-querying para filtragem_Eduardo Seger
Tamanho:
2.72 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
462 B
Formato:
Item-specific license agreed upon to submission
Descrição: