Aplicação de self-querying para filtragem dinâmica de metadados em sistemas de busca híbrido acadêmico
| dc.contributor.advisor | Jorge, Eduardo Manuel de Freitas | |
| dc.contributor.author | Seger, Eduardo Ikeda | |
| dc.contributor.referee | Mascarenhas, Ana Patrícia Fontes Magalhães | |
| dc.contributor.referee | Cardoso, Hugo Saba Pereira | |
| dc.date.accessioned | 2025-12-16T14:42:04Z | |
| dc.date.available | 2025-12-16T14:42:04Z | |
| dc.date.issued | 2025-12-10 | |
| dc.description.abstract | Os sistemas de busca acadêmica tradicionais, que implementam filtros no fluxo da busca, frequentemente enfrentam desafios significativos de manutenibilidade e evolução, principalmente devido à lógica de filtragem de metadados ser rigidamente acoplada ao código fonte. Este trabalho investiga e propõe uma arquitetura de software que utiliza Large Language Models (LLMs) com a técnica de self-querying para desacoplar essa lógica. A abordagem permite a realização de uma busca híbrida e a tradução de consultas em linguagem natural, que incluem filtros complexos, em requisições estruturadas para bancos de dados vetoriais de forma dinâmica e autônoma. Adotando a metodologia Design Science Research, foi desenvolvido um artefato computacional que realiza buscas de publicações acadêmicas em uma base de dados de pesquisadores vinculados ao Grupo de pesquisa: Núcleo de Pesquisa Aplicada e Inovação. Para validação, foi feita a comparação entre o artefato desenvolvido e o sistema do Sistema de Mapeamento de Competências Científicas (SIMCC) por meio de duas etapas. A primeira é uma análise quantitativa por métricas como: linhas de código e complexidade ciclomática e a análise qualitativa verificando questões como a coesão e acoplamento dos métodos e classes envolvidas na busca desses dois sistemas. Na segunda parte, foi realizada uma simulação de 2 cenários de implementação para verificar como ambos os sistemas se comportam diante de manutenções e evoluções. Os resultados da validação evidenciaram que a arquitetura self-query conseguiu promover maior manutenibilidade no sistema sem adicionar complexidade ciclomática durante as simulações, contribuindo com um modelo de software mais sustentável e adaptável para sistemas acadêmicos de recuperação de informação. | |
| dc.description.abstract2 | Traditional academic search systems that implement in-stream search filters often face significant maintainability and evolution challenges, primarily because the metadata filtering logic is rigidly coupled with the source code. This work investigates and proposes a software architecture that utilizes Large Language Models (LLMs) with the self-querying technique to decouple this logic. The approach enables hybrid search and the translation of natural language queries, including complex filters, into structured requests for vector databases dynamically and autonomously. Adopting the Design Science Research methodology, a computational artifact was developed to search for academic publications in a database of researchers affiliated with the Núcleo de Pesquisa Aplicada e Inovação (NPAI - Center for applied research and innovation) Research Group. For validation, a two-stage comparison was conducted between the developed artifact and the existing Sistema de Mapeamento de Competências Científicas (SIMCC - Scientific Competency Mapping System) system. The first stage involved a quantitative analysis using metrics such as lines of code and cyclomatic complexity, and a qualitative analysis examining the cohesion and coupling of the methods and classes involved in the search functionality of both systems. In the second stage, a simulation of two implementation scenarios was conducted to observe how both systems behave when facing maintenance and evolution tasks. The validation results demonstrated that the self-querying architecture successfully enhanced system maintainability without increasing cyclomatic complexity during the simulations, contributing to a more sustainable and adaptable software model for academic information retrieval systems. Keywords: Large Language Models. Software Maintainability. Software Architecture. Information Retrieval. | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.citation | SEGER, Eduardo Ikeda. Aplicação de self-querying para filtragem dinâmica de metadados em sistemas de busca híbrido acadêmico. Orientador: Eduardo Manuel de Freitas Jorge. 2025. 79f. Trabalho de conclusão de curso (Bacharelado em Sistema de informação) – Departamento de Ciências Exatas e da terra, Campus I, Universidade do Estado da Bahia, Salvador - BA, 2025 | |
| dc.identifier.uri | https://saberaberto.uneb.br/handle/20.500.11896/10232 | |
| dc.language.iso | por | |
| dc.publisher | Universidade do Estado da Bahia | |
| dc.publisher.program | Colegiado de Sistema de Informação | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/3.0/br/ | |
| dc.rights2 | Attribution-NonCommercial 3.0 Brazil | en |
| dc.subject.keywords | Large Language Models | |
| dc.subject.keywords | Manutenibilidade de Software | |
| dc.subject.keywords | Arquitetura de Software | |
| dc.subject.keywords | Recuperação de Informação | |
| dc.title | Aplicação de self-querying para filtragem dinâmica de metadados em sistemas de busca híbrido acadêmico | |
| dc.title.alternative | Application of self-querying for dynamic metadata filtering in academic hybrid search systems | |
| dc.type | info:eu-repo/semantics/bachelorThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Aplicação de self-querying para filtragem_Eduardo Seger
- Tamanho:
- 2.72 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 462 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição: