Mecanismo de busca semântica baseado em Word Embeddings em dados do currículo Lattes, programas de pós-graduação e grupos de pesquisa.
Data
Orientador
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
A busca por pesquisadores e suas publicações científicas é fundamental para o acesso ao conhecimento acadêmico. Contudo, os mecanismos de busca nas bases de dados acadêmicas frequentemente se limitam à correspondência de palavras-chave, desconsiderando a semântica e o contexto das consultas, o que pode gerar resultados insatisfatórios e pouco relevantes. A pesquisa realizada, utilizando a metodologia Design Science Research (DSR), visa à implementação e análise de abordagens de busca semântica, empregando técnicas de Inteligência Artificial (IA), como Word Embeddings e Large Language Models (LLMs), para proporcionar respostas mais relevantes aos usuários em buscas acadêmicas. A implementação foi dividida em dois ciclos: o primeiro, focado na melhoria da eficácia dos mecanismos de busca frente às limitações conhecidas, e o segundo, enfatizando a busca semântica, considerando metadados descritos em linguagem natural nas consultas, com o uso de LLMs para gerar automaticamente filtros que delimitem o escopo da busca. O estudo detalha a realização de buscas semânticas por meio da transformação e indexação de Word Embeddings. Os resultados indicam que métodos híbridos de busca podem aumentar significativamente a relevância dos resultados retornados. Além disso, a construção de uma matriz de rastreabilidade dos requisitos e a elaboração de cenários de consulta demonstraram que os artefatos atendem aos requisitos propostos, como a realização de buscas em dados e metadados de pesquisadores e suas produções bibliográficas. Portanto, os artefatos desenvolvidos podem ser utilizados como base para outras aplicações semelhantes, promovendo o avanço científico ao fortalecer a acessibilidade e democratização da informação acadêmica.