Mecanismo de busca semântica baseado em Word Embeddings em dados do currículo Lattes, programas de pós-graduação e grupos de pesquisa.

Carregando...
Imagem de Miniatura
Data
2024-12-19
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade do Estado da Bahia
Resumo

A busca por pesquisadores e suas publicações científicas é fundamental para o acesso ao conhecimento acadêmico. Contudo, os mecanismos de busca nas bases de dados acadêmicas frequentemente se limitam à correspondência de palavras-chave, desconsiderando a semântica e o contexto das consultas, o que pode gerar resultados insatisfatórios e pouco relevantes. A pesquisa realizada, utilizando a metodologia Design Science Research (DSR), visa à implementação e análise de abordagens de busca semântica, empregando técnicas de Inteligência Artificial (IA), como Word Embeddings e Large Language Models (LLMs), para proporcionar respostas mais relevantes aos usuários em buscas acadêmicas. A implementação foi dividida em dois ciclos: o primeiro, focado na melhoria da eficácia dos mecanismos de busca frente às limitações conhecidas, e o segundo, enfatizando a busca semântica, considerando metadados descritos em linguagem natural nas consultas, com o uso de LLMs para gerar automaticamente filtros que delimitem o escopo da busca. O estudo detalha a realização de buscas semânticas por meio da transformação e indexação de Word Embeddings. Os resultados indicam que métodos híbridos de busca podem aumentar significativamente a relevância dos resultados retornados. Além disso, a construção de uma matriz de rastreabilidade dos requisitos e a elaboração de cenários de consulta demonstraram que os artefatos atendem aos requisitos propostos, como a realização de buscas em dados e metadados de pesquisadores e suas produções bibliográficas. Portanto, os artefatos desenvolvidos podem ser utilizados como base para outras aplicações semelhantes, promovendo o avanço científico ao fortalecer a acessibilidade e democratização da informação acadêmica.


Descrição
Palavras-chave
Citação
BATISTA, João Vítor Café dos Reis. Mecanismo de busca semântica baseado em word embeddings em dados do currículo lattes, programas de pós graduação e grupos de pesquisa. Orientador: Eduardo Manuel de Freitas Jorge. 2024. 66f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação), Departamento de Ciências Exatas e da TerraI, Campus I, Universidade do Estado da Bahia, Salvador, 2024.
Palavras-chave