Otimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas

dc.contributor.advisorMascarenhas, Ana Patrícia Fontes Magalhães
dc.contributor.authorSilva, Lázaro Queiroz da
dc.contributor.refereeSousa , Josemar Rodrigues de
dc.contributor.refereeChaves, Débora Alcina Rego
dc.date.accessioned2024-10-29T15:23:36Z
dc.date.available2024-10-29T15:23:36Z
dc.date.issued2023-07-12
dc.description.abstractRobôs de serviço são projetados com o intuito de executar atividades corriqueiras e domésticas como tirar o lixo, navegar por um determinado espaço, detectar e buscar objetos, entre outras. Para isso, estas máquinas têm a necessidade de serem cada vez mais autônomas, e capazes de executar tarefas físicas e cognitivas. Tudo isso perpassa por uma interação humano-robô, onde o ser humano repassa para o robô um determinado comando ou ação e ele inicia a tarefa. Para isso, é possível utilizar ferramentas de reconhecimento e detecção de voz afim de garantir uma comunicação através de linguagem natural dos seres humanos. Contudo obter respostas abrangentes e contextualizadas para determinadas perguntas ou temas acaba sendo um desafio por parte do robô que necessita de informações estáticas e prévias gerando respostas iguais e engessadas. Isso se torna uma limitação visto que não é possível gerar um diálogo natural e intuitivo entre o humano e a máquina. Nesse contexto, o objetivo desta pesquisa é treinar e ajustar modelos de linguagem largos como uma forma de auxiliar na geração de textos e respostas dinâmicas. A metodologia utilizada baseia-se na escolha de modelos de linguagem largos, ajuste fino e treinamento dos modelos para geração de texto e tarefas de respostas a perguntas. Como ferramentas de validação foram utilizadas duas métricas de desempenho, F1-Score para o modelo de respostas e perguntas e ROUGE para o modelo de geração de textos. Além disso foi feito um experimento utilizando a escala Likert como avaliação real da utilização do modelo de QA (Question Answering). O alvo deste projeto é o robô de serviço Bot Intelligent Large Capacity And Low Cost (BILL), que faz parte da linha de pesquisa @Home, do ACSO - Centro de Pesquisa em Arquitetura de Computadores, Sistemas Inteligentes e Robótica da Universidade do Estado da Bahia - UNEB.
dc.description.abstract2Service robots are designed with the purpose of performing everyday domestic activities such as taking out the trash, navigating a specific space, detecting and retrieving objects, among others. For this, these machines need to be increasingly autonomous and capable of executing both physical and cognitive tasks. All of this involves human-robot interaction, where humans give a specific command or action to the robot, and it initiates the task. To achieve this, it is possible to use voice recognition and detection tools to ensure communication through natural language. However, obtaining comprehensive and contextualized answers to certain questions or topics becomes a challenge for the robot, which relies on static and pre-existing information, generating rigid and repetitive responses. This limitation hinders the ability to create a more natural and intuitive dialogue between humans and machines. In this context, the aim of this research is to train and fine-tune large language models as a way to assist in generating more dynamic texts and responses. The methodology is based on selecting large language models, fine-tuning and training them for text generation and question-answering tasks. Two performance metrics were used for validation: the F1-Score for the question-answering model and ROUGE for the text generation model. Additionally, an experiment was conducted using the Likert scale as a real evaluation of the use of the Question Answering (QA) model. The target of this project is the service robot "Bill,"which is part of the @Home research line at ACSO - the Center for Research in Computer Architecture, Intelligent Systems, and Robotics at the State University of Bahia - UNEB.
dc.format.mimetypeapplication/pdf
dc.identifier.citationSILVA, Lázaro Queiroz da. Otimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas. Orientadora: Ana Patrícia Fontes Magalhães Mascarenhas. 2023. 78 f. Trabalho de conclusão de curso (Bacharelado em Sistemas de Informação) - Departamento de Ciências Exatas e da Terra, Campus I, Universidade do Estado da Bahia. Salvador- BA, 2023.
dc.identifier.urihttps://saberaberto.uneb.br/handle/20.500.11896/6535
dc.language.isopor
dc.publisherUniversidade do Estado da Bahia
dc.publisher.programGraduação
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.rights2Attribution 3.0 Brazilen
dc.subject.keywordsModelo de linguagem largo
dc.subject.keywordsInteligência Artificial
dc.subject.keywordsProcessamento de Linguagem Natural
dc.subject.keywordsRedes Neurais
dc.titleOtimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas
dc.title.alternativeOptimization of large language models for text generation and question answering tasks
dc.typeinfo:eu-repo/semantics/bachelorThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Otimização de modelos de linguagem_Lázaro Silva.pdf
Tamanho:
2.32 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
462 B
Formato:
Item-specific license agreed upon to submission
Descrição: