Otimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas

Silva, Lázaro Queiroz da

Otimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas

dc.contributor.advisor	Mascarenhas, Ana Patrícia Fontes Magalhães
dc.contributor.author	Silva, Lázaro Queiroz da
dc.contributor.referee	Sousa , Josemar Rodrigues de
dc.contributor.referee	Chaves, Débora Alcina Rego
dc.date.accessioned	2024-10-29T15:23:36Z
dc.date.available	2024-10-29T15:23:36Z
dc.date.issued	2023-07-12
dc.description.abstract	Robôs de serviço são projetados com o intuito de executar atividades corriqueiras e domésticas como tirar o lixo, navegar por um determinado espaço, detectar e buscar objetos, entre outras. Para isso, estas máquinas têm a necessidade de serem cada vez mais autônomas, e capazes de executar tarefas físicas e cognitivas. Tudo isso perpassa por uma interação humano-robô, onde o ser humano repassa para o robô um determinado comando ou ação e ele inicia a tarefa. Para isso, é possível utilizar ferramentas de reconhecimento e detecção de voz afim de garantir uma comunicação através de linguagem natural dos seres humanos. Contudo obter respostas abrangentes e contextualizadas para determinadas perguntas ou temas acaba sendo um desafio por parte do robô que necessita de informações estáticas e prévias gerando respostas iguais e engessadas. Isso se torna uma limitação visto que não é possível gerar um diálogo natural e intuitivo entre o humano e a máquina. Nesse contexto, o objetivo desta pesquisa é treinar e ajustar modelos de linguagem largos como uma forma de auxiliar na geração de textos e respostas dinâmicas. A metodologia utilizada baseia-se na escolha de modelos de linguagem largos, ajuste fino e treinamento dos modelos para geração de texto e tarefas de respostas a perguntas. Como ferramentas de validação foram utilizadas duas métricas de desempenho, F1-Score para o modelo de respostas e perguntas e ROUGE para o modelo de geração de textos. Além disso foi feito um experimento utilizando a escala Likert como avaliação real da utilização do modelo de QA (Question Answering). O alvo deste projeto é o robô de serviço Bot Intelligent Large Capacity And Low Cost (BILL), que faz parte da linha de pesquisa @Home, do ACSO - Centro de Pesquisa em Arquitetura de Computadores, Sistemas Inteligentes e Robótica da Universidade do Estado da Bahia - UNEB.
dc.description.abstract2	Service robots are designed with the purpose of performing everyday domestic activities such as taking out the trash, navigating a specific space, detecting and retrieving objects, among others. For this, these machines need to be increasingly autonomous and capable of executing both physical and cognitive tasks. All of this involves human-robot interaction, where humans give a specific command or action to the robot, and it initiates the task. To achieve this, it is possible to use voice recognition and detection tools to ensure communication through natural language. However, obtaining comprehensive and contextualized answers to certain questions or topics becomes a challenge for the robot, which relies on static and pre-existing information, generating rigid and repetitive responses. This limitation hinders the ability to create a more natural and intuitive dialogue between humans and machines. In this context, the aim of this research is to train and fine-tune large language models as a way to assist in generating more dynamic texts and responses. The methodology is based on selecting large language models, fine-tuning and training them for text generation and question-answering tasks. Two performance metrics were used for validation: the F1-Score for the question-answering model and ROUGE for the text generation model. Additionally, an experiment was conducted using the Likert scale as a real evaluation of the use of the Question Answering (QA) model. The target of this project is the service robot "Bill,"which is part of the @Home research line at ACSO - the Center for Research in Computer Architecture, Intelligent Systems, and Robotics at the State University of Bahia - UNEB.
dc.format.mimetype	application/pdf
dc.identifier.citation	SILVA, Lázaro Queiroz da. Otimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas. Orientadora: Ana Patrícia Fontes Magalhães Mascarenhas. 2023. 78 f. Trabalho de conclusão de curso (Bacharelado em Sistemas de Informação) - Departamento de Ciências Exatas e da Terra, Campus I, Universidade do Estado da Bahia. Salvador- BA, 2023.
dc.identifier.uri	https://saberaberto.uneb.br/handle/20.500.11896/6535
dc.language.iso	por
dc.publisher	Universidade do Estado da Bahia
dc.publisher.program	Graduação
dc.rights	info:eu-repo/semantics/openAccess
dc.rights.uri	http://creativecommons.org/licenses/by/3.0/br/
dc.rights2	Attribution 3.0 Brazil	en
dc.subject.keywords	Modelo de linguagem largo
dc.subject.keywords	Inteligência Artificial
dc.subject.keywords	Processamento de Linguagem Natural
dc.subject.keywords	Redes Neurais
dc.title	Otimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas
dc.title.alternative	Optimization of large language models for text generation and question answering tasks
dc.type	info:eu-repo/semantics/bachelorThesis

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Otimização de modelos de linguagem_Lázaro Silva.pdf
Tamanho:: 2.32 MB
Formato:: Adobe Portable Document Format
Descrição:

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 462 B
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Bacharelado em Sistemas de Informação - DCET1