Otimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas
dc.contributor.advisor | Mascarenhas, Ana Patrícia Fontes Magalhães | |
dc.contributor.author | Silva, Lázaro Queiroz da | |
dc.contributor.referee | Sousa , Josemar Rodrigues de | |
dc.contributor.referee | Chaves, Débora Alcina Rego | |
dc.date.accessioned | 2024-10-29T15:23:36Z | |
dc.date.available | 2024-10-29T15:23:36Z | |
dc.date.issued | 2023-07-12 | |
dc.description.abstract | Robôs de serviço são projetados com o intuito de executar atividades corriqueiras e domésticas como tirar o lixo, navegar por um determinado espaço, detectar e buscar objetos, entre outras. Para isso, estas máquinas têm a necessidade de serem cada vez mais autônomas, e capazes de executar tarefas físicas e cognitivas. Tudo isso perpassa por uma interação humano-robô, onde o ser humano repassa para o robô um determinado comando ou ação e ele inicia a tarefa. Para isso, é possível utilizar ferramentas de reconhecimento e detecção de voz afim de garantir uma comunicação através de linguagem natural dos seres humanos. Contudo obter respostas abrangentes e contextualizadas para determinadas perguntas ou temas acaba sendo um desafio por parte do robô que necessita de informações estáticas e prévias gerando respostas iguais e engessadas. Isso se torna uma limitação visto que não é possível gerar um diálogo natural e intuitivo entre o humano e a máquina. Nesse contexto, o objetivo desta pesquisa é treinar e ajustar modelos de linguagem largos como uma forma de auxiliar na geração de textos e respostas dinâmicas. A metodologia utilizada baseia-se na escolha de modelos de linguagem largos, ajuste fino e treinamento dos modelos para geração de texto e tarefas de respostas a perguntas. Como ferramentas de validação foram utilizadas duas métricas de desempenho, F1-Score para o modelo de respostas e perguntas e ROUGE para o modelo de geração de textos. Além disso foi feito um experimento utilizando a escala Likert como avaliação real da utilização do modelo de QA (Question Answering). O alvo deste projeto é o robô de serviço Bot Intelligent Large Capacity And Low Cost (BILL), que faz parte da linha de pesquisa @Home, do ACSO - Centro de Pesquisa em Arquitetura de Computadores, Sistemas Inteligentes e Robótica da Universidade do Estado da Bahia - UNEB. | |
dc.description.abstract2 | Service robots are designed with the purpose of performing everyday domestic activities such as taking out the trash, navigating a specific space, detecting and retrieving objects, among others. For this, these machines need to be increasingly autonomous and capable of executing both physical and cognitive tasks. All of this involves human-robot interaction, where humans give a specific command or action to the robot, and it initiates the task. To achieve this, it is possible to use voice recognition and detection tools to ensure communication through natural language. However, obtaining comprehensive and contextualized answers to certain questions or topics becomes a challenge for the robot, which relies on static and pre-existing information, generating rigid and repetitive responses. This limitation hinders the ability to create a more natural and intuitive dialogue between humans and machines. In this context, the aim of this research is to train and fine-tune large language models as a way to assist in generating more dynamic texts and responses. The methodology is based on selecting large language models, fine-tuning and training them for text generation and question-answering tasks. Two performance metrics were used for validation: the F1-Score for the question-answering model and ROUGE for the text generation model. Additionally, an experiment was conducted using the Likert scale as a real evaluation of the use of the Question Answering (QA) model. The target of this project is the service robot "Bill,"which is part of the @Home research line at ACSO - the Center for Research in Computer Architecture, Intelligent Systems, and Robotics at the State University of Bahia - UNEB. | |
dc.format.mimetype | application/pdf | |
dc.identifier.citation | SILVA, Lázaro Queiroz da. Otimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas. Orientadora: Ana Patrícia Fontes Magalhães Mascarenhas. 2023. 78 f. Trabalho de conclusão de curso (Bacharelado em Sistemas de Informação) - Departamento de Ciências Exatas e da Terra, Campus I, Universidade do Estado da Bahia. Salvador- BA, 2023. | |
dc.identifier.uri | https://saberaberto.uneb.br/handle/20.500.11896/6535 | |
dc.language.iso | por | |
dc.publisher | Universidade do Estado da Bahia | |
dc.publisher.program | Graduação | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | |
dc.rights2 | Attribution 3.0 Brazil | en |
dc.subject.keywords | Modelo de linguagem largo | |
dc.subject.keywords | Inteligência Artificial | |
dc.subject.keywords | Processamento de Linguagem Natural | |
dc.subject.keywords | Redes Neurais | |
dc.title | Otimização de modelos de linguagem largos para tarefas de geração de texto e respostas a perguntas | |
dc.title.alternative | Optimization of large language models for text generation and question answering tasks | |
dc.type | info:eu-repo/semantics/bachelorThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Otimização de modelos de linguagem_Lázaro Silva.pdf
- Tamanho:
- 2.32 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 462 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição: