Políticas de decisão de comportamentos num sistema multiagentes utilizando aprendizagem por reforço

dc.contributor.advisorSimões, Marco Antônio Costa
dc.contributor.authorFonsêca, Rafael da Costa
dc.contributor.refereeCerqueira Junior, Adailton de Jesus
dc.contributor.refereeSuárez, Diego Gervasio Frías
dc.date.accessioned2024-10-24T18:31:19Z
dc.date.available2024-10-24T18:31:19Z
dc.date.issued2023-07-12
dc.description.abstractEsta monografia aborda o desafio da tomada de decisão em sistemas multiagentes, utilizando o aprendizado por reforço como uma solução para este desafio. O problema investigado nesta monografia é o desenvolvimento de políticas de decisão que permitam a coordenação e colaboração entre agentes, de forma a melhorar o desempenho coletivo em cenários complexos, como o futebol de robôs simulados. Este problema vem da necessidade de encontrar estratégias e técnicas que permitam aos agentes aprenderem comportamentos adequados, considerando a dinamicidade da interação com outros agentes e com o ambiente. Esta monografia descreve a modelagem e implementação do ambiente de aprendizagem, treinamento dos agentes utilizando técnicas de aprendizado por reforço e a avaliação dos resultados obtidos. Essa investigação tem relevância para a aplicação em problemas reais de coordenação e decisão em sistemas multiagentes, onde a tomada de decisão eficiente pode ser crucial para alcançar resultados ótimos e melhorar a cooperação entre os agentes. Ao treinar os agentes de um time de futebol para selecionar os comportamentos mais eficientes com o uso de algoritmos como DQN e DDPG, observaram-se melhorias notáveis no desempenho defensivo da equipe, com uma redução significativa de 10 vezes nas perdas durante as partidas
dc.description.abstract2This monograph addresses the challenge of decision-making in multi-agent systems, using reinforcement learning as a solution to this challenge. The problem investigated in this monograph is the development of decision-making policies that enable coordination and collaboration between agents, in order to improve collective performance in complex scenarios, such as simulated robot soccer. This problem stems from the need to find strategies and techniques that allow agents to learn appropriate behaviors, taking into account the dynamic nature of interaction with other agents and the environment. This monograph describes the modeling and implementation of the learning environment, the training of agents using reinforcement learning techniques and the evaluation of the results obtained. This research is relevant for application in real coordination and decision-making problems in multi-agent systems, where efficient decision-making can be crucial to achieving optimal results and improving cooperation between agents. By training the agents of a soccer team to select the most efficient behaviors using algorithms such as DQN and DDPG, notable improvements were seen in the team's defensive performance, with a significant 10-fold reduction in losses during matches
dc.format.mimetypeapplication/pdf
dc.identifier.citationFONSÊCA, Rafael da Costa. Políticas de decisão de comportamentos num sistema multiagentes utilizando aprendizagem por reforço. Orientador: Marco Antônio Costa Simões. 2023. 62 f.Trabalho de conclusão de curso (Bacharelado em Sistemas de Informação) - Departamento de Ciências Exatas e da Terra, Campus I, Universidade do Estado da Bahia. Salvador- BA, 2023.
dc.identifier.urihttps://saberaberto.uneb.br/handle/20.500.11896/6511
dc.language.isopor
dc.publisherUniversidade do Estado da Bahia
dc.publisher.programGraduação
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.rights2Attribution 3.0 Brazilen
dc.subject.keywordsAprendizado por reforço
dc.subject.keywordsSistemas multiagentes
dc.subject.keywordsPolíticas de decisão
dc.subject.keywordsFutebol de robôs simulados
dc.titlePolíticas de decisão de comportamentos num sistema multiagentes utilizando aprendizagem por reforço
dc.title.alternativeBehavioral decision policies in a multi-agent system using reinforcement learning
dc.typeinfo:eu-repo/semantics/bachelorThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Políticas de decisão de comportamentos_Rarafel.pdf
Tamanho:
871.67 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
462 B
Formato:
Item-specific license agreed upon to submission
Descrição: