Políticas de decisão de comportamentos num sistema multiagentes utilizando aprendizagem por reforço
Data
Autores
Orientador
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Esta monografia aborda o desafio da tomada de decisão em sistemas multiagentes, utilizando o aprendizado por reforço como uma solução para este desafio. O problema investigado nesta monografia é o desenvolvimento de políticas de decisão que permitam a coordenação e colaboração entre agentes, de forma a melhorar o desempenho coletivo em cenários complexos, como o futebol de robôs simulados. Este problema vem da necessidade de encontrar estratégias e técnicas que permitam aos agentes aprenderem comportamentos adequados, considerando a dinamicidade da interação com outros agentes e com o ambiente. Esta monografia descreve a modelagem e implementação do ambiente de aprendizagem, treinamento dos agentes utilizando técnicas de aprendizado por reforço e a avaliação dos resultados obtidos. Essa investigação tem relevância para a aplicação em problemas reais de coordenação e decisão em sistemas multiagentes, onde a tomada de decisão eficiente pode ser crucial para alcançar resultados ótimos e melhorar a cooperação entre os agentes. Ao treinar os agentes de um time de futebol para selecionar os comportamentos mais eficientes com o uso de algoritmos como DQN e DDPG, observaram-se melhorias notáveis no desempenho defensivo da equipe, com uma redução significativa de 10 vezes nas perdas durante as partidas