UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMÁTICA
PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO
DEFESA DE TESE DE DOUTORADO
Aluna: Denise de Oliveira
Orientadora: Profa. Dra. Ana Lucia Cetertich Bazzan
Titulo: Aprendizado em Sistemas Multiagente Através de Coordenação Oportunista
Área de Pesquisa: Inteligência Artificial
Data: 08/12/2009
Hora: 13:30min
Local: Anfiteatro Azul
Banca Examinadora:
Prof. Dr. Reinaldo Augusto da Costa Bianchi ( FEI)
Prof. Dr. Eduardo Camponogara (UFSC)
Prof. Dr. Edson Prestes Silva e Junior (UFRGS)
Presidente da Banca: Prof. Dr. Ana Lucia Cetertich Bazzan
Resumo:
O tamanho da representação de ações e estados conjuntos é um fator chave que limita o uso de algoritmos de aprendizado por reforço multiagente em problemas complexos. Este trabalho propõe o Opportunistic Coordination Learning (OPPORTUNE), um método de aprendizado por reforço multiagente para lidar com grandes cenários. Visto que uma solução centralizada não é praticável em grandes espaços de estado-ação, um modo de reduzir a complexidade do problema é decompô-lo em subproblemas utilizando cooperação entre agentes independentes em algumas partes do ambiente. No método proposto, agentes independentes utilizam comunicação e um mecanismo de cooperação que permite que haja a expansão de suas percepções sobre o ambiente e para que executem ações cooperativas apenas quado é melhor que agir de modo individual. O OPPORTUNE foi testado e comparado em dois cenários; jogo de perseguição e controle de tráfego urbano. Os resultados experimentais mostram que o método proposto aumenta a probabilidade de convergência do aprendizado multiagente.
Palavras-Chave: sistemas multiagente, aprendizado por reforço e coordenação