Na próxima quarta-feira, dia 14 de maio, às 15:30hs, na sala 102 do prédio 72, o ex-aluno do PPGC, Bruno Castro da Silva, atualmente finalizando o doutorado na Universidade de Massachusetts, apresentará uma palestra sobre habilidades motoras parametrizadas aplicadas à robótica, que corresponde ao seu tema de pesquisa.
Habilidades Motoras Parametrizadas Aplicadas à Robótica
Robôs autônomos, capazes de resolver diversas tarefas, necessitam de um conjunto de controladores motores flexíveis e adaptáveis. Considere, por exemplo, um robô dotado de controladores para caminhar e levantar objetos, cada qual descrevendo os torques a serem aplicados em suas juntas. Via de regra, o treinamento deste tipo de controlador envolve a otimização de um único objetivo; por exemplo, caminhada com velocidade e tipo de marcha pré-determinados. Entretanto, diferentes tarefas podem exigir o uso de controladores com propriedades diferentes daquelas aprendidas durante o treinamento. Uma tarefa pode envolver, por exemplo, caminhadas com diferentes velocidades dependendo do tipo de terreno, ou comandos de torque adaptados à forma e peso específicos do objeto sendo levantado.
Neste trabalho nós apresentamos um framework para o aprendizado de controladores flexíveis que resolvem não apenas um problema motor, mas uma distribuição de problemas motores relacionados. Tais controladores são chamados de habilidades motoras parametrizadas. Habilidades parametrizadas podem ser ajustadas através de parâmetros que descrevem propriedades de uma tarefa motora. Tomemos como exemplo um robô aprendendo a chutar uma bola de futebol. Ao invés de aprender controladores independentes para cada tipo possível de chute, é mais vantajoso treinar apenas alguns (poucos) tipos de chute e, baseado nestes, construir uma única habilidade motora, parametrizada por força e direção de chute desejadas.
Nós identificamos três problemas para o aprendizado de habilidades motoras. Primeiramente, como aprender uma habilidade utilizando um número pequeno de exemplos de treinamento. Para isso, nós propomos um método capaz de estimar a geometria e topologia da superfície não-linear (variedade) onde os parâmetros de controladores motores relacionados se encontram. Em segundo lugar, um agente deve ser capaz de perceber quando a solução de um problema pode ser usada para solucionar outros problemas motores semelhantes. Isso requer o desenvolvimento de um método para projetar amostras de treinamento em uma variedade não-linear. Por fim, o agente deve ser capaz de decidir quais tarefas (e.g., quais tipos de chute) deseja treinar a fim de se tornar competente na habilidade, o mais rápido possível. Nós utilizamos Processos Gaussianos para construir um prior sobre o espaço de possíveis funções de performance, e derivamos equações analíticas para identificar a tarefa que, se treinada, provê a máxima melhoria esperada de performance sobre uma distribuição de problemas motores. Os métodos são avaliados em robôs simulados e também em um robô humanóide real com 53 graus de liberdade.
Bio:
Bruno Castro da Silva é aluno de doutorado na University of Massachusetts, trabalhando sob a supervisão do prof. Andrew G. Barto. Ele se graduou cum laude em Ciência da Computação, em 2004, naUniversidade Federal do Rio Grande do Sul, e concluiu seu mestrado nesta mesma universidade no ano de 2007. Bruno também trabalhou, em diferentes ocasiões, como pesquisador convidado no Laboratory of Computational Embodied Neuroscience, em Roma, desenvolvendo algoritmos de controle para o robô iCub. Seus interesses de pesquisa estão na intersecção entre métodos de aprendizado de máquina, teoria de controle ótimo e robótica, e incluem técnicas para construção de habilidades motoras flexíveis, exploração eficiente de grandes espaços de busca e métodos de otimização Bayesiana aplicados a problemas de controle.