UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMÁTICA
PROGRAMA DE POS-GRADUAÇÃO EM COMPUTAÇÃO
Aluno: Caciano dos Santos Machado
Orientador: Prof. Dr. Philippe Olivier Alexandre Navaux
Titulo: MPI sobre MOM para suporte a Log de Mensagens Pessimista Remoto
Linha de Pesquisa: Processamento Paralelo e Distribuído
Data: 22/09/2010
Hora: 13h30min
Local: Auditório José Volkmer de Castilho (Verde), Prédio 43424
Banca Examinadora:
Prof. Dr. Alexandre da Silva Carissimi (UFRGS)
Profa. Dra. Taisy Silva Weber (UFRGS)
Prof. Dr. Benhur de Oliveira Stein (UFSM)
Presidente da Banca: Prof. Dr. Philippe Olivier Alexandre Navaux
Resumo:
O aumento crescente no número de processadores das arquiteturas paralelas que estão no topo dos rankings de desempenho, apesar de permitir uma maior capacidade de processamento, também traz consigo um aumento na taxa de falhas diretamente proporcional ao número de processadores. Atualmente, as técnicas de tolerância a falhas com recuperação retroativa são as mais empregadas em aplicações MPI, principalmente a técnica de checkpoint coordenado. No entanto, previsões afirmam que essa última técnica será inadequada para as arquiteturas emergentes. Em contrapartida, as técnicas de log de mensagens possuem características que as tornam mais apropriadas no novo cenário que se estabelece. O presente trabalho consiste em uma proposta de log de mensagens pessimista remoto com checkpoint não-coordenado e a avaliação de desempenho da comunicação MPI sobre Publish/Subscriber no qual se baseia o log de mensagens. O trabalho compreende: um estudo das técnicas de tolerância a falhas mais empregadas em ambientes de alto desempenho e a motivação para a escolha dessa variante de log de mensagens; a proposta de log de mensagens; uma implementação de comunicação Open MPI sobre OpenAMQ e sua respectiva avaliação de desempenho com comunicação tradicional TCP/IP e com o log de mensagens pessimista local da distribuição do Open MPI. Os benchmarks utilizados foram o NetPIPE, o NAS Parallel Benchmarks e a aplicação Virginia Hydrodynamics (VH-1).
Palavras-Chave:
processamento de alto desempenho
computação baseada em clusters
tolerância a falhas
log de mensagens pessimista
message-oriented middleware