Português English
Contato
Publicado em: 05/07/2012

Dissertação de Mestrado em TV Digital

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMÁTICA
PROGRAMA DE POS-GRADUAÇÃO EM COMPUTAÇÃO
———————————————————
DEFESA DE DISSERTAÇÃO DE MESTRADO

Aluna: Eduarda Rodrigues Monteiro
Orientador: Prof. Dr. Sergio Bampi

Título: Implementação e Análise de Algoritmos para Estimação de Movimento em Processadores Paralelos tipo GPU (Graphics Processing Units)
Linha de Pesquisa: TV Digital

Data: 10/07/2012
Hora: 14h
Local: Auditório José Mauro Volkmer de Castilho, Prédio 43424 – Instituto de Informática

Banca Examinadora:
Prof. Dr. Adenauer Corrêa Yamim (UFPEL)
Prof. Dr. Altamiro Amadeu Susin (UFRGS)
Prof. Dr. Cláudio Fernando Resin Geyer (UFRGS)

Presidente da Banca: Prof. Dr. Sergio Bampi

Resumo:
A demanda por aplicações que processam vídeos digitais têm obtido atenção na indústria e na academia. Considerando a manipulação de um elevado volume de dados em vídeos de alta resolução, a compressão de vídeo é uma ferramenta fundamental para reduzir a quantidade de informações de modo a manter a qualidade viabilizando a respectiva transmissão e armazenamento. Diferentes padrões de codificação de vídeo foram desenvolvidos e incorporam técnicas cada vez mais avançadas para este fim, como por exemplo, o padrão H.264/AVC. Este padrão é considerado o estado-da-arte, pois proporciona maior eficiência de codificação em relação a padrões existentes (MPEG-4, MPEG-2). Entre todas as ferramentas inovadoras apresentadas pelas mais recentes normas de codificação, a Estimação de Movimento (ME) é a técnica que provê a maior parcela dos ganhos. A ME busca obter a relação de similaridade entre quadros vizinhos de uma cena, porém estes ganhos são obtidos ao custo de um elevado custo computacional representando a maior parte da complexidade total dos codificadores atuais. O objetivo do presente trabalho é acelerar o processo de ME, principalmente quando vídeos de alta resolução são codificados. Esta aceleração concentra-se no uso de uma plataforma massivamente paralela, as GP-GPUs (Graphics Processing Units) de propósito geral. Os algoritmos da ME apresentam um elevado potencial de paralelização e são candidatos para implementação em arquiteturas paralelas. Assim, diferentes algoritmos têm sido propostos a fim de diminuir a complexidade computacional deste módulo. Este trabalho apresenta a implementação e a exploração do paralelismo de dois algoritmos da ME em GPU, focados na codificação de vídeo de alta definição e no processamento em tempo real. O algoritmo Full Search (FS) é conhecido como algoritmo ótimo, pois encontra os melhores resultados a partir de uma busca exaustiva entre os quadros. O algoritmo rápido Diamond Search (DS) reduz significativamente a complexidade da ME mantendo a qualidade de vídeo próxima ao desempenho apresentado pelo FS. A partir da exploração máxima do paralelismo dos algoritmos FS e DS e do processamento paralelo disponível nas GPUs, este trabalho apresenta um método eficiente para mapear estes algoritmos em GPU, considerando a arquitetura CUDA (Compute Unified Device Architecture). Para avaliação de desempenho, as soluções CUDA são comparadas com as respectivas versões multi-core (utilizando biblioteca OpenMP) e distribuídas (utilizando MPI como infraestrutura de suporte). Todas as versões foram avaliadas em diferentes resoluções e os resultados foram comparados com algoritmos da literatura. As implementações propostas em GPU apresentam aumentos significativos, em termos de desempenho, em relação ao software de referência do codificador H.264/AVC e, além disso, apresentam ganhos expressivos em relação às respectivas versões paralelas que implementamos em processadores monolíticos multi-cores, em processamento distribuído em clusters e em relação aos trabalhos com GPGPU propostos na literatura.

Palavras-Chave: Estimação de Movimento, paralelismo, Full Search, Diamond Search, GPU, CUDA.