Defesa de Dissertação de Mestrado Acadêmico
Aluno(a): Manuel Speranza Torres Veras
Orientador(a): Claudio Rosito Jung
Coorientador(a): Thiago Lopes Trugillo da Silveira
Título: Probabilistic Representation and Localization Loss Function for Object Detection in 360-Degree Images
Linha de Pesquisa: Processamento de Imagens, Visão Computacional e Reconhecimento de Padrões
Data: 31/10/2025
Hora: 13:30
Local: Esta banca ocorrerá de forma híbrida (virtual e presencial), na sala 218 (43412) do Instituto de Informática/UFRGS e pelo link https://meet.google.com/dad-vxkq-ixg.
Banca Examinadora:
-Adriano Quilião de Oliveira (Universidade Federal de Santa Maria)
-Joel Luis Carbonera (Universidade Federal do Rio Grande do Sul)
-Eduardo Simões Lopes Gastal (Universidade Federal do Rio Grande do Sul)
Presidente da Banca: Claudio Rosito Jung
Resumo: Este trabalho aborda o desafio da detecção precisa de objetos em imagens 360 graus, onde distorções induzidas pela projeção e a topologia dos dados degradam o desempenho de algoritmos planares convencionais e exigem um tratamento especializado dos Bounding Fields of View (BFoVs). Abordagens anteriores frequentemente dependem de aproximações planares ou de cálculos complexos e computacionalmente caros de interseção sobre a união (IoU) esféricos, que sacrificam a precisão geométrica ou a eficiência. Nós introduzimos uma nova representação probabilística utilizando a distribuição de Kent, um análogo esférico da distribuição normal bivariada, para modelar a localização de objetos diretamente na esfera. Nosso método transforma anotações de BFoV e BFoV rotacionado em parâmetros da distribuição de Kent. O método emprega uma nova função de perda de regressão incorporando a divergência de Jeffreys, uma f orma simétrica da divergência de Kullback-Leibler, para quantificar a dissimilaridade probabilística, juntamente com penalidades de distância haversine e de aspect ratio adaptadas para a geometria esférica. Essa abordagem oferece uma representação mais precisa de objetos em imagens 360 graus ao lidar intrinsecamente com a geometria esférica, ao contrário de métodos limitados a distribuições ou aproximações planares. Nosso método alcança resultados de ponta, superando os existentes sem sacrificar a eficiência computacional no tempo de inferência ou exigir heurísticas complexas de correspondência, alinhando assim as previsões de forma mais próxima à geometria inerente dos dados.
Palavras-Chave: detecção de objetos, distribuição de kent, imagens 360-graus, represen- tação probabilística