Defesa de Dissertação de Mestrado Acadêmico
Aluno(a): Thiago da Silva Araújo
Orientador(a): Philippe Olivier Alexandre Navaux
Título: Scalable and Efficient Deep Learning for Diabetic Retinopathy Classification on ARM-Based Architectures
Linha de Pesquisa: Computação de Alto Desempenho e Sistemas Distribuídos
Data: 12/12/2025
Hora: 08:30
Local: Esta banca ocorrerá de forma híbrida (virtual e presencial), na sala sala 218 predio 43412 do Instituto de Informática/UFRGS e pelo link https://mconf.ufrgs.br/webconf/defesas-gppd.
Banca Examinadora:
-Lucas Mello Schnorr (UFRGS)
-Dennis Giovani Balreira (UFRGS)
-Alba Cristina Magalhães Alves de Melo (UNB)
Presidente da Banca: Philippe Olivier Alexandre Navaux
Resumo: O aprendizado profundo (DL) eficiente e escalável é essencial para o desenvolvimento de aplicações práticas e sustentáveis em imagem médica. Este estudo investiga a seleção, otimização e escalabilidade de redes neurais convolucionais (CNNs) para a classificação de retinopatia diabética (RD) em sistemas baseados em ARM, com foco em desempenho, consumo de energia e eficiência no treinamento distribuído. Foram avaliadas 38 arquiteturas de CNN para identificar o modelo que melhor equilibrasse acurácia preditiva, custo computacional e eficiência energética. O modelo MobileNet apresentou os melhores resultados, consumindo 77% menos energia, treinando 83% mais rápido e gerando um modelo 85% menor que o InceptionV3 de referência, além de alcançar um AUC 3% superior. A otimização de hiperparâmetros mostrou que o uso da função de ativação sigmoid, da resolução de entrada de 300×300 e do otimizador SGD oferece a configuração mais eficiente. Os experimentos de escalabilidade realizados na arquitetura ARM Grace Superchip demonstraram desempenho quase linear até 36 núcleos por nó, com eficiência energética ideal entre 18 e 36 núcleos, antes da saturação da largura de banda de memória. O treinamento distribuído em duas Grace Superchips, utilizando a estratégia MultiWorkerMirroredStrategy do TensorFlow, obteve um speedup de 1,93× e eficiência de escalonamento de 96,5\%, reduzindo o tempo de treinamento pela metade com aumento inferior a 1% no consumo total de energia e mantendo a acurácia do modelo (AUC 0,936). Os resultados indicam que a arquitetura Grace mantém cargas de trabalho de DL eficientes e escaláveis com baixo custo energético, confirmando sua adequação para aplicações de IA sensíveis a desempenho e consumo de energia em imagem médica.
Palavras-Chave: ARM, deep learning, diabetic retinopathy, distributed training, scalability and sustainability.