Português English
Contato

Dissertação de Mestrado de Gabriel Eduardo Martini


Detalhes do Evento


Defesa de Dissertação de Mestrado Acadêmico

Aluno(a): Gabriel Eduardo Martini
Orientador(a): Mariana Recamonde Mendoza

Título: Classificação do Status Glicêmico a partir de Hemogramas: Estudo Comparativo de Estratégias de Aprendizado de Máquina com Análise de Erros e Interpretabilidade em Dados Laboratoriais Reais
Linha de Pesquisa: Aprendizado de Máquina, Representação de Conhecimento e Raciocínio

Data: 04/05/2026
Hora: 13:30
Local: Esta banca ocorrerá de forma híbrida (virtual e presencial), na sala 215/43412 do Instituto de Informática/UFRGS e pelo link https://mconf.ufrgs.br/webconf/00195037.

Banca Examinadora:
-Bruno Pereira Nunes (UIUC)
-Karina dos Santos Machado (FURG)
-Dennis Giovani Balreira (UFRGS)

Presidente da Banca: Mariana Recamonde Mendoza

Resumo: O Diabetes Mellitus constitui um dos principais desafios de saúde pública global, sendo o diagnóstico precoce essencial para prevenir complicações e reduzir a progressão da doença. A hemoglobina glicada (A1c) é o exame de referência para classificação do status glicêmico, porém sua disponibilidade é limitada em diversos contextos clínicos. Nesse cenário, o hemograma, amplamente disponível e de baixo custo, surge como uma alternativa potencial para triagem. Este trabalho investiga a hipótese de que parâmetros hematológicos contêm informações associadas ao metabolismo glicêmico, permitindo a classificação de indivíduos em normoglicêmicos, pré-diabéticos e diabéticos por meio de modelos de aprendizado de máquina. Para isso, foi construída uma base com 169.999 registros laboratoriais reais, contendo 23 atributos preditivos derivados do hemograma completo. Foram avaliadas quatro estratégias de modelagem: classificação binária, classificação multiclasse direta, decomposição em subproblemas binários e combinação por ensemble. Os experimentos utilizaram validação cruzada aninhada para seleção de hiperparâmetros e avaliação de modelos, com F2-Score como métrica principal, priorizando a redução de falsos negativos. Os resultados indicam que modelos de Redes Neurais Artificiais (MLP) apresentaram o melhor desempenho em todas as tarefas. Na classificação binária (Normal vs. Pré-diabético+Diabético), obteve-se F2=0,793 e Recall=0,824, evidenciando boa capacidade de detecção de alterações glicêmicas. Por outro lado, a classificação multiclasse apresentou desempenho inferior (F2 macro=0,551), refletindo a maior dificuldade na distinção entre classes adjacentes. A decomposição em classificadores binários evidenciou que a dificuldade preditiva é proporcional à proximidade entre os limiares diagnósticos de A1c, com maior taxa de erro em regiões limítrofes, especialmente na identificação do pré-diabetes. A análise de interpretabilidade, baseada em importância por permutação e SHAP, identificou Idade, Leucócitos e RDW como os atributos mais relevantes, em concordância com evidências fisiopatológicas associadas a processos inflamatórios e metabólicos. Adicionalmente, a análise de erros permitiu caracterizar limitações do modelo, incluindo maior incidência de classificações incorretas em faixas etárias mais jovens e em regiões próximas aos pontos de corte diagnósticos. Como principais contribuições, destacam-se: (i) a avaliação sistemática do potencial preditivo do hemograma completo em uma base de larga escala; (ii) a comparação estruturada entre diferentes estratégias de modelagem, evidenciando os limites da classificação multiclasse do pré-diabetes; e (iii) a análise integrada de desempenho, padrões de erro e interpretabilidade, contribuindo para a compreensão dos limites e aplic ações clínicas da abordagem. Os resultados sugerem que o hemograma pode atuar como ferramenta complementar de triagem para alterações glicêmicas, especialmente em contextos com acesso limitado à A1c, embora com limitações na discriminação entre classes adjacentes.

Palavras-Chave: Aprendizado de Máquina; Diabetes Mellitus; Hemograma; Classificação do Status Glicêmico; Explicabilidade