UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMÁTICA
PROGRAMA DE POS-GRADUAÇÃO EM COMPUTAÇÃO
———————————————————
DEFESA DE DISSERTAÇÃO DE MESTRADO
Aluno: Felipe Hoppe Levin
Orientador: Prof. Dr. Carlos Alberto Heuser
Titulo: Desambiguação de autores em Bibliotecas Digitais utilizando Redes Sociais e PG
Linha de Pesquisa: Modelagem Conceitual e Bancos de Dados
Data: 01/09/2010
Hora: 15h00
Local: Sala 220 Prédio 43412
Banca Examinadora:
Profa. Dra. Carina Friedrich Dorneles (UFSC)
Profa. Dra. Renata de Matos Galante (UFRGS)
Profa. Dra. Viviane Pereira Moreira (UFRGS)
Presidente da Banca: Prof. Dr. Carlos Alberto Heuser
Resumo:
Bibliotecas digitais tornaram-se uma importante fonte de informação para comunidades científicas. Entretanto, por coletar dados de diferentes fontes, surge o problema de informações ambíguas ou duplicadas a respeito de nomes de autores. Métodos tradicionais de desambiguação de nomes utilizam informação sintática de atributos. Todavia, recentemente o uso de redes de relacionamentos, que trás informação semântica, tem sido estudado em desambiguação de dados. Em desambiguação de nomes de autores, relações de co-autoria entre autores podem ser usadas para criar uma rede social de autores, que pode ser utilizada para melhorar métodos de desambiguação de nomes de autores.
Esta dissertação apresenta um estudo do impacto de adicionar análise de redes sociais a métodos de desambiguação de nomes de autores baseados em informação sintática de atributos. Nós apresentamos uma abordagem de aprendizagem de máquina baseada em Programação Genética e a utilizamos para avaliar o impacto de adicionar análise de redes sociais a desambiguação de nomes de autores. Através de experimentos usando subconjuntos de bibliotecas digitais reais, nós demonstramos que o uso de análise de redes sociais melhora de forma significativa a qualidade dos resultados. Adicionalmente, nós demonstramos que as funções de casamento criadas por nossa abordagem baseada em Programação Genética são capazes de competir com métodos do estado da arte.
Palavras-Chave: desambiguação de nomes, análise de relacionamentos, redes sociais, programação genética, funções de casamento, bibliotecas digitais.