UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMÁTICA
PROGRAMA DE POS-GRADUAÇÃO EM COMPUTAÇÃO
———————————————————
DEFESA DE DISSERTAÇÃO DE MESTRADO
Aluno: Otavio Costa Acosta
Orientadora: Profa. Dra. Aline Villavicencio
Coorientadora: Viviane Pereira Moreira
Titulo: Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação
Linha de Pesquisa: Programação Paralela e Distribuida
Data: 12/09/2011
Hora: 09h00
Local: Sala dos Conselhos (220)
Banca Examinadora:
Prof. Dr. Leandro Krug Wives (UFRGS)
Prof. Dr. Stanley Loh (UCPel)
Prof. Dr. Eliseo Berni Reategui (UFRGS)
Presidente da Banca: Profa. Dra. Aline Villavicencio
Resumo: A vasta utilização de Expressões Multipalavras em textos de linguagem natural requer atenção para um estudo aprofundado neste assunto, para que posteriormente seja possível a manipulação e o tratamento, de forma robusta, deste tipo de expressão. Uma Expressão Multipalavra costuma transmitir precisamente conceitos e ideias que geralmente não podem ser expressos por apenas uma palavra e estima-se que sua frequência, em um léxico de um falante nativo, seja semelhante à quantidade de palavras simples. A maioria das aplicações reais simplesmente ignora ou lista possíveis termos compostos, porém os identifica e trata seus itens lexicais individualmente e não como uma unidade de conceito. Para o sucesso de uma aplicação de Processamento de Linguagem Natural, que envolva processamento semântico, é necessário um tratamento diferenciado para essas expressões. Com o devido tratamento, é investigada a hipótese das Expressões Multipalavras possibilitarem uma melhora nos resultados de uma aplicação, tal como os sistemas de Recuperação de Informação. Os objetivos desse trabalho estão voltados ao estudo de técnicas de descoberta automática de Expressões Multipalavras, permitindo a criação de dicionários, para fins de indexação, em um mecanismo de Recuperação de Informação. Resultados experimentais apontaram melhorias na recuperação de documentos relevantes, ao identificar Expressões Multipalavras e tratá-las como uma unidade de indexação única.
Palavras-Chave: Processamento de Linguagem Natural, Expressão Multipalavra, Recuperação de Informação