Português English
Contato
Publicado em: 15/05/2012

Dissertação de Mestrado em Banco de Dados

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMÁTICA
PROGRAMA DE POS-GRADUAÇÃO EM COMPUTAÇÃO
———————————————————
DEFESA DE DISSERTAÇÃO DE MESTRADO

Aluno: Leandro Zulian Gallina
Orientador: Profa. Dra. Renata de Matos Galante
Título: Extração e Representação Semântica de Fatos Temporais
Linha de Pesquisa: Banco de dados

Data: 22/05/2012
Hora: 14h
Local: 43412(65)-Sala ANFA (Anfiteatro Azul) – Instituto de Informática

Banca Examinadora:
Prof. Dr. Carlos Alberto Heuser (UFRGS)
Prof. Dr. Leandro Krug Wives (UFRGS)
Profa. Dra. Renata Vieira (PUCRS)

Presidente da Banca: Profa. Dra. Renata de Matos Galante

Resumo:
Este trabalho descreve EXTIO (Extraction of Temporal Information Using Ontologies), uma abordagem que permite a normalização de expressões temporais e a organização em ontologia de fatos temporais extraídos de texto em linguagem natural. Isto permite que motores de busca possam aproveitar melhor a informação temporal de páginas da Web, realizando inferências sobre fatos temporais. EXTIO propõe: a normalização de expressões temporais relativas através de uma gramática formal para a língua inglesa; e a organização de fatos temporais extraídos do texto normalizado em uma ontologia. Expressões temporais relativas são construções textuais de tempo que se referem a uma data absoluta cujo valor é relativo a outra data. Por exemplo, a expressão “three months ago” (três meses atrás) é uma expressão temporal relativa, pois seu surgimento no texto se refere a uma data três meses antes da data de publicação do documento. Experimentos demonstram que a gramática formal proposta para a normalização de expressões temporais relativas supera o baseline na eficácia da normalização e no tempo de processamento de documentos em linguagem natural. A principal contribuição deste trabalho é a gramática formal para normalização de expressões temporais relativas de texto na língua inglesa. Também é contribuição deste trabalho o processamento semântico da informação temporal disponível em formato texto em documentos, para que possa ser melhor aproveitada por motores de busca.

Palavras-chave: Expressões temporais, Recuperação de informação, Gramática formal, Ontologias.