Português English
Contato
Publicado em: 25/05/2012

Tese de Doutorado em Sistemas de Informação

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMÁTICA
PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO
———————————————-
DEFESA DE TESE DE DOUTORADO

Aluno: Daniel Lichtnow
Orientador: Prof. Dr. José Palazzo Moreira de Oliveira

Título: Um Modelo de Qualidade para Caracterização e Seleção de Bancos de Dados de Biologia Molecular
Linha de Pesquisa: Sistemas de Informação

Data: 01/06/2012
Horário: 14h
Local: Sala 102. Prédio 43424 – Instituto de Informática

Banca Examinadora:
Profa. Dra. Lavinia Schuler Faccini (UFRGS) – Biociências/Genética
Profa. Dra. Mirella Moura Moro (UFMG)
Profa. Dra. Renata de Matos Galante (UFRGS)

Presidente da Banca: Prof. Dr. José Palazzo Moreira de Oliveira

Resumo:
O número de banco de dados de biologia molecular presentes na Web vem aumentando significativamente nos últimos anos. A dificuldade de localizar estes bancos de dados na Web incentivou a criação de uma série de catálogos. Mesmo com estes catálogos, persiste o desafio de selecionar aqueles bancos de dados que possuem maior qualidade. Normalmente, a seleção é feita por usuários, que nem sempre possuem o conhecimento necessário, e enfrentam problemas pela ausência de uma descrição mais rica dos bancos de dados nestes catálogos. Esta ausência de uma descrição mais rica dos bancos de dados gerou iniciativas recentes que visam identificar metadados relevantes para descrição dos bancos de dados de biologia molecular. No entanto, até o momento, como utilizar estes metadados na seleção dos bancos de dados presentes em um catálogo, relacionando estes às dimensões de qualidade de dados, é um tema pouco explorado. Da mesma forma o uso de Web metrics utilizadas na seleção de páginas Web vem sendo quase ignorado na determinação da qualidade de bancos de dados de biologia molecular.
Tendo em vista este cenário, nesta tese foi desenvolvido um modelo de qualidade que visa auxiliar na seleção de bancos de dados de biologia molecular presentes em catálogos na Web a partir da avaliação global de um banco de dados por meio de metadados e Web metrics. A definição deste modelo envolve adoção de metadados propostos em outros trabalhos, à proposição de novos metadados e a análise das dimensões de qualidade de dados. Experimentos são realizados de forma a avaliar a utilidade de alguns dos metadados e Web metrics na determinação da qualidade global de um banco de dados. A representação dos metadados, dimensões de qualidade, indicadores de qualidade e métricas usando recursos de Web Semântica é também discutida. O principal cenário de aplicação da abordagem é relacionado à necessidade que um usuário tem de escolher o melhor banco de dados para buscar informações relevantes para o seu trabalho dentre os existentes em um catálogo. Outro cenário está relacionado a sistemas que integram dados de fontes distintas e que necessitam, em muitos casos, reduzir o número de bancos de dados candidatos a um processo de integração.

Palavras-chave: Qualidade de dados, seleção de bancos de dados, banco de dados de biologia molecular.