UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE INFORMÁTICA
PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO
———————————————-
DEFESA DE PROPOSTA DE TESE
Aluno: Daniel Lichtnow
Orientador: Prof. Dr. José Palazzo Moreira de Oliveira
Título: Um Modelo de Qualidade para a Geração de um Ranking de Banco de Dados Genômicos Disponíveis na Web
Linha de Pesquisa: Modelagem Conceitual e Bancos de Dados
Data: 03/03/2011
Horário: 14h
Local: Sala dos Conselhos (220) – Prédio 43.412 (65)
Banca Examinadora:
Profa. Dra. Regina Motz (UdelaR)
Profa. Dra. Lavínia Schüler Faccini (UFRGS)
Profa. Dra. Viviane Pereira Moreira (UFRGS)
Presidente da Banca: Prof. Dr. José Palazzo Moreira de OLiveira
Resumo:
O número de banco de dados genômicos presentes na Web vêm aumentando significativamente nos últimos anos. Um dos desafios é identificar estes bancos de dados na Web. Uma vez identificado um conjunto de bancos de dados, o desafio seguinte consiste em selecionar aqueles que possuem maior qualidade. Normalmente, esta seleção é feita pelos próprios usuários, que nem sempre possuem o conhecimento necessário sobre os bancos de dados e terão dificuldades para realizar esta seleção. Para realizar automaticamente a seleção de bancos de dados, muitas abordagens levam em conta mais a similaridade entre conteúdo do banco de dados e uma consulta e informações estatísticas sobre o conteúdo do banco de dados do que a qualidade. Aspectos relacionados à qualidade vêm sendo quase ignorados na maioria dos trabalhos e quando considerados, geralmente a seleção é baseada na avaliação explícita dos usuários. Estas estratégias de seleção são adotadas em função da dificuldade de analisar a qualidade do conteúdo de um banco de dados, que envolve a realização de procedimentos por vezes complexos e, em muitos casos, a comparação com fontes confiáveis nem sempre disponíveis e facilmente identificáveis. Tendo em vista este cenário, é proposta a geração de um ranking de bancos de dados genômicos presentes na Web a partir de metadados e Web metrics relacionados aos bancos de dados. Ao propor a utilização de metadados e Web metrics para avaliação da qualidade global de um banco de dados, busca-se contornar problemas relacionados à análise do conteúdo e a exigência de avaliações de usuários. A abordagem proposta para avaliação da qualidade global de um banco de dados é query-independent. O ranking indica os melhores bancos de dados em um domínio específico desconsiderando a presença ou ausência de um dado específico e a similaridade entre a consulta e o conteúdo do banco de dados. Na abordagem é assumido que os bancos de dados a serem avaliados já foram previamente identificados. Um dos possíveis cenários para aplicação da abordagem está relacionado a sistemas que integram dados de fontes distintas e que necessitam, em muitos casos, reduzir o número de bancos de dados candidatos a um processo de integração. Outro é relacionado à necessidade que um usuário tem de escolher o melhor banco de dados para buscar informações relevantes para o seu trabalho, dentre os existentes em um catálogo.
Palavras chave: Qualidade de dados, seleção de bancos de dados, banco de dados genômicos.