Português English
Contato

Lista de Disciplinas | CMP259

CMP259 – Descoberta de Conhecimento em Bases de Dados

Professores Responsáveis: Karin Becker

Carga horária: 60

OBJETIVOS:

O cumprimento da disciplina busca dar ao aluno, ao final do semestre, condições de: a) conhecer as principais fases do processo de Descoberta de Conhecimento em Bases de Dados (DCBD); b) conhecer técnicas para as principais classes de problema de mineração de dados, com foco em associação, classificação e agrupamento; c) conhecer alguns tipos de aplicações baseadas em mineração de dados e DCBD; d) conhecer tendências na área de mineração de dados e descoberta de conhecimento.

SÚMULA:

Esta disciplina oferece uma caracterização do processo de Descoberta de Conhecimento em Bases de Dados (DCBD) com uma descrição das fases que o compõem. Serão apresentados exemplos para cada fase do processo, enfatizando-se a de Mineração de Dados (Data Mining). Serão descritos diversos métodos para mineração de dados e exploradas suas potencialidades. Também serão exploradas algumas aplicações baseadas em mineração e DCBD. Para dar um cunho prático à disciplina, serão exploradas algumas ferramentas e aplicações das mesmas sobre dados reais e/ou de domínio público.

CONTEÚDO PROGRAMÁTICO:

  1. Conceitos Básicos de DCBD 1.1 Objetivos 1.2 Etapas do Processo 1.3 Classes de problemas de Mineração
  2. Pré-processamento de Dados 2.1 Características dos Dados 2.2 Exploração de Dados e Profiling 2.3 Técnicas de Integração, limpeza e transformação
  3. Associação 3.1 Algoritmo Apriori 3.2 Variações 3.3 Tópicos avançados em associação
  4. Classificação 4.1 Indução de Árvores de Decisão 4.2 Avaliação de Modelos 4.3 Classificação Bayesiana 4.4 Tópicos avançados em classificação

5. Técnica de Agrupamento 5.1 Similaridade 5.2 Agrupamento Particional 5.3 Agrupamento Hierárquico 5.4 Agrupamento por Densidade 5.5 Tópicos avançados em agrupamento

  1. Aplicações 6.1 Mineração de Sentimentos

6.2 Mineração de Dados na Web 6.3 Tendências

BIBLIOGRAFIA BÁSICA

  1. TAN, O.N.; STEINBACH, M. KUMAR, V. “Introduction to Data Mining”.

Pearson Education Inc., 2006. *

  1. PROVOST & FOSTER. Data science para negócios. Alta Books, 2016.
  2. Zaki, M.; Meira, Jr., W. Data Mining and Analysis: Fundamental Concepts and

Algorithms. Cambridge University Press, 2014.

  1. SILVA, PERES, BOSCAROLI. Introdução a mineração de dados – com

aplicações em R. Elsevier, 2016.

  1. Leskovec, J.; Rajaraman, A.; Ullman, J. Mining Of Massive Datasets.

Cambrige University Press, 2014.

  1. Artigos de revistas e periódicos relevantes na área

TÉCNICAS DE ENSINO

Aulas expositivas. Estudo e discussão de artigos. Trabalhos práticos usando pacotes de software e ferramentas disponíveis no Instituto de Informática em cada um dos tópicos.

SISTEMA DE AVALIAÇÃO

A avaliação considera a participação (contribuição em sala de aula, fóruns, leitura de material solcitada para aulas, compartilhamento de material com os colegas, desenvolvimento de tarefas solicitadas, presença), leitura e discussao/apresentação de artigos e trabalho prático.

NF = PART*20% + TRAB_PRAT*50% + ARTIGOS*30%.