Lista de Disciplinas | CMP263

Aprendizagem de Máquina

Responsável: Mariana Recamonde Mendoza

Código: CMP263

Número de créditos/carga horária: 4 créditos/60 horas aula

Súmula

A disciplina apresenta os fundamentos da área de aprendizado de máquina e suas aplicações para a resolução de problemas de aprendizado supervisionado e nãosupervisionado. Entre os tópicos discutidos no curso, encontram-se: algoritmos de classificação e regressão; algoritmos de agrupamentos; métodos de identificação de padrões frequentes; métodos de aprendizado baseados em múltiplos modelos; técnicas de pré-processamento e redução de dimensionalidade; avaliação de modelos; interpretação de modelos; considerações práticas no uso de algoritmos de aprendizado de máquina.

Objetivos

Esta disciplina tem por objetivo introduzir os fundamentos da área de aprendizado de máquina, com ênfase em algoritmos de aprendizado supervisionado e não supervisionado, capacitando o aluno a selecionar, aplicar, avaliar criticamente e interpretar modelos em diferentes contextos de aplicação. Serão discutidos aspectos metodológicos do desenvolvimento de modelos preditivos e descritivos, incluindo pré-processamento de dados, redução de dimensionalidade, avaliação rigorosa de desempenho, interpretação de modelos e boas práticas experimentais.

Conteúdo Programático

1. Introdução
1.1 Introdução ao Aprendizado de Máquina.
1.2 Tipos de aprendizado e exemplos de aplicações
1.3 Apresentação da disciplina
2. Aprendizado Supervisionado
2.1 Introdução ao aprendizado supervisionado. Classificação e Regressão
2.2 Métodos baseados em instâncias
2.3 Métodos baseados em árvores
2.4 Métodos probabilísticos para classificação
2.5 Métodos baseados em otimização
2.6 Avaliação de modelos supervisionados:
métricas para classificação e regressão;
validação cruzada e validação aninhada;
viés, variância, overfitting e data leakage.
2.7 Uso de múltiplos modelos: bagging, boosting e stacking.
2.8 Seleção de modelos e otimização de hiperparâmetros.
3. Aprendizado Não-Supervisionado
3.1 Introdução ao aprendizado não-supervisionado
3.2 Medidas de similaridade e métodos de agrupamento: k-means e clustering hierárquico.
3.3 Validação de modelos descritivos
3.4 Mineração de padrões frequentes.
4. Pré-processamento de dados
4.1 Qualidade de dados e análise exploratória.
4.2 Técnicas de limpeza, transformação e codificação de dados.
4.3 Tratamento de dados desbalanceados.
4.4 Redução de dimensionalidade e extração de características
5. Discussões finais sobre a área
5.1 Interpretabilidade e explicabilidade de modelos de aprendizado de máquina.
5.2 Reprodutibilidade e rigor metodológico em experimentos computacionais.
5.3 Aspectos éticos, limitações dos modelos e vieses algorítmicos.
5.4 Considerações práticas no uso de algoritmos de aprendizado de máquina em aplicações reais.

Procedimentos didáticos

A disciplina será desenvolvida por meio de aulas teóricas e práticas, realizadas em encontros semanais. Nos encontros presenciais, será feita a exposição e discussão dos conteúdos teóricos, acompanhada de exemplos práticos e estudos de caso. Ao longo do semestre, serão propostas atividades práticas e questionários a serem desenvolvidos de forma autônoma, individualmente ou em pequenos grupos, em sala de aula ou fora dela, com o objetivo de consolidar os conceitos abordados e estimular a aplicação prática dos métodos estudados.

Os alunos também deverão desenvolver trabalhos teóricos e/ou práticos, individualmente ou em grupo, que poderão envolver a implementação, adaptação ou aplicação de algoritmos de aprendizado de máquina a problemas selecionados, bem como estudos de natureza investigativa ou de revisão da literatura sobre temas relacionados ao conteúdo da disciplina.

Os trabalhos desenvolvidos ao longo do semestre serão apresentados e discutidos, de forma oral e/ou escrita, promovendo a troca de experiências, a análise crítica dos resultados e o aprofundamento dos temas abordados.

Critérios de Avaliação

O desempenho do aluno será avaliado da seguinte forma:
● AT: atividades autônomas propostas ao longo do semestre, podendo ser de teor
teórico ou prático
● TI: trabalho individual, podendo ser uma prova ou trabalho teórico a ser apresentado
de forma oral e/ou escrita
● TP: trabalho prático realizado em grupo

A composição da Nota Final será realizada da seguinte forma: NF = (AT*0,30) + (TI*0,35) + (TP*0,35)

Será aprovado o aluno que obtiver nota final (NF) acima de 6 e frequência mínima de 75%.
A NF será convertida em conceito de acordo com as seguintes regras:
Conceito A: NF >= 9,0
Conceito B: NF >=7,5 e < 9,0
Conceito C: NF >= 6,0 e < 7,5
Conceito D: NF < 6,0
Conceito FF: caso o aluno não obtenha frequência mínima de 75%,
independentemente da nota e sem direito a recuperação.

O aluno que não obtiver NF >= 6,0 poderá realizar uma prova de recuperação, conforme definido no item “Atividades de Recuperação Previstas”.

Atividades de Recuperação Previstas:

Será oferecida uma oportunidade de recuperação aos alunos que atingirem a frequência mínima exigida de 75% e cuja nota final (NF), calculada conforme o item “Critérios de Avaliação”, seja inferior a 6,0. A prova de recuperação abrangerá todo o conteúdo da disciplina e será avaliada com um grau de 0 (zero) a 10 (dez), resultando na nota de recuperação (NR). Essa nota será então utilizada para calcular a média final (MF). O cálculo da MF pondera tanto o desempenho na recuperação quanto o esforço contínuo demonstrado ao longo do semestre, refletido na NF (calculada conforme definição no item “Critérios de Avaliação”). Assim, para os alunos que realizarem a recuperação, a média final será dada por: MF = (0,6 * NR) + (0,4 * NF)

O aluno será aprovado com conceito final C se obtiver MF igual ou superior a 6,0; caso contrário, será reprovado com conceito final D.

BIBLIOGRAFIA BÁSICA
● FACELI, K. et al. Inteligência Artificial: Uma Abordagem de Aprendizado de Máquina. Editora LTC, 2011.
● AURÉLIEN, G. Hands-On Machine Learning with Scikit-Learn, Keras, and Tensorflow: Concepts, Tools, and Techniques to Build Intelligent Systems (2nd ed). O’Reilly Media, 2019.
● HAN, J., KAMBER, M., PEI, J. Data Mining: Concepts and Techniques (3rd ed), Editora Morgan Kaufmann Publishers, 2011.

Bibliografia Complementar:
● LUGER,G.F. Inteligência Artificial: Estruturas e Estratégias para a Solução de Problemas Complexos. Editora Bookman, 2004.
● RUSSEL S., NORVIG, P. Inteligência Artificial. Editora Campus, 2004.