Português English
Contato

Lista de Disciplinas | CMP617

CMP617 Tópicos especiais em computação DCXVII – Processamento de Linguagem Natural e

 Recuperação de Informações

Profa. Viviane Moreira

Carga Horária Total: 60 horas/aula

Créditos: 4

Semestre 2023/1

 

Objetivo

Apresentar conceitos de processamento de linguagem natural e recuperação de informações textuais utilizando tecnologias e modelos do estado da arte de forma a propiciar ao aluno um leque de conhecimento que permita ao mesmo desenvolver seus próprios projetos nessas áreas.

 

Conteúdo

  • Propriedades estatísticas dos textos
  • Pré-processamento de textos
  • Formas de representação
    • Bag of Words
    • Embeddings Fixas
    • Embeddings Contextuais
  • Tarefas Típicas de Processamento de Linguagem Natural (part of speech tagging e reconhecimento de entidades nomeadas).
  • Grandes Modelos de Linguagem pré-treinados
  • Aplicações (classificação, sumarização, rotulação de sequências)
  • Indexação de documentos
  • Modelos de Recuperação de Informações
  • Avaliação da Qualidade
  • Técnicas de melhoria de desempenho
  • Recuperação de Informações na Web

 

Técnicas de Ensino

  • Aulas teóricas envolvendo a exposição e discussão de conteúdos
  • Aulas na modalidade ensino a distância.
  • Discussão de artigos científicos.
  • Exercícios e trabalhos práticos.

 

Avaliação

A avaliação consiste em 3 componentes:

  • C1 (35%): Exercícios realizados em aula
  • C2 (35%): Trabalho escrito individual + apresentação
  • C3 (30%): Prova

 

A média final será calculada da seguinte maneira:

 

MF = 0,35*C1 + 0,35*C2 + 0,30*C3

 

A conversão da MF para conceitos é feita por meio da seguinte tabela:

9,0 <= MF <= 10,0 conceito A (aprovado)
7,5 <= MF < 9,0 conceito B (aprovado)
6,0 <= MF < 7,5 conceito C (aprovado)
MF < 6,0 D
Frequência < 75% FF

 

Recuperação do Conceito D: O aluno que tiver obtido conceito D poderá, a critério da professora, realizar uma atividade de recuperação. Caso aprovado, seu conceito final será C.

 

Bibliografia Básica

 

 

Bibliografia Complementar

 

  • Rothman, Denis. Transformers for Natural Language Processing: Build innovative deep neural network architectures for NLP with Python, PyTorch, TensorFlow, BERT, RoBERTa, and more. Packt Publishing Ltd, 2nd Edition 2022.
  • Bruce Croft, Donald Metzler and Trevor Strohman. Search Engines Information Retrieval in Practice Pearson Education, Inc. 2015. Disponível em: http://ciir.cs.umass.edu/downloads/SEIRiP.pdf
  • Baeza-Yates, R. Recuperação de informação: conceitos e tecnologia das máquinas de busca. Bookman, 2013, 590p.