Português English
Contato

Lista de Disciplinas | CMP595

Tópicos Especiais em Computação DXCV Literate Programming and Statics

SEMESTRE LETIVO: 2017/2
CARGA HORÁRIA:
15 horas-aula
NÚMERO DE CRÉDITOS:
1 crédito

RESPONSÁVEL: Jean-Marc Vincent (UGA, Grenoble, França) e Lucas Mello Schnorr

MATRÍCULA DE GRADUANDOS: A matrícula deverá ser feita como Aluno Especial

Súmula

General Introduction; Literate Programming; Data Carpentry and Manipula- tion; Data Representation; Probability / Statistics.

Objetivo

The aim of this short 15-hour course is to present the fundamental philosophy behind literate programming to conduct a faithful and reproducible data analysis, using sound statistical procedures and modern data analytics tools. The course is based on Rstudio as IDE and using the R programming language for data analysis. Every lecture will be backed up with practical sessions and worked out examples.

Conteúdo Programático

These are the topics:

  1. General Introduction – Course overview, goals, references and reproducibil- ity (2h)
  2. Literate Programming – Literate Programming Motivation & RStudio Case Study (3h)
  3. Data Carpentry and Manipulation – Clean-up data, and using the dplyr R package (3h)
  4. Data Representation – Checklist for good graphics & the ggplot2 package (3h)
  5. Probability / Statistics – an Introduction to Statistics and Probalistic Modeling (4h)

Método de Trabalho

Cinco encontros expositivos, começando às 8h30, organizados da seguinte forma:

  • 24/10 (Terça), no Lab 67-104, itens 1 e 2
  • 25/10 (Quarta), no AUD-1, itens 2 e 3
  • 30/10 (Segunda), no AUD-1, item 4
  • 31/10 (Terça), no Lab 67-103, item 5
  • 01/11 (Quarta), no AUD-1, item 5

Ao final do tópico 3, um dataset sugerido deverá ser analisado pelos participantes utilizando as ferramentas apresentadas (RStudio + dplyr). Ao final do tópico 5, os participantes deverão escolher um dataset de seu interesse e realizar uma análise completa; servindo de trabalho final da disciplina. Não haverá um exame. Todo o ambiente de trabalho será baseado no github com o material disponibilizado de maneira pública.

Bibliografia

  1. Literate Programming. Donald E. Knuth (Stanford, California) (CSLI Lecture Notes, no. 27.). ISBN 0-937073-80-6.
  2. Applied Statistics and Probability for Engineers 6th Edition. Douglas C. Montgomery (Author), George C. Runger. Wiley.
  3. R for Data Science. Garrett Grolemund, Hadley Wickham. http://r4ds. had.co.nz/