quinta-feira, 17 de dezembro de 2015

O processo de criação de conhecimento

CRISP-DM1.0


As fases do processo:
  1. Perceber o negócio. Que problema tens para resolver?
  2. Perceber os dados. O que tens para trabalhar?
  3. Preparar os dados. Escolhe e validada os dados que irás usar.
  4. Modelação. Cria um modelo conceptual e tira conclusões.
  5. Avaliação. Testa como se comporta o modelo perante os dados.
  6. Implementação. Implementa os melhores modelos para tirar conclusões de negócio.

domingo, 5 de julho de 2015

R


R uma linguagem e ambiente de programação estatística.

Alguns links úteis:

  • The R project
http://www.r-project.org/

  • The Comprehensive R Archive Network
http://cran.rstudio.com/

  • Rstudio
https://www.rstudio.com/

  • Quick-R
http://www.statmethods.net/

  • Cookbook for R
http://www.cookbook-r.com/

  • Step by Step Guide to Learn Data Science on R
http://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/learning-path-r-data-science/

  • Resources to help you learn and use R
www.ats.ucla.edu/stat/r/

  • R resources for reproducible research
http://campus.murraystate.edu/academic/faculty/cmecklin/RWebpage.html

  • R bloggers
http://www.r-bloggers.com/

  • Stack Overflow: a question and answer site for programmers.
http://stackoverflow.com/

  • Rseek
https://rseek.org/

  • R Package Documentation
https://rdrr.io/

sexta-feira, 26 de junho de 2015

O que faz um cientista de dados?

  • Define uma questão
  • Define o conjunto de dados ideais
  • Determina que dados são acessíveis
  • Recolhe os dados
  • Limpa os dados
  • Faz a análise exploratória dos dados
  • Utiliza a modelação estatística
  • Interpreta os resultados
  • Questiona os resultados obtidos
  • Sintetiza e escreve os resultados finais
  • Cria um código reprodutível
  • Disponibiliza toda a informação a potenciais interessados