- Data Preprocessing
- Feature selection
- Dimensionality Reduction (Feature extraction)
- Principal Component Analysis (PCA)
- Linear Discriminant Analysis (LDA)
- Kernel PCA
- Quadratic Discriminant Analysis (QDA)
- Regression (both linear and non-linear)
- Simple Linear Regression
- Multiple Linear Regression
- Polynomial Regression
- Support Vector for Regression (SVR)
- Decision Tree Classification
- Random Forest Classification
- Classification
- Logistic Regression
- K-Nearest Neighbors (K-NN)
- Support Vector Machine (SVM)
- Kernel SVM
- Naive Bayes
- Decision Tree Classification
- Random Forest Classification
- Clustering
- K-Means Clustering
- Hierarchical Clustering
- Association Rule Learning
- Reinforcement Learning
- Upper Confidence Bound (UCB)
- Thompson Sampling
- Natural Language Processing
- Deep Learning
- Artificial Neural Networks for Regression and Classification
- Convolutional Neural Networks for Computer Vision
- Recurrent Neural Networks for Time Series Analysis
- Self Organizing Maps for Feature Extraction
- Deep Boltzmann Machines for Recommendation Systems
- Auto Encoders for Recommendation Systems
Mas o que é um Cientista de Dados?
Dizer que é alguém capaz de usar o método científico
para transformar dados em informação, é dizer pouco.
Um Cientista de Dados deve dominar vários campos de
conhecimento, como sejam: a Estatística, Ciências da Computação e o seu meio de
actuação, como exemplifica o seguinte diagrama de Venn.