Cette formation consiste en une introduction aux concepts et aux méthodes d’analyse de données. Elle présente la méthodologie usuelle et les différentes techniques les plus courantes permettant de dégager de l’information essentielle à partir de gros volumes de données.
Pour cette formation, il est nécéssaire d'avoir des connaissances de base en statistiques et en probabilités.
-
Data Marts et Datawarehouse
-
Nettoyage des données
-
Classification supervisée vs classification non supervisée
-
Clustering
-
Classification
-
Régression
-
Réseaux de neurones
-
Cadres d’application et exemples
-
Techniques de validation des résultats : training set et test set