2 jours (14 heures)
Formation certifiante - Code CNCP : 2234 - Certif Info : 93835
- Présentiel
- Blended - Learning
- FOAD / E-learning tutoré
Objectifs
- Exploiter des données de toutes sources pour les restituer après un ensemble de traitement, de nettoyage et d’enrichissement des données.
- Connaître les différentes méthodes statistiques d’analyse de données.
- Comprendre le processus d’extraction de connaissances à partir de données.
- Se familiariser avec les phases d’acquisition, de fouille et de validation de données.
- Maîtriser les techniques d’exploration de données pour l’extraction des connaissances sous la forme de modèles de description.
- Comprendre les Algorithmes et méthodes d’exploration et d’analyse dans le Big Data
- Visualisation des données et aide à la prise de décision.
Prérequis
Pour suivre cette formation dans les meilleures conditions possibles, les participants doivent avoir des connaissances en statistiques, Excel, R, Python et SQL.
Vous n’avez pas les prérequis nécessaires pour la formation Fondamentaux des statistiques ? Contactez nous pour étudier ensemble un parcours sur mesure et garantir ainsi la réussite de votre projet.
Intervenants
Les contenus pédagogiques sont synchronisés sur les évolutions techniques grâce à notre équipe d’intervenant experts et professionnels du secteur enseigné. Les formateurs qui interviennent pour animer les formations ont une double compétence : compétence informatique et compétence métier (Banque, Assurance, Administration, Santé, Transport).
PROGRAMME DE FORMATION ANALYSE DE DONNÉES ET MÉTHODES STATISTIQUES
Introduction à l’analyse de données
- Introduction sur l’analyse de données
- Métier de data analyst
- Rôle et les compétences d’un data analyst
Exploration de la données
- Identifier les données
- Comprendre les champs et types de données
- Retrouver des données
- Syntaxe
Préparation et interprétation des données
- Interpréter des données
- Retrouver des données
- Définir les jointures
- Comprendre les données et le flux de travail
- Découvrir les données nettoyées
Analyse des données avec un Tableau croisé dynamique
- Analyse bidimensionnelle: Découvrir les tableaux croisés dynamiques
- Aller plus loin avec les TCD
- Sélectionner et nommer les données
- Fractionner un texte
- Éliminer les doublons
Mener à bien un projet d’analyse de données
- Définition des bonnes pratiques
- Initiation à la gouvernance de données
- Erreurs fréquentes
- Création des modèles réutilisables
- Filtrage avec les jeux de données
Règles métiers et de documentation dans un projet d’analyse de données
- Définition des règles métiers
- Création d’un dictionnaire de données
- Création d’un fichier readme
Méthodes statistiques d’analyse de données
- Partie univariée (moyenne, écart type, variance, boite à moustache, histogramme)
- Partie multivariée (ACP,AFC,ACM)
Initiation au Machine Learning
- Régression linéaire
- Régression logistique
- Arbres de classification et de régression
- Méthode des k plus proches voisins(KNN)
- Partitionnement en K-moyennes (K-Mean Clustering)
Visualisation des données
- Créer les graphiques de base
- Insérer un graphique Excel
- Gérer les graphiques et les raccourcis par défaut
Atelier pratique
Une attestation d’assiduité sera délivrée après la validation de toutes les compétences de ce module.
POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS