1 jour (7 heures)

Formation certifiante - Code CNCP : 2234 - Certif Info : 93835

Objectifs

  • Disposer d’une vision claire du Big Data et de ses enjeux
  • Connaître les concepts sous­ jacents
  • Connaître l’écosystème, et comprendre les principales technologies et solutions associées au Big Data
  • Comprendre comment les entreprises les plus avancées, dans tous les secteurs économiques, ont mis en place et tiré profit de projets Big Data
  • Présenter l’ensemble des paramètres à prendre en compte pour réussir l’intégration du Big Data dans la vision large du SI
  • Connaître les informations essentielles pour lancer une initiative Big Data
  • Comprendre l’architecture Cloud / scalable
  • Connaître l’impact du Big Data et ses champs d’applications
  • Être en mesure d’exploiter le Big Data dans le respect des règles de sécurité et de confidentialité

Prérequis

  • Connaître l’utilité du Data Mining et les problématiques du Big Data dans les approches statistiques
  • Avoir des connaissances minimum de Linux et des lignes de commandes
  • Connaissances du langage java et de son écosystème (maven, IDE)
  • Avoir des connaissance sur le réseau
  • Avoir des connaissances de ce que sont REST/HTTP
  • Avoir des connaissances du format Json, Yaml

Vous n’avez pas les prérequis nécessaires pour la formation Introduction à la Data Science ? Contactez nous pour étudier ensemble un parcours sur mesure et garantir ainsi la réussite de votre projet.

Intervenants

Les contenus pédagogiques sont synchronisés sur les évolutions techniques grâce à notre équipe d’intervenant experts et professionnels du secteur enseigné. Les formateurs qui interviennent pour animer les formations ont une double compétence : compétence informatique et compétence métier (Banque, Assurance, Administration, Santé, Transport).

PROGRAMME DE FORMATION INTRODUCTION À LA DATA SCIENCE

Big data

Deep learning

  • Perceptron
  • Réseaux neuronaux multicouches (MLP)
  • Réseaux neuronaux convolutifs (CNN)
  • Réseaux neuronaux récursifs (RNN)

Machine Learning

  • Apprentissage automatique supervisé/ non supervisé
  • Algorithmes du Machine Learning

Principes de la data science

  • Approche fonctionnelle de base
  • Variables prédictives
  • Variables à prédire
  • Fonctions hypothèses
  • Estimateurs (biais et variances)
  • Compromis biais – variance
  • Fonctions de perte
  • Régularisation des paramètres
  • Optimisation des paramètres

Clustering

  • k-moyens (kMeans)
  • Clustering hiérarchique
  • Approche DBSCAN

Classification

  • Régression logistique
  • Machines à vecteurs de support (SVM)
  • Arbres de décisions
  • K plus proches voisins (kNN)

Traitements en Data Science

  • Compressions des données
  • Réglages des modèles

Principes de l’apprentissage d’ensemble

  • Forêts aléatoires
  • gradient boosting

Principes de la régression

  • Explorations des données régressives
  • Performance des modèles de régression

Atelier Cas pratique

Une attestation d’assiduité sera délivrée après la validation de toutes les compétences de ce module.

POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS