2 jours (14 heures)

Formation certifiante - Code CNCP : 2234 - Certif Info : 93835

Objectifs

  • Comprendre le Traitement du langage naturel (NLP)
  • Comprendre le Text Mining
  • Comprendre la classification des textes et l’analyse des sentiments
  • Utiliser des principales librairies de NLP
  • Construire un pipeline de modélisation du NLP
  • Savoir modéliser un problème de Machine Learning sur des données non structurées
  • Application d’algorithmes de machine learning sur des données textuelles
  • Perfectionner les modèles à l’aide d’hyper-paramètres

Prérequis

  • Programmation Python 
  • Concepts de base de machine learning 

Vous n’avez pas les prérequis nécessaires pour la formation NLP – Natural Language Processing  ? Contactez nous pour étudier ensemble un parcours sur mesure et garantir le résultat

Intervenants

Les contenus pédagogiques sont synchronisés sur les évolutions techniques grâce à notre équipe d’intervenant experts et professionnels du secteur enseigné. Les formateurs qui interviennent pour animer les formations ont une double compétence : compétence informatique et compétence métier (Banque, Assurance, Administration, Santé, Transport).

PROGRAMME DE FORMATION NLP NATURAL LANGUAGE PROCESSING

Jour 1

Section 1 : Découvrir le NLP

  • Traitement du langage naturel avec Python
  • Connaître les prérequis théoriques et techniques
  • Utiliser les fichiers d’exercice
  • Comprendre le NLP
  • Découvrir les domaines et les exemples d’application du NLP
  • Installer Anaconda
  • Aborder l’environnement Jupyter
  • Comprendre le pipeline de modélisation NLP
  • Support pdf
    • Utiliser les fichiers d’exercice
    • Comprendre le NLP
    • Découvrir les domaines et les exemples d’application du NLP
    • Installer Anaconda
    • Aborder l’environnement Jupyter
    • Comprendre le pipeline de modélisation NLP
  • TP
  • Quiz

Section 2 : Traiter un texte avec Python

  • Stocker un texte brut dans une structure de données Python
  • Utiliser Pandas pour lire les données
  • Comprendre les expressions régulières
  • Utiliser les expressions régulières avec le module Re de Python
  • Étudier les fonctions les plus populaires du module Re
  • Support pdf
    • Stocker un texte brut dans une structure de données Python
    • Utiliser Pandas pour lire les données
    • Comprendre les expressions régulières
    • Utiliser les expressions régulières avec le module Re de Python
    • Étudier les fonctions les plus populaires du module Re
  • TP
  • Quiz

Section 3 : Préparer les données

  • Aborder les étapes de préparation des données
  • Réaliser un exemple de nettoyage de données
  • Supprimer les stopwords
  • Réaliser le stemming avec NLTK
  •  Pratiquer la lemmatization avec NLTK
  • Comparer le stemming et la lemmatization
  • Support pdf
    • Aborder les étapes de préparation des données
    • Supprimer les caractères de ponctuation
    • Supprimer les stopwords
    • Réaliser le stemming avec NLTK
    • Réaliser la lemmatization avec NLTK
    • Comparer le stemming et la lemmatization
  • TP
  • Quiz

Section 4 : Transformer un texte en chiffres

  • Comprendre la vectorisation avec CountVectorizer
  • Utiliser CountVectorizer
  • Effectuer une vectorisation contextuelle avec N-Grams
  • Étudier TF-IDF
  • Utiliser TF-IDF
  • Appréhender le feature engineering
  • Ajouter des features aux données
  • Analyser les features
  • Support pdf
    • Comprendre la vectorisation
    • Comprendre la vectorisation avec CountVectorizer
    • Utiliser CountVectorizer
    • Effectuer une vectorisation contextuelle avec N-Grams
    • Étudier TF-IDF
    • Utiliser TF-IDF
    • Appréhender le feature engineering
  • TP
  • Quiz

Section 5 : Comprendre l’expérience machine learning – NLP

  • Apprendre la méthode K-fold
  • Comprendre la matrice de confusion d’un modèle de classification
  • Comprendre les mesures de performance d’un modèle NLP
  • Aborder l’overfitting (le surapprentissage)
  • Support pdf
    • Apprendre la méthode K-fold
    • La validation croisée avec Scikit-learn
    • Matrice de Confusion d’un modèle de classification
    • Les mesures de performance d’un modèle NLP
  • Quiz
Jour 2

Section 6 : Réaliser un modèle de classification avec SVM

  • Modéliser en machine learning
  • Aborder l’algorithme Support Vector Machine
  • Utiliser le SVM avec scikit-learn et CountVectorizer
  • Tester le modèle de classification SVM
  • Mesurer les performances du modèle de classification SVM
  • Utiliser le SVM avec la cross-validation
  • Utiliser le SVM avec TF-IDF
  • Support pdf
    • Machine Learning
    • Aborder l’algorithme Support Vector Machine
    • Utiliser le SVM avec scikit-learn
    • Tester le modèle de classification
    • Utiliser le SVM avec la cross-validation
  • TP
  • Quiz

Section 7 : Réaliser un modèle de classification avec le Random forest

  • Aborder l’algorithme Random forest
  • Utiliser Random forest pour construire un modèle de classification
  • Mesurer les performances d’un modèle de classification Random forest
  • Utiliser Random forest avec K-fold
  • Support pdf
    • Aborder l’algorithme Random forest
    • Utiliser Random forest pour construire un modèle de classification
    • Mesurer les performances d’un modèle de classification Random forest
    • Utiliser Random forest avec K-fold
  • TP
  • Quiz

Section 8 : Perfectionner un modèle avec l’hyperparamètre

  • Programmer un hyperparamètre avec le modèle SVM
  • Programmer un hyperparamètre avec Random forest
  • Évaluer les résultats d’un hyperparamètre
  • Tester GridSearchCV avec un SVM
  • Tester GridSearchCV avec Random forest
  • Détecter les features les plus importantes avec le Random forest
  • Homogénéiser les données avec TF-IDF
  • Tester Random forest sur des données homogènes
  • Sélectionner un modèle
  • Conclure sur le traitement du NLP avec Python
  • Support pdf
    • Programmer un hyperparamètre avec le modèle SVM
    • Programmer un hyperparamètre avec Random forest
    • Évaluer les résultats d’un hyperparamètre
    • Tester GridSearchCV avec un SVM
    • Tester GridSearchCV avec Random forest
  • TP
  • Quiz

Section 9 : Examen final

  • Synthèse du cours
  • TP Général
  • Examen final

Une attestation d’assiduité sera délivrée après la validation de toutes les compétences de ce module.

POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS