NLP Natural Language Processing

2 jours (14 heures)

Formation certifiante - Code CNCP : 2234 - Certif Info : 93835

Objectifs

Comprendre le Traitement du langage naturel (NLP)
Comprendre le Text Mining
Comprendre la classification des textes et l’analyse des sentiments
Utiliser des principales librairies de NLP
Construire un pipeline de modélisation du NLP
Savoir modéliser un problème de Machine Learning sur des données non structurées
Application d’algorithmes de machine learning sur des données textuelles
Perfectionner les modèles à l’aide d’hyper-paramètres

Prérequis

Programmation Python
Concepts de base de machine learning

Vous n’avez pas les prérequis nécessaires pour la formation NLP – Natural Language Processing ? Contactez nous pour étudier ensemble un parcours sur mesure et garantir le résultat

Intervenants

Les contenus pédagogiques sont synchronisés sur les évolutions techniques grâce à notre équipe d’intervenant experts et professionnels du secteur enseigné. Les formateurs qui interviennent pour animer les formations ont une double compétence : compétence informatique et compétence métier (Banque, Assurance, Administration, Santé, Transport).

PROGRAMME DE FORMATION NLP NATURAL LANGUAGE PROCESSING

Jour 1

Section 1 : Découvrir le NLP

Traitement du langage naturel avec Python
Connaître les prérequis théoriques et techniques
Utiliser les fichiers d’exercice
Comprendre le NLP
Découvrir les domaines et les exemples d’application du NLP
Installer Anaconda
Aborder l’environnement Jupyter
Comprendre le pipeline de modélisation NLP
Support pdf

- Utiliser les fichiers d’exercice
- Comprendre le NLP
- Découvrir les domaines et les exemples d’application du NLP
- Installer Anaconda
- Aborder l’environnement Jupyter
- Comprendre le pipeline de modélisation NLP

TP
Quiz

Section 2 : Traiter un texte avec Python

Stocker un texte brut dans une structure de données Python
Utiliser Pandas pour lire les données
Comprendre les expressions régulières
Utiliser les expressions régulières avec le module Re de Python
Étudier les fonctions les plus populaires du module Re
Support pdf
- Stocker un texte brut dans une structure de données Python
- Utiliser Pandas pour lire les données
- Comprendre les expressions régulières
- Utiliser les expressions régulières avec le module Re de Python
- Étudier les fonctions les plus populaires du module Re
TP
Quiz

Section 3 : Préparer les données

Aborder les étapes de préparation des données
Réaliser un exemple de nettoyage de données
Supprimer les stopwords
Réaliser le stemming avec NLTK
Pratiquer la lemmatization avec NLTK
Comparer le stemming et la lemmatization
Support pdf
- Aborder les étapes de préparation des données
- Supprimer les caractères de ponctuation
- Supprimer les stopwords
- Réaliser le stemming avec NLTK
- Réaliser la lemmatization avec NLTK
- Comparer le stemming et la lemmatization
TP
Quiz

Section 4 : Transformer un texte en chiffres

Comprendre la vectorisation avec CountVectorizer
Utiliser CountVectorizer
Effectuer une vectorisation contextuelle avec N-Grams
Étudier TF-IDF
Utiliser TF-IDF
Appréhender le feature engineering
Ajouter des features aux données
Analyser les features
Support pdf
- Comprendre la vectorisation
- Comprendre la vectorisation avec CountVectorizer
- Utiliser CountVectorizer
- Effectuer une vectorisation contextuelle avec N-Grams
- Étudier TF-IDF
- Utiliser TF-IDF
- Appréhender le feature engineering
TP
Quiz

Section 5 : Comprendre l’expérience machine learning – NLP

Apprendre la méthode K-fold
Comprendre la matrice de confusion d’un modèle de classification
Comprendre les mesures de performance d’un modèle NLP
Aborder l’overfitting (le surapprentissage)
Support pdf
- Apprendre la méthode K-fold
- La validation croisée avec Scikit-learn
- Matrice de Confusion d’un modèle de classification
- Les mesures de performance d’un modèle NLP
Quiz

Jour 2

Section 6 : Réaliser un modèle de classification avec SVM

Modéliser en machine learning
Aborder l’algorithme Support Vector Machine
Utiliser le SVM avec scikit-learn et CountVectorizer
Tester le modèle de classification SVM
Mesurer les performances du modèle de classification SVM
Utiliser le SVM avec la cross-validation
Utiliser le SVM avec TF-IDF
Support pdf
- Machine Learning
- Aborder l’algorithme Support Vector Machine
- Utiliser le SVM avec scikit-learn
- Tester le modèle de classification
- Utiliser le SVM avec la cross-validation
TP
Quiz

Section 7 : Réaliser un modèle de classification avec le Random forest

Aborder l’algorithme Random forest
Utiliser Random forest pour construire un modèle de classification
Mesurer les performances d’un modèle de classification Random forest
Utiliser Random forest avec K-fold
Support pdf
- Aborder l’algorithme Random forest
- Utiliser Random forest pour construire un modèle de classification
- Mesurer les performances d’un modèle de classification Random forest
- Utiliser Random forest avec K-fold
TP
Quiz

Section 8 : Perfectionner un modèle avec l’hyperparamètre

Programmer un hyperparamètre avec le modèle SVM
Programmer un hyperparamètre avec Random forest
Évaluer les résultats d’un hyperparamètre
Tester GridSearchCV avec un SVM
Tester GridSearchCV avec Random forest
Détecter les features les plus importantes avec le Random forest
Homogénéiser les données avec TF-IDF
Tester Random forest sur des données homogènes
Sélectionner un modèle
Conclure sur le traitement du NLP avec Python
Support pdf
- Programmer un hyperparamètre avec le modèle SVM
- Programmer un hyperparamètre avec Random forest
- Évaluer les résultats d’un hyperparamètre
- Tester GridSearchCV avec un SVM
- Tester GridSearchCV avec Random forest
TP
Quiz

Section 9 : Examen final

Synthèse du cours
TP Général
Examen final

Une attestation d’assiduité sera délivrée après la validation de toutes les compétences de ce module.

POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS

CONTACTEZ-NOUS