2 jours (14 heures)
Formation certifiante - Code CNCP : 2234 - Certif Info : 93835
- Présentiel
- Blended - Learning
- FOAD / E-learning tutoré
Objectifs
- Comprendre le Traitement du langage naturel (NLP)
- Comprendre le Text Mining
- Comprendre la classification des textes et l’analyse des sentiments
- Utiliser des principales librairies de NLP
- Construire un pipeline de modélisation du NLP
- Savoir modéliser un problème de Machine Learning sur des données non structurées
- Application d’algorithmes de machine learning sur des données textuelles
- Perfectionner les modèles à l’aide d’hyper-paramètres
Prérequis
- Programmation Python
- Concepts de base de machine learning
Vous n’avez pas les prérequis nécessaires pour la formation NLP – Natural Language Processing ? Contactez nous pour étudier ensemble un parcours sur mesure et garantir le résultat
Intervenants
Les contenus pédagogiques sont synchronisés sur les évolutions techniques grâce à notre équipe d’intervenant experts et professionnels du secteur enseigné. Les formateurs qui interviennent pour animer les formations ont une double compétence : compétence informatique et compétence métier (Banque, Assurance, Administration, Santé, Transport).
PROGRAMME DE FORMATION NLP NATURAL LANGUAGE PROCESSING
Section 1 : Découvrir le NLP
- Traitement du langage naturel avec Python
- Connaître les prérequis théoriques et techniques
- Utiliser les fichiers d’exercice
- Comprendre le NLP
- Découvrir les domaines et les exemples d’application du NLP
- Installer Anaconda
- Aborder l’environnement Jupyter
- Comprendre le pipeline de modélisation NLP
- Support pdf
- Utiliser les fichiers d’exercice
- Comprendre le NLP
- Découvrir les domaines et les exemples d’application du NLP
- Installer Anaconda
- Aborder l’environnement Jupyter
- Comprendre le pipeline de modélisation NLP
- TP
- Quiz
Section 2 : Traiter un texte avec Python
- Stocker un texte brut dans une structure de données Python
- Utiliser Pandas pour lire les données
- Comprendre les expressions régulières
- Utiliser les expressions régulières avec le module Re de Python
- Étudier les fonctions les plus populaires du module Re
- Support pdf
- Stocker un texte brut dans une structure de données Python
- Utiliser Pandas pour lire les données
- Comprendre les expressions régulières
- Utiliser les expressions régulières avec le module Re de Python
- Étudier les fonctions les plus populaires du module Re
- TP
- Quiz
Section 3 : Préparer les données
- Aborder les étapes de préparation des données
- Réaliser un exemple de nettoyage de données
- Supprimer les stopwords
- Réaliser le stemming avec NLTK
- Pratiquer la lemmatization avec NLTK
- Comparer le stemming et la lemmatization
- Support pdf
- Aborder les étapes de préparation des données
- Supprimer les caractères de ponctuation
- Supprimer les stopwords
- Réaliser le stemming avec NLTK
- Réaliser la lemmatization avec NLTK
- Comparer le stemming et la lemmatization
- TP
- Quiz
Section 4 : Transformer un texte en chiffres
- Comprendre la vectorisation avec CountVectorizer
- Utiliser CountVectorizer
- Effectuer une vectorisation contextuelle avec N-Grams
- Étudier TF-IDF
- Utiliser TF-IDF
- Appréhender le feature engineering
- Ajouter des features aux données
- Analyser les features
- Support pdf
- Comprendre la vectorisation
- Comprendre la vectorisation avec CountVectorizer
- Utiliser CountVectorizer
- Effectuer une vectorisation contextuelle avec N-Grams
- Étudier TF-IDF
- Utiliser TF-IDF
- Appréhender le feature engineering
- TP
- Quiz
Section 5 : Comprendre l’expérience machine learning – NLP
- Apprendre la méthode K-fold
- Comprendre la matrice de confusion d’un modèle de classification
- Comprendre les mesures de performance d’un modèle NLP
- Aborder l’overfitting (le surapprentissage)
- Support pdf
- Apprendre la méthode K-fold
- La validation croisée avec Scikit-learn
- Matrice de Confusion d’un modèle de classification
- Les mesures de performance d’un modèle NLP
- Quiz
Section 6 : Réaliser un modèle de classification avec SVM
- Modéliser en machine learning
- Aborder l’algorithme Support Vector Machine
- Utiliser le SVM avec scikit-learn et CountVectorizer
- Tester le modèle de classification SVM
- Mesurer les performances du modèle de classification SVM
- Utiliser le SVM avec la cross-validation
- Utiliser le SVM avec TF-IDF
- Support pdf
- Machine Learning
- Aborder l’algorithme Support Vector Machine
- Utiliser le SVM avec scikit-learn
- Tester le modèle de classification
- Utiliser le SVM avec la cross-validation
- TP
- Quiz
Section 7 : Réaliser un modèle de classification avec le Random forest
- Aborder l’algorithme Random forest
- Utiliser Random forest pour construire un modèle de classification
- Mesurer les performances d’un modèle de classification Random forest
- Utiliser Random forest avec K-fold
- Support pdf
- Aborder l’algorithme Random forest
- Utiliser Random forest pour construire un modèle de classification
- Mesurer les performances d’un modèle de classification Random forest
- Utiliser Random forest avec K-fold
- TP
- Quiz
Section 8 : Perfectionner un modèle avec l’hyperparamètre
- Programmer un hyperparamètre avec le modèle SVM
- Programmer un hyperparamètre avec Random forest
- Évaluer les résultats d’un hyperparamètre
- Tester GridSearchCV avec un SVM
- Tester GridSearchCV avec Random forest
- Détecter les features les plus importantes avec le Random forest
- Homogénéiser les données avec TF-IDF
- Tester Random forest sur des données homogènes
- Sélectionner un modèle
- Conclure sur le traitement du NLP avec Python
- Support pdf
- Programmer un hyperparamètre avec le modèle SVM
- Programmer un hyperparamètre avec Random forest
- Évaluer les résultats d’un hyperparamètre
- Tester GridSearchCV avec un SVM
- Tester GridSearchCV avec Random forest
- TP
- Quiz
Section 9 : Examen final
- Synthèse du cours
- TP Général
- Examen final
Une attestation d’assiduité sera délivrée après la validation de toutes les compétences de ce module.
POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS