Réservez les formations disponibles partout en France !

location-dot
location-dot
location-dot
À partir de
location-dot
image OF
  1. Text mining - niveau avancé : optimisez vos analyse de données

Text mining - niveau avancé : optimisez vos analyse de données

Qualiopi
En centre
Non éligible CPF
Sélectionnez une session :

Choisissez une date pour pouvoir réserver !

Objectifs
Programme
  • Maîtriser les concepts fondamentaux du text mining et les techniques statistiques associées.
  • Appliquer le processus d'extraction de caractéristiques à partir de données textuelles et comprendre son importance dans l'analyse de texte.
  • Effectuer des sélections et des classements efficaces au sein de grands volumes de données textuelles pour faciliter l'analyse.
  • Sélectionner l'algorithme de classification le plus approprié en fonction de la nature des données et des objectifs de l'analyse.
  • Evaluer de manière critique les performances prédictives d'un algorithme en utilisant des mesures appropriées.
  • Développer une capacité à interpréter les résultats de l'analyse textuelle pour une prise de décision éclairée.

1. LES APPROCHES TRADITIONNELLES EN TEXT MINING

  • Découverte des API pour récupérer des données textuelles
  • Étude de la préparation des données textuelles en fonction de la problématique
  • Apprentissage de la récupération et l'exploration du corpus de textes
  • Mise en pratique de la suppression des caractères accentués et spéciaux
  • Introduction au Stemming, Lemmatization et suppression des mots de liaison
  • Synthèse des acquis pour nettoyer et normaliser les données

2. FEATURE ENGINEERING POUR LA REPRÉSENTATION DE TEXTE

  • Compréhension de la syntaxe et la structure du texte
  • Exploration du modèle Bag of Words et Bag of N-Grams
  • Approfondissement du modèle TF-IDF, Transformer et Vectorizer
  • Découverte du modèle Word2Vec et l’implémentation avec Gensim
  • Présentation du modèle GloVe
  • Étude du modèle FastText

3. LA SIMILARITÉ DES TEXTES ET CLASSIFICATION NON SUPERVISÉE

  • Comprendre les concepts essentiels de similarité
  • Analyse de la similarité des termes : distances Hamming, Manhattan, Euclidienne et Levenshtein
  • Étude de la similarité des documents
  • Explication d'Okapi BM25 et le palmarès de classement
  • Introduction aux algorithmes de classification non supervisée

4. LA CLASSIFICATION SUPERVISÉE DU TEXTE

  • Prétraitement et normalisation des données
  • Découverte des modèles de classification
  • Étude du modèle Multinomial Naïve Bayes
  • Approfondissement de la Régression logistique et des Support Vector Machines
  • Introduction à l'algorithme Random Forest et aux Gradient Boosting Machines
  • Évaluation des modèles de classification

5. NATURAL LANGUAGE PROCESSING ET DEEP LEARNING

  • Présentation des librairies NLP : NLTK, TextBlob, SpaCy, Gensim, Pattern, Stanford CoreNLP
  • Découverte des librairies Deep Learning : Theano, TensorFlow, Keras
  • Étude du Natural Language Processing et des Recurrent Neural Networks
  • Approfondissement des RNN et Long Short-Term Memory
  • Introduction aux modèles bidirectionnels RNN et Sequence-to-Sequence
  • Questions et réponses avec les modèles RNN

Public visé
Cette formation s'adresse à divers profils professionnels évoluant dans le domaine de l'Intelligence Artificielle. Elle est particulièrement pertinente pour les ingénieurs et chefs de projet IA qui souhaitent approfondir leurs compétences techniques et méthodologiques dans le traitement automatisé des données textuelles. Les consultants IA pourront également y trouver un moyen efficace d'enrichir leur boîte à outils méthodologiques et d'élargir leur panel de services proposés aux clients. Plus généralement, toute personne ayant pour projet d'explorer le Text Mining dans le cadre du Machine Learning et du Deep Learning est la bienvenue. Que vous soyez un professionnel confirmé ou un débutant désireux de vous initier à ces techniques, cette formation vous offrira un socle de connaissances solide et des compétences pratiques immédiatement opérationnelles.
Prérequis
Avoir une bonne connaissance des statistiques. Vous devez être à l'aise avec les concepts fondamentaux tels que les moyennes, les écarts-types, les distributions, les tests d'hypothèses, etc. Posséder de solides connaissances en Machine Learning et en Deep Learning. Vous devez être en mesure de comprendre et d'appliquer des techniques d'apprentissage automatique pour classifier, regrouper ou prédire des données. Justifier d'une expérience préalable en data science ou en analyse de données. Cette formation est destinée aux personnes qui ont déjà une certaine expérience dans le domaine. Être muni d'un ordinateur relié à Internet, possédant une caméra, un micro et un haut-parleur.
Méthodes pédagogiques

L’approche pédagogique a été construite sur l’interactivité et la personnalisation : Présentation illustrée et animée par le Formateur Expert, partage d’expériences, études de cas, mise en situation réelle.
Tous les supports sont fournis par support papier, mail ou clé USB à chaque stagiaire.

Méthodologie pédagogique employée :
Chaque formation en présentiel ou en distanciel est animée par un Formateur Expert Métier sélectionné selon ses compétences et expériences professionnelles. Apport d’expertise du Formateur, quiz en début et fin de formation, cas pratiques, échanges d’expérience. Accès en ligne au support de formation.

Modalités d'évaluation

Méthodes utilisées et évaluation :
Evaluation et positionnement lors de la définition du projet pédagogique avec le(s) stagiaire(s). Un QCM est donné aux stagiaires le dernier jour de la formation pour valider leurs apprentissages. Une correction collective est effectuée par le Formateur. Une évaluation de fin de stage en direct est organisée entre le Formateur et le(s) stagiaire(s) pour recueillir et prendre en compte leurs appréciations. Une attestation de fin de stage est remise aux stagiaires.

Choisissez une date pour pouvoir réserver !

Autres formations disponibles :
Prochaines sessions disponibles :
Qualiopi
En visio
Non éligible CPF
Prochaines sessions disponibles :
Qualiopi
En visio
Non éligible CPF
Entreprise seulement
Prochaines sessions disponibles :
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :
Qualiopi
En centre
Non éligible CPF
logo ouformer
Réalisation :Definima
Utilisation des cookies

Nous utilisons des cookies pour vous fournir l'ensemble de nos services, notamment la recherche et les alertes. En acceptant, vous consentez à notre utilisation de ces cookies.

Tout refuser
Tout accepter