• Formation
  • Réf. 12855
Télécharger le programme

Formation : Python pour l'analyse exploratoire de données

  • 3 jours (21 heures)
  • Présentiel ou à distance

Cette formation vous enseignera les fondamentaux du traitement des données en Python, de la collecte de données brutes au nettoyage et à la mise en forme de celles-ci afin de les exploiter pour créer de modèles prédictifs, établir des statistiques et des indicateurs, et bien plus encore.

...

Formation : Python pour l'analyse exploratoire de données

Objectifs

  • Savoir collecter, nettoyer et préparer des données à l’aide des bibliothèques Python adaptées (NumPy, Pandas) afin de les rendre exploitables pour l’analyse
  • Être capable de réaliser des analyses statistiques et de développer des modèles prédictifs simples en choisissant les techniques appropriées (régression, classification)
  • Maîtriser les outils de scraping et de manipulation de données en Python pour extraire, transformer et analyser des données issues de différentes sources

Pré-requis

  • Connaissances de base en Python et statistiques.

Cibles

  • Développeurs en Python,
  • Responsables Infocentre,
  • Développeurs de logiciels,
  • Programmeurs,
  • Data analysts,
  • Data scientists.

Les plus

  • Déclinable en format individuel, intra-entreprise et sur-mesure

Modalités pédagogiques

  • Alternance d’exposés, de travaux pratiques et de séquences interactives

Suivi et évaluation des acquis

  • Évaluation des acquis en amont via un questionnaire d’auto-positionnement et en aval via un questionnaire d’évaluation rempli par le formateur sur la base des mises en situation réalisées en formation
  • L’évaluation des acquis se fait également tout au long de la session au travers des multiples exercices à réaliser
  • Distanciel : contenu et durée identiques + pédagogie adaptée + assistance technique 5j/7 (disponible par mail : [email protected])
  • Un support de cours est remis à chaque stagiaire

Indicateurs de résultats

  • Indicateurs de résultat et taux de réussite prochainement disponibles

Introduction à la structure des données en Python

  • Python pour les manipulations de données
  • Listes, ensembles, strings, tuples et dictionnaires

Opérations avancées sur la structure de données intégrée

  • Structures de données avancées
  • Opérations de base sur les fichiers en Python

Introduction à NumPy, Pandas et Matplotlib

  • Les tableaux NumPy
  • Les DataFrames Pandas
  • Statistiques et visualisation avec NumPy et Pandas
  • Utiliser NumPy et Pandas pour calculer des statistiques descriptives de base sur le DataFrame

Data Wrangling avec Python

  • Définition et processus
  • Sous-ensembles, filtrage et regroupement
  • Détection des valeurs extrêmes et traitement des valeurs manquantes
  • Concaténer, fusionner et joindre
  • Les méthodes utiles de Pandas
  • Compréhension avancée des listes et fonction zip
  • Formatage des données

Scraping de données avec Python

  • Définition du scraping
  • Les différents niveaux de difficulté sur plusieurs supports
  • Lecture de données provenant de différentes sources textuelles, et non textuelles.
  • Outils de scrapping
  • Introduction à BeautifulSoup
  • Introduction à CSS Select

Scraping avancé et collecte de données

  • Les bases du Web scraping, bibliothèques BeautifulSoup
  • Python comme solution ETL
  • Formats de données structurées : CSV, flux XML et JSON
  • Lire et écrire des fichiers
  • Exploiter des données de fichiers provenant de différentes sources
  • Fonctions pour l'accès et le chargement de données en blocs de lignes

Implémenter un scraper

  • Scraper simple avec les requêtes GET et les pages séquencées
  • Identification de la stratégie de navigation sur le site pour trouver les données
  • Construction de l'algorithme du scraper
  • Scraper complexe : envoi de données à un site Web, obtention de résultats plus complexes
  • Requêtes POST et GET
  • Parcourir un site pour trouver les données
  • Identifier la stratégie à adopter
  • Coder le scraper

Application dans la vie réelle et conclusion du cours

  • Appliquer vos connaissances à des tâches de data wrangling et data scraping de la vie réelle

Formateurs

Maher HENI

Maher H.

Formateur expert en Big Data, analyse et visualisation des données

Docteur ingénieur en Technologies de l'Information et de la Communication (TIC), Maher HENI est spécialisé en Big Data, analyse et visualisation des données depuis 2014. Il a conduit de nombreux projets au sein d’organisations variées,...

En savoir plus

Ce produit a été mis à jour le 13/10/2025

Formation du catalogue Comundi pour votre entreprise dans vos locaux, chez nous ou à distance.

Demander un devis

À réception de votre demande, la validation et la mise en œuvre de votre projet sur une formation sera possible sous 48h.

Formation sur mesure adaptée aux spécificités de votre entreprise et de vos équipes.

Nos experts vous accompagnent dans votre projet.

Demander un devis

À réception de votre demande, la validation et la mise en œuvre de votre projet sur une formation sera possible sous 48h.

x
Chargement

Merci de patienter ...