> Formations > Technologies numériques > Intelligence Artificielle, Big Data > IA, Machine Learning, analyse de données > Formation Data Scientist, Bootcamp (3 mois) > Formations > Technologies numériques > Formation Data Scientist, Bootcamp (3 mois)

Data Scientist, Bootcamp (3 mois)

by DataScientest

Data Scientist, Bootcamp (3 mois)

by DataScientest



ORSYS et DataScientest, leader dans le domaine de la data science en France, proposent un parcours de formation complet pour exercer le métier de data scientist. Le data scientist traite les données et élabore des modèles prédictifs. Ce parcours en ligne vous apprend les fondamentaux du langage Python et l'usage de ses principales bibliothèques pour la data science. Vous apprenez également toutes les technologies autour de l’analyse de la donnée comme la data visualisation, le machine learning, le big data, le deep learning ainsi que les systèmes complexes et l’intelligence artificielle (IA).


Catalogue
Sur mesure

Formation en ligne

Réf. 4IK
  399h00
Prix : 6490 € H.T.
Langue : FR




ORSYS et DataScientest, leader dans le domaine de la data science en France, proposent un parcours de formation complet pour exercer le métier de data scientist. Le data scientist traite les données et élabore des modèles prédictifs. Ce parcours en ligne vous apprend les fondamentaux du langage Python et l'usage de ses principales bibliothèques pour la data science. Vous apprenez également toutes les technologies autour de l’analyse de la donnée comme la data visualisation, le machine learning, le big data, le deep learning ainsi que les systèmes complexes et l’intelligence artificielle (IA).


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Connaître les fondamentaux du langage Python
Maîtriser les bibliothèques Python dédiées à la data science
Effectuer de la data visualisation
Utiliser les technologies autour de la data science (data visualisation, machine learning, big data, deep learning…)
Comprendre les systèmes complexes et l’intelligence artificielle Comprendre les systèmes complexes et l’IA

Public concerné
Toutes les personnes ayant une appétence pour la programmation et la manipulation des données.

Prérequis
Avoir un niveau bac +3 en mathématiques ou un niveau bac +5 en sciences (ingénieur, mathématiques, statistiques, économétrie…). Des notions de marketing et de communication sont un plus.

Méthodes et moyens pédagogiques
Activités digitales
Test de positionnement sous forme de QCM d'une heure, séance d’introduction à la plateforme à distance, classes collectives, classe de soutien sur mesure, simulation et codage en direct, exercices, fiches de synthèse, projet fil rouge dédié, social learning, échanges avec data scientists.
Tutorat
Un data scientist expert accompagne par e-mail l'apprenant dès son entrée en formation. Il échange avec lui et l'aide à assimiler les compétences théoriques et pratiques nécessaires à la réussite de sa formation. Lui ou un second data scientist expert anime des classes à distance collectives durant 15 % du temps ainsi que des ateliers collectifs de soutien. L'apprenant dispose également d'un mentor dédié au suivi de son projet fil rouge avec qui il fait des points réguliers.
Pédagogie et pratique
Formation digitale basée sur une pédagogie active et conçue avec des experts en data science. Une combinaison de théorie, de démonstrations, de mises en pratique, de partages d’expériences et de bonnes pratiques. Un test de positionnement, un accompagnement sur mesure dès le début du parcours, un projet fil rouge et des séquences pédagogiques de courte durée permettent de renforcer l’apprentissage et d’évaluer l'apprenant tout au long de sa formation. En cas de besoin technique, une cellule support est disponible en ligne 5 jours sur 7 de 9 h à 18 h 30. À l’issue de son parcours en ligne, l'apprenant reçoit un certificat délivré par Mines ParisTech | PSL Executive Education, ce qui lui permet de bénéficier de la reconnaissance d’un acteur de référence dans le domaine.

Programme de la formation

Fondamentaux de Python

  • Découverte des différents types de variables, des listes et des tuples.
  • Présentation des divers opérateurs et structures de contrôle.
  • Initiation au concept de boucle et ses différents types.
  • Introduction aux fonctions et leur documentation.
  • Instanciation de classes et utilisation de modules.

Bibliothèques NumPy et Pandas

  • Création et manipulation d’un tableau NumPy array.
  • Présentation des opérations matricielles et manipulation d'un NumPy array.
  • Création d’un indicateur statistique et opérations sur un NumPy array.
  • Introduction à la bibliothèque Pandas.
  • Introduction au nettoyage des données (data cleaning).
  • Introduction au data processing.
  • En option : data quality (principes, variables, nettoyage de données, gestion des valeurs manquantes).

Matplotlib et Seaborn

  • Présentation des différents types de graphiques.
  • Introduction à la personnalisation des graphiques.
  • Seaborn : maîtrise de l'analyse des distributions.
  • Mise en place de l'analyse statistique.
  • Initiation à l'analyse multivariée.
  • Bokeh (optionnel).
  • Formation à tout type de graphiques interactifs et intégrables sur page web.
  • Visualisation de données géographiques.
  • Découverte et création de widgets.

Machine learning

  • Introduction à scikit-learn et présentation de la classification support vector machines (SVM).
  • Application de la méthode des k plus proches voisins (k-nearest neighbors ou KNN).
  • Sélection de modèles et classification semi-supervisée.
  • Présentation des algorithmes des k-moyennes.
  • Découvertes des algorithmes de mean shift.
  • Introduction à la régression linéaire simple et multiple.
  • Introduction à la régression linéaire régularisée.
  • Feature selection process.
  • Initiation aux analyses en composantes principales.
  • Application de l'approche manifold learning.

Séries temporelles avec Statsmodels et text mining

  • Création de nuages de mots (word clouds).
  • Découverte des modèles de base.
  • Découverte des modèles ARIMA.
  • Text mining : introduction aux expressions régulières.
  • Gestion de données textuelles.

Machine learning et théorie des graphes avec NetworkX

  • Introduction à la théorie des graphes.
  • Application des algorithmes fondamentaux : Krustal et Dijkstra.
  • Détection de communautés.
  • Application de l'algorithme PageRank au classement de pages web.

Introduction au data engineering et big data

  • Introduction aux 3V du big data (volume, variété, vélocité).
  • Présentation des bases de données et des architectures.
  • Mise en production de données.
  • Data processing et machine learning sur des grandes bases de données.
  • Introduction à PySpark.
  • Découverte des fonctions de PySpark : data processing, dataframes, régression avec PySpark, ML pipelines, model turning.

Deep learning avec la bibliothèque Keras

  • Découverte de concepts : Dense neural networks, convolutional neural networks, architecture LeNet, transfer Learning.

Introduction à TensorFlow 2.0 et au reinforcement learning

  • Mise en relation de TensorFlow et Keras.
  • Application du word embedding avec Word2vec.
  • Présentation du recurrent neural network.
  • Présentation du generative adversial network.
  • Définition des éléments de l'apprentissage par renforcement.
  • Mise au point sur les fondamentaux mathématiques pour le reinforcement learning.
  • Présentation de la principale famille d'algorithmes de reinforcement learning : Monte-Carlo.
  • Application des algorithmes d'apprentissage par différence temporelle : SARSA.
  • Application des algorithmes d'apprentissage par différence temporelle  : Q-Learning.
  • Comparaison entre apprentissage par différence temporelle et Monte-Carlo.

Deep reinforcement learning (apprentissage par renforcement profond)

  • Application à des business cases.
  • Introduction au deep reinforcement learning.
  • Compréhension des fondements des méthodes basées sur la valeur.
  • Compréhension des problèmes de variance élevée, des risques de surestimation, application des méthodes de résolution.
  • Introduction à la méthode de policy gradient.
  • Compréhension des fondamentaux de la structure acteur-critique utilisée dans l'apprentissage en deep reinforcement learning.
Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.