> Formations > Technologies numériques > Intelligence Artificielle, Big Data > IA, Machine Learning, analyse de données > Formation Data Scientist, temps partiel (9 mois) > Formations > Technologies numériques > Formation Data Scientist, temps partiel (9 mois)

Data Scientist, temps partiel (9 mois)

by DataScientest

Data Scientist, temps partiel (9 mois)

by DataScientest



Devenez expert en développement de modèles d'analyse de données avec ce parcours proposé par notre partenaire DataScientest. Un Data Scientist développe des modèles d’analyse complexes visant à extraire des informations à partir de bases de données. Cette formation certifiante se déroule à distance dans un format hybride mêlant temps d’échanges synchrones avec un formateur expert, exercices pratiques et modules E-learning. Basée sur la pédagogie Learning By Doing, vous réaliserez un projet fil rouge en équipe afin de mettre en pratique vos connaissances. Lors de votre inscription, vous serez rattaché à l’une des promotions Datascientest. A l’issue de cette formation, vous obtiendrez un certificat « Data Scientist » des Mines Paris- PSL Executive ainsi que le bloc de compétence 2 de la certification RNCP « Expert en ingénierie de l’intelligence artificielle». Contactez-nous dès maintenant pour connaître les prochaines dates !


Catalogue
Sur mesure

Formation en ligne

Réf. 4DB
  399h00
Prix : 6490 € H.T.
Langue : FR




Devenez expert en développement de modèles d'analyse de données avec ce parcours proposé par notre partenaire DataScientest. Un Data Scientist développe des modèles d’analyse complexes visant à extraire des informations à partir de bases de données. Cette formation certifiante se déroule à distance dans un format hybride mêlant temps d’échanges synchrones avec un formateur expert, exercices pratiques et modules E-learning. Basée sur la pédagogie Learning By Doing, vous réaliserez un projet fil rouge en équipe afin de mettre en pratique vos connaissances. Lors de votre inscription, vous serez rattaché à l’une des promotions Datascientest. A l’issue de cette formation, vous obtiendrez un certificat « Data Scientist » des Mines Paris- PSL Executive ainsi que le bloc de compétence 2 de la certification RNCP « Expert en ingénierie de l’intelligence artificielle». Contactez-nous dès maintenant pour connaître les prochaines dates !


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Nettoyer les données.
Analyser les données à l'aide d'outils et méthodes de visualisation et de statistiques.
Concevoir des modèles prédictifs d’intelligence artificielle.

Public concerné
Toutes les personnes ayant une appétence pour la programmation et la manipulation des données.

Prérequis
Un diplôme ou un titre de niveau bac+3 ainsi qu'un bon niveau en mathématiques. Pour les candidats ne présentant pas le niveau de qualification requis, une dérogation est possible sur dossier.

Certification incluse
Pour clôturer la formation, l’équipe pédagogique évaluera le projet fil rouge de l’apprenant à l’aide d’un rapport écrit et d’une soutenance à distance. La validation des compétences développées au cours de la formation Data Scientist vous permettra d’obtenir : • Un certificat de l'École des Mine Paris - PSL Executive Education • Le bloc de compétence 2 de la certification RNCP de niveau 7 “Expert en ingénierie de l’intelligence artificielle” enregistrée au RNCP sous le n°RNCP38587.

Méthodes et moyens pédagogiques
Activités digitales
Cours et exercices en ligne, masterclass collective, séances de questions/réponses, classes de soutien, accompagnement par mail, projet fil rouge, coaching carrière individualisé, social learning.
Tutorat
Un formateur expert accompagne l’apprenant tout au long de sa formation. Il échange régulièrement avec lui sur son projet fil rouge et l’accompagne lors de points de mentorat (individuel). Plusieurs formateurs animent également les différentes masterclass (classes collectives) et répondent aux questions des apprenants à tout moment depuis un forum dédié. En complément, de nombreuses séances de questions-réponses peuvent être organisées pour aider les apprenants.
Pédagogie et pratique
Lors de l’inscription, l’apprenant est affecté à une promotion (dates à définir lors de l’inscription) et reçoit son calendrier de formation. Le parcours de formation est découpé en « Sprint » de plusieurs semaines sur une thématique dédiée. Chaque semaine l’apprenant est convié à un temps d’échange avec le formateur qui se présente sous la forme de masterclass (classe collective) ou de points de mentorat (individuel). Pendant 80% du temps, l’apprenant travaille en autonomie sur la plateforme d’enseignement. Tous les modules intègrent des exercices pratiques permettant de mettre en œuvre les concepts développés en cours. L’apprenant doit également travailler en binôme ou trinôme sur un projet fil rouge tout au long de la formation. Cela lui permettra de développer et faire reconnaître ses compétences. En complément, des événements et ateliers thématiques sont régulièrement proposés pour permettre aux apprenants de découvrir les dernières innovations en matière de Data Science. Afin de suivre efficacement la formation, nous estimons le temps travail nécessaire entre 8 et 10 heures par semaine.

Programme de la formation

1
Fondamentaux de Python

  • Programmation : types de variables, listes, tuples, boucles, fonctions, classes et modules.
  • NumPy : NumPy Array, opérations matricielles, indicateur statistique et opérations.
  • Pandas : introduction à la bibliothèque, chargement d'un jeu de données, Data Cleaning, Data Processing.

2
Data Visualisation

  • Matplotlib : types de graphes, personnalisation de graphiques.
  • Plotly : graphiques interactifs et intégrables web, Widgets.
  • Seaborn : analyse de distribution, analyses statistiques, analyse multivariée.

3
Outils de programmation

  • Git : gestion de version Git, dépôt Git, branches, tag et merge.
  • GitHub : plateforme Github, Fork, Pull Request, Issues, partage des modifications, Github Actions.
  • Tests unitaires : Pytest, tests d'intégration et fonctions, avantages des tests.
  • Système Linux et Script Bash : présentation des systèmes Linux, prise en main du terminal, scripts Bash.

4
Machine Learning

  • Modèles et algorithmes de classification : Scikit-learn, logistic regression, KNN, SVM, bagging et boosting.
  • Méthodes de clustering : modèles de classification non supervisée, métrique d'évaluation pour le clustering.
  • Méthodes de régression : régression linéaire simple et multiple, linéaire régularisée.

5
Machine Learning Avancé

  • Séries temporelles avec Statsmodels : modèles ARIMA et SARIMA.
  • Détection d’anomalies : problématiques de détection d'anomalies, modèles supervisés, Robust Covariance, DBScan.
  • Méthode de réduction de dimensions : feature selection process, analyses de composantes, approche Manifold Learning.

6
Machine Learning Appliqué

  • Text mining : expressions régulières, données textuelles, WordCloud, analyse de sentiments.
  • Webscraping : langage web, BeautifulSoup, scraping sur Google.
  • Éthique & Interprétabilité : données sensibles, enjeux éthiques, analyse de biais, interprétabilité des modèles.

7
Modèles complexes

  • Systèmes de recommandations : introduction au système, méthodes content-based, mathématiques de recommandation.
  • Reinforcement Learning : méthode de Monte-Carlo, temporal Difference Learning, SARSA et Q-Learning.
  • Théorie des graphes : algorithmes Krustal et Dijkstra, détection de communautés, algorithme PageRank, NetworkX.

8
Fondamentaux Deep Learning

  • Réseaux denses : réseaux de neurones, framework Keras, optimisation d'un réseau dense.
  • Réseaux de convolution : analyse d'image par convolution, LeNet, transfer learning.
  • TensorFlow : optimisation avec TensorFlow, callbacks et modèles personnalisés, TensorBoard.

9
Data Engineering

  • SQL : requête base de données avec SQL, types de jointures, requêtes imbriquées.
  • PySpark : calcul distribué avec PySpark, API RDD et DataFrame de Spark, pipeline de processing, MLLib.
  • API : Introduction aux API, méthodes HTTP et fonctions.

10
MLOps

  • MLFow : cycle de vie d'un projet Machine Learning, Model training, MLflow.
  • Docker : présentation de la conteneurisation, fonctionnement de Docker, images et conteneurs, Dockerfile et Docker Hub.


Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.