Langage et IDE

Retour

Formation

Informatique

Data Scientist

  • 5 Jours
  • REF: 4-IT-DAS
  • Partager :

1. Introduction aux Data Sciences

  • Qu’est que la data science ?
  • Qu’est-ce que Python ?
  • Qu’est que le Machine Learning ?
  • Apprentissage supervisé vs non supervisé Les statistiques
  • La randomisation
  • La loi normale

2. Introduction à Python pour les Data Science

  • Les bases de Python
  • Les listes
  • Les tuples
  • Les dictionnaires
  • Les modules et packages
  • L’orienté objet
  • Le module math
  • Les expressions lambda
  • Map, reduce et filter
  • Le module CSV
  • Les modules DB-API 2 Anaconda

3. Introduction aux DataLake, DataMart et DataWharehouse

  • Qu’est-ce qu’un DataLake ?
  • Les différents types de DataLake
  • Le Big Data Qu’est-ce qu’un DataWharehouse ?
  • Qu’est qu’un DataMart ?
  • Mise en place d’un DataMart
  • Les fichiers
  • Les bases de données SQL
  • Les bases de données No-SQL

4. Python Package Installer

  • Utilisation de PIP
  • Installation de package PIP PyPi

5. MathPlotLib

  • Utilisation de la bibliothèque scientifique de graphes MathPlotLib
  • Affichage de données dans un graphique 2D Affichages de sous-graphes
  • Affichage de polynômes et de sinusoïdales

6. Machine Learning

  • Mise en place d’une machine learning supervisé
  • Qu’est qu’un modèle et un dataset
  • Qu’est qu’une régression
  • Les différents types de régression
  • La régression linéaire
  • Gestion du risque et des erreurs
  • Quarter d’Ascombe
  • Trouver le bon modèle
  • La classification
  • Loi normale, variance et écart type
  • Apprentissage
  • Mesure de la performance No Fee Lunch

7. La régression linéaire en Python

  • Programmer une régression linéaire en Python
  • Utilisation des expressions lambda et des listes en intention Afficher la régression avec MathPlotLib
  • L’erreur quadratique
  • La variance
  • Le risque

8. Le Big Data

  • Qu’est-ce que Apache Hadoop ?
  • Qu’est-ce que l’informatique distribué ?
  • Installation et configuration de Hadoop
  • HDFS
  • Création d’un datanode
  • Création d’un namenode distribué
  • Manipulation de HDFS
  • Hadoop comme DataLake
  • Map Reduce
  • Hive
  • Hadoop comme DataMart
  • Python HDFS

9. Les bases de données NoSql

  • Les bases de données structurées
  • SQL avec SQLite et Postgresql
  • Les bases de données non ACID
  • JSON
  • MongoDB
  • Cassandra, Redis, CouchDb
  • MongoDB sur HDFS
  • MongoDB comme DataMart PyMongo

10. Numpy et SciPy

  • Les tableaux et les matrices
  • L’algèbre linéaire avec Numpy
  • La régression linéaire SciPy Le produit et la transposée
  • L’inversion de matrice
  • Les nombres complexes
  • L’algèbre complexe
  • Les transformées de Fourier Numpy et Mathplotlib

11. ScikitLearn

  • Régressions polynomiales
  • La régression linéaire
  • La création du modèle
  • L’échantillonnage
  • La randomisation
  • L’apprentissage avec fit
  • La prédiction du modèle
  • Les metrics
  • Choix du modèle
  • PreProcessing et Pipeline
  • Régressions non polynomiales

12. Nearest Neighbors

  • Algorithme des k plus proches voisins (k-NN)
  • Modèle de classification
  • K-NN avec SciKitLearn
  • Choix du meilleur k
  • Sérialisation du modèle
  • Variance vs Erreurs
  • Autres modèles : SVN, Random Forest

13. Pandas

  • L’analyse des données avec Pandas
  • Les Series
  • Les DataFrames
  • La théorie ensembliste avec Pandas
  • L’importation des données CSV
  • L’importation de données SQL
  • L’importation de données MongoDB Pandas et SKLearn

14. Le Clustering

  • Regroupement des données par clusterisation Les clusters SKLearn avec k-means
  • Autres modèles de clusterisation : AffinityPropagation, MeanShift, …
  • L’apprentissage semi-supervisé

15. Jupyter

  • Présentation de Jupyter et Ipython
  • Installation
  • Utilisation de Jupyter avec Mathplotlib et Sklearn

16. Python Yield

  • La programmation efficace en Python
  • Le générateurs et itérateurs
  • Le Yield return
  • Le Yield avec Db-API 2, Pandas et Sklearn

17. Les réseaux neuronaux

  • Le perceptron
  • Les réseaux neuronaux
  • Les réseaux neuronaux supervisés
  • Les réseaux neuronaux semi-supervisés
  • Les réseaux neuronaux par Hadoop Yarn
  • Les heuristiques
  • Le deep learning
  • Savoir mettre en place un DataLake et un DataMart en SQL ou big data, puis une stratégie de Machine Learning en Python afin de créer le modèle le plus satisfaisant possible en le mesurant et en affichant les résultats, le tout en utilisant des algorithmes performants
  • Développeurs, chefs de projets proches du développement, ingénieur scientifique sachant coder

  • Maîtriser l’algorithmique, avoir une appétence pour les mathématiques
  • La connaissance de Python et des statistiques est un plus
  • Alternance entre apports théoriques et exercices pratiques Support de cours fourni lors de la formation
Dates

Formations associées

AGINIUS

153 avenue d'Italie

PARIS - Paris (75)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
CAEN

- Calvados (14)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
BORDEAUX

- Gironde (33)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
BREST

- Finistere (29)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
CLERMONT-FERRAND

- Puy-de-Dome (63)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
GRENOBLE

- Isere(38)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
IVRY-SUR-SEINE

- Val-de-Marne (94)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
LE HAVRE

- Seine-Maritime (76)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
LE MANS

- Sarthe (72)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
LILLE

- Nord (59)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
LUXEMBOURG

-

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
LYON

- Rhone (69)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
MARSEILLE

- Bouches-du-Rhone (13)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
METZ

- Moselle (57)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
MONTPELLIER

1025 rue henri Becquerel bât 27, Parc Club du Millénaire

Montpellier - Herault (34)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
NANCY

- Meurthe-et-Moselle (54)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
NANTES

- Loire-Atlantique (44)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
NICE

- Alpes-Maritimes (06)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
ORLÉANS

- Loiret (45)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
PARIS

153 avenue d'Italie

PARIS - Paris (75)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
PÉRIGUEUX

- Dordogne (24)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
POITIERS

- Vienne (86)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
REIMS

- Marne (51)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
RENNES

- Ille-et-Vilaine (35)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
ROUEN

- Seine-Maritime (76)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
STRASBOURG

- Bas-Rhin (67)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
TOULON

- Var (83)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
TOURS

- Indre-et-Loire (37)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
TROYES

- Aube (10)

Prochaines formations
  • du 16 au 20 novembre 2020
  • du 14 au 18 décembre 2020
Toutes les dates de ce centre
Infos centre

CHOISIR AGINIUS

C’est choisir la proximité avec une capacité d’intervention dans 100 villes en France et 50 centres accueillant les interentreprises.

C’est choisir la compétence avec plus de 300 experts dans différents domaines : une offre de formation de plus de 900 programmes standards, une élaboration sur mesure de programmes spécifiques en fonction de vos besoins en intraentreprise, une clientèle allant au-delà de 5000 entreprises, administrations et collectivités locales.

C’est choisir un réseau assurant une réelle capacité logistique avec plus de 250 salles équipées et une capacité d’accueil de 2000 stagiaires par jour...

AGINIUS Formation, Réseau Leader de la formation professionnelle en France.