Formation Data Science Fondamentaux.

Score de satisfaction : 4.54/5

Durée :

5 jours

19/05/2025 à Paris

Accueil / Big Data, Business Intelligence et SGBD / Intelligence Artificielle (IA) et Data Science / Data Science Fondamentaux

à partir de

3500 ^€HT

Référence :
SF33373

Durée :
5 jours

Réservez vos places pour la session du

Vous souhaitez une session sur-mesure (intra) ?

Ce stage comprend

35 heures de formation

Pauses et snacks à volonté

Prise en charge OPCO possible

Disponible à distance

Formation Data Science Fondamentaux.

Name: Formation Data Science Fondamentaux
Brand: Sparks
SKU: SF33373
Price: 3500 EUR
Availability: InStock

Apprenez les outils, la méthodologie, les bonnes pratiques et les principes clés de la Data Science grâce à notre formation Data Science: Fondamentaux de 5 jours !

La Data Science est un pan du phénomène Big Data qui traite de l'analyse et de la visualisation des données entreprise pour les rendre exploitables dans une optique décisionnaire. Cette science a également donné lieu à la création d'un nouveau métier, data scientist, qui est en charge du traitement de ces données. Au travers de cette formation apportant les fondamentaux de la data science, vous apprendrez les principes clés ainsi que les méthodes principales de la data science. Vous maîtriserez également les bonnes pratiques de base pour le traitement et la visualisation des données. Grâce à notre formation en Data Science, vous aurez tous les outils pour intégrer la Data Science dans votre organisme !

Objectifs pédagogiques.

1Découvrir la Data Science et le métier de Data Scientist

2Comprendre les concepts clés de la Data Science

3Savoir utiliser les outils et méthodologies du Data Scientist

4Pouvoir programmer en R ou en Python

5Avoir des connaissances en machine learning

6Gérer l'apprentissage supervisé, semi-supervisé et non-supervisé

7Pouvoir intégrer la Data Science dans votre organisation

Public :

Managers,

Data scientists,

Architectes techniques,

Prérequis : Connaissances en statistiques et en programmation

Partagez cette formation

Programme de formation Data Science Fondamentaux.

PDF

Présentation de la Data Science

Big Data: définition, architecture…
La Big Data, quel enjeu pour les entreprises?
Volume, Vélocité, Variété: les 3V
Cas d’usage
Traiter les données: deep learning, analyse statistique…
Le Data Mining contre la Business Intelligence
Nouveaux challenges pour les organisations
Gouvernance des données

Principes, concepts clés de la Data Science

Data Science: présentation, définitions, vocabulaire et terminologie
Le métier de Data Scientist, « métier le plus sexy du XXIème siècle » ?
Data scientist: Rôle, responsabilités, compétences, philosophie
Objectifs et besoins
Processus de Data Science et Data Mining

Outils pour la Data Science

Outils propriétaires et outils open-source
Python et R: les langages pour la Data Science et leur environnement de développement
Notebooks Jupyter
Pandas, Numpy, SciKit-Learn… : les bibliothèques majeures
SQL, NoSQL, MongoDB : les principales bases de données pour la Data Science
Utiliser Excel, Tableau, D3.js ou encore Matplotlib pour visualiser les données
Installation d’outils pour les cas pratiques

Rappels mathématiques

Programmer avec Python et R

Python, R: les langages de la Data Science
Caractéristiques, structure
Opérations basiques, données, assignation de variables
Fonctions, listes, tableaux et packages

Obtenir et explorer les données

Trouver et importer des données
Données publiques, données privées
Entreposer les données (datawarehouse et datalake…)
Installation de bibliothèques et de packages
Pertinence des données: identification des caractéristiques des données
Contrôle de qualité: les bonnes pratiques

Prétraitement des données

De l’importance de nettoyer les données
Exemple d’un ensemble de données non-structurées
Nettoyage et préparation d’ensembles de données
Identification et résolution des valeurs manquantes, des valeurs « aberrantes »
Apache Spark et Apache Hadoop, MapReduce pour le Big Data
L’analyse en composantes principales (ACP, ou PCA pour Principal Component Analysis)
Extraire et sélectionner des features (Feature engineering)

Machine Learning pour analyser et modéliser

Entrées et sorties pour la modélisation d’un problème de Data Science
Machine Learning: capacités
Algorithmes supervisés, non-supervisés, semi-supervisés
Classification, régression d’algorithmes
Machine Learning et intuition
SciKit-Learn, gradDescent, TensorFlow… : les bibliothèques Machine Learning
Text Mining
Gestion des volumes du Big Data

Apprentissage supervisé: les méthodes

Construction d’un modèle de régression linéaire pour estimer les valeurs
Régression non-linéaire, logistique
Interpréter les coefficients de régression
Descente de gradient
Labels de jeux de données: automatisation
Méthodes ensemblistes
Forêts aléatoires, arbres de décision
SVM (machines à vecteurs de support)
Réseaux Bayésiens
Classification naïve bayésienne

Apprentissage semi-supervisé, non-supervisé, clustering

Algorithmes majeurs
Partitionnement en k-moyennes
Regroupement hiérarchique
Clustering basé sur la densité
Réseaux de neurones (Deep Learning)

Modèles d’apprentissage: évaluation et tests

Sur-apprentissage et cross-validation pour l’amélioration des modèles
Maintenance des modèles
Détérioration de la performance des modèles d’apprentissage
Ajustement, validation d’un modèle

Visualisation et restitution des données

Prendre des décisions à partir des données
Visualiser les données: les grands principes
Utiliser Tableau Software ou encore QlikSense pour la datavisualization
Raconter une histoire avec les données avec le Data storytelling

Intégrer la Data Science dans votre organisation

Implémentations dans les processus actuels
Considérer les objectifs et le contexte professionnel pour le choix des outils
Enjeux organisationnels, éthiques et juridiques

Informations générales.

Quelles sont les modalités d'évaluation ?

Quelle méthodologie pour les formations Sparks ?

Formation des publics en situation de handicap

Nos autres formations en Intelligence Artificielle (IA) et Data Science .

Formation Analyse statistique et modélisation

SF33376

● 2 jours ● à partir de 1400 €HT* ● Data scientists, Chefs de projet, DSI, Ingénieurs Big Data, Data analysts, Business analysts, Développeurs

Formation Analyste de données Microsoft Power BI (PL-300)

SF33922

● 3 jours ● à partir de 2250 €HT* ● Responsables métier, Maîtrise d'ouvrage (MOA), Chefs de projet, Data analysts, Consultant BI / décisionnel, Business analysts

Formation Big Data, Data Science et Machine Learning : concepts et enjeux pour l’entreprise

SF33379

● 1 jour ● à partir de 650 €HT* ● Tous

Formation ChatGPT : les bases du prompt engineering

SF33830

● 1 jour ● à partir de 800 €HT* ● Tous

Formation Conception et implémentation d’une solution Microsoft Azure AI (AI-102)

SF34022

● 4 jours ● à partir de 2800 €HT* ● Développeurs, Data scientists

Formation Data Science et Machine Learning avec R

SF33374

● 4 jours ● à partir de 3000 €HT* ● Data scientists, Administrateurs systèmes et réseaux, Ingénieurs Big Data, Administrateurs de base de données

Notre charte qualité et éthique.

A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.

Des chiffres étincelants.

19 années

à vos côtés

+ de 1000

sujets de formation

8155

stagiaires formés en 2023

238

formateurs actifs en 2023

97,9%

de stagiaires satisfaits

24622

heures de formation réalisées en 2023

Remplissez ce formulaire et recevez votre proposition de formation Data Science Fondamentaux.

C'est gratuit et sans engagement - Devis valable 30 jours - 4.54% d'avis positifs (3317 notes)

Nos formations sont certifiées Qualiopi et prises en charge par l’ensemble des OPCO

Besoin d'aide ?

Appelez-nous au

DU LUNDI AU VENDREDI DE 09H00 À 12H00 ET DE 14H00 À 18H00. Depuis la Suisse, la Belgique et le Luxembourg, composez le +33 (0)4 78 22 10 38 ou contactez-nous par Chat

Votre Formation

Format intra-entreprise

À partir de 2 collaborateurs, une session privatisée pour former vos équipes, au sein même de votre organisation ou dans nos locaux. Date à votre convenance, programme et durée adaptables selon les besoins.

Format inter-entreprises

Nos sessions de formation en groupe, organisées dans les locaux Sparks et à une date prédéfinie. Une atmosphère propice à l'apprentissage, un matériel dernier cri et l'occasion d'interagir autant que vous le souhaitez avec vos pairs.

Format cours particulier

En tête-à-tête avec le formateur, une session de formation sur-mesure, pour coller au plus près à vos attentes. Le format privilégié en cas d'urgence d'un projet de formation, de localisation complexe ou de besoin très spécifique.

Vos coordonnées

Je participe à la formation

Votre message

J’atteste avoir lu et accepté les conditions générales liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel. Je pourrai à tout moment modifier l’usage de mes données et exercer mes droits en envoyant un email à l’adresse rgpd@sparks-formation.com

J’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part de Sparks. Je peux à tout moment me désinscrire en utilisant le lien de désabonnement de vos envois.

Prochaines sessions pour la formation Data Science Fondamentaux.

Formation Data Science Fondamentaux.

Apprenez les outils, la méthodologie, les bonnes pratiques et les principes clés de la Data Science grâce à notre formation Data Science: Fondamentaux de 5 jours !

Programme de formation Data Science Fondamentaux.

Présentation de la Data Science

Principes, concepts clés de la Data Science

Outils pour la Data Science

Rappels mathématiques

Programmer avec Python et R

Obtenir et explorer les données

Prétraitement des données

Machine Learning pour analyser et modéliser

Apprentissage supervisé: les méthodes

Apprentissage semi-supervisé, non-supervisé, clustering

Modèles d’apprentissage: évaluation et tests

Visualisation et restitution des données

Intégrer la Data Science dans votre organisation

Nos autres formations en Intelligence Artificielle (IA) et Data Science .

Formation Analyse statistique et modélisation

Formation Analyste de données Microsoft Power BI (PL-300)

Formation Big Data, Data Science et Machine Learning : concepts et enjeux pour l’entreprise

Formation ChatGPT : les bases du prompt engineering

Formation Conception et implémentation d’une solution Microsoft Azure AI (AI-102)

Formation Data Science et Machine Learning avec R