Formation Data Science et Machine Learning avec R.
Score de satisfaction : 4.54/5
Durée :
4 jours
10/12/2024 à Paris
numero vert : 0805 950 800 (service et appel gratuits)
Data Science et Machine Learning avec R
à partir de
3000 €HT

Référence :
SF33374
Durée :
4 jours

Réservez vos places pour la session du
Vous souhaitez une session sur-mesure (intra) ?
Ce stage comprend
 28 heures de formation
Pauses et snacks à volonté
Prise en charge OPCO possible
Disponible à distance

Formation Data Science et Machine Learning avec R.

Maîtrisez l'utilisation du langage R pour créer des algorithmes de Machine Learning grâce à notre formation !

Statistiques descriptives, prédictives ou exploratoires, la Data Science repose sur la maîtrise de diverses techniques pour l'exploration des données. Cette formation vous permettra d'appréhender leur utilisation et de comprendre le principe de modélisation statistique. Les stagiaires seront en mesure de faire un choix entre régression et classification, ainsi que d'évaluer la performance d'un modèle.

Objectifs pédagogiques.

1Utiliser les spécificités du langage R pour l'exploration des données

2Réaliser des analyses en composantes, des modélisations

3Maîtriser les algorithmes supervisés et non-supervisés

4Connaître les procédures d'évaluation de modèles

5Pouvoir réaliser une analyse de données textuelles

Prérequis : Connaissances fondamentales en statistiques et sur le langage R
Partagez cette formation

Programme de formation Data Science et Machine Learning avec R.

PDF

Introduction à la formation et rappels sur le langage R

Les types de données dans R
Importation-exportation de données
Techniques pour tracer des courbes et des graphiques

Analyse en composantes

Analyse en Composantes Principales
Analyse Factorielle des Correspondances
Analyse des Correspondances Multiple
Exercices

Modélisation

Les algorithmes supervisés et non supervisés
Le choix entre la régression et la classification
Les étapes de construction d’un modèle

Algorithmes non supervisés

Le clustering hiérarchique
Le clustering non hiérarchique
Les approches mixtes
Exercices

Algorithmes supervisés

Le principe de régression linéaire univariée
La régression multivariée
La régression polynomiale
La régression logistique
Le Naive Bayes
L’arbre de décision
Les K plus proches voisins
Exercices

Procédures d’évaluation de modèles

Les techniques de ré-échantillonnage en jeu d’apprentissage, de validation et de test
Mesures de performance des modèles prédictifs
Matrice de confusion, de coût et la courbe ROC et AUC
Exercices

Analyse de données textuelles

Quelques packages utiles
Cas de la régression linéaire multiple
Cas de l’analyse en composantes principales ACP
Cas de la classification CAH

Notre charte qualité et éthique.

A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.

Amandine de Sparks
Des chiffres étincelants.
19 années
à vos côtés
+ de 1000
sujets de formation
8155
stagiaires formés en 2023
238
formateurs actifs en 2023
97,9%
de stagiaires satisfaits
24622
heures de formation réalisées en 2023
HAUT