Formation Pig, Hive et Impala avec Hadoop.

Score de satisfaction : 4.54/5

Durée :

4 jours

Distanciel et 16 villes en France

Accueil / Big Data, Business Intelligence et SGBD / Big Data / Pig, Hive et Impala avec Hadoop

à partir de

2800 ^€HT

Référence :
SF33387

Durée :
4 jours

Vous souhaitez une session sur-mesure (intra) ?

Ce stage comprend

28 heures de formation

Pauses et snacks à volonté

Prise en charge OPCO possible

Disponible à distance

Formation Pig, Hive et Impala avec Hadoop.

Name: Formation Pig, Hive et Impala avec Hadoop
Brand: Sparks
SKU: SF33387
Price: 2800 EUR
Availability: InStock

formation Pig, Hive et Impala avec Hadoop

Cette formation vous apportera une grande expertise dans l’utilisation d’outils de traitement de données issues du Big Data. Apprenez à combiner et à mettre en œuvre Pig, Hive et Impala dans votre système Hadoop pour accroître votre potentiel BI. Vous serez en mesure d’exploiter ces outils et adapter leurs utilisations pour un traitement optimal des données : requêtes, transformations, combinaisons, interprétations, stockage, et plus encore !

Objectifs pédagogiques.

1Apprendre à manier Pig, Hive et Impala avec Hadoop

2Savoir explorer Pig, l'utiliser pour traiter les données basiques et complexes

3Analyser les données relationnelles, textuelles et sémantiques avec Hive

4Savoir utiliser Impala pour exlorer, trier, filtrer et analyser les données

5Utiliser efficacement la complémentarité des outils

Public :

Architectes techniques,

Développeurs

Prérequis : Connaissances basiques en Hadoop et Big Data, en gestion de données et SQL

Partagez cette formation

Programme de formation Pig, Hive et Impala avec Hadoop.

PDF

Chapitre introductif

Les problématiques du Big Data
Retour sur l’architecture MapReduce
Le processus ETL
Hadoop : solutions apportées et manques
Retour sur le système de fichiers distribués Hadoop (HDFS)
L’environnement d’Hadoop

Exploration de l’outil Apache Pig

Pig : définition, caractéristiques et rayon d’action
Les cas d’utilisation de Pig
Le langage Pig Latin : caractéristiques et mise en œuvre
Démarrer avec Pig

Utilisation de Pig pour traiter des données basiques

Connaître les types et les caractéristiques de données simples
Charger les données et définir les champs
Gérer la sortie des données
Techniques de tri et de filtrage des données récoltées
Utiliser les principales fonctions de traitement

Utilisation de Pig pour traiter des données complexes

Les différents formats de stockage
Connaître les types et les caractéristiques des données complexes et emboîtées
Grouper les données et utiliser la fonction built-in
Programmer des itérations de traitement de données groupées

Utilisation avancée de Pig

Effectuer des combinaisons d’ensembles de données
Exécuter des opérations sur des groupes de données
Paramètres avancés
Utiliser des macros et des fonctions utilisateurs (UDF)
Utiliser Pig avec d’autres langages

Résolution de problèmes et optimisation

Méthodes de résolution de problèmes
Utiliser l’UI web d’Hadoop pour le trouble shooting
Méthodes de débogage par échantillonnage de données
Monitoring des performances

Exploration de l’outil Apache Hive

Hive : définition, caractéristiques et rayon d’action
Le modèle de stockage de données de Hive
Hive et Pig : concurrence et complémentarités
Le langage de requête HiveQL
Démarrer avec Hive

Utilisation de Hive pour l’analyse de données relationnelles

Les bases et tableaux de données sous Hive
Connaître les types de données et leurs caractéristiques
Les formats de données dans Hive
Méthodes d’assemblage de données et fonctions de built-in

Gestion des données avec Hive

Construire des bases de données et tableaux de gestion Hive
Utiliser des tableaux autogérés
Stocker le résultat des requêtes
Sécuriser l’accès aux données

Analyse de données textuelles et études sémantiques

Les principes du traitement de données textuelles
Utiliser les fonctions String
Principes et applications du « Opinion Mining »

Optimisation et utilisation avancée

Mettre en œuvre les bonnes pratiques pour la performance des requêtes
Paramétrer les requêtes
Contrôler l’exécution des tâches
Partitionnement des données, bucketing et indexation
Utiliser des scripts pour transformer les données
Mettre en œuvre des fonctions utilisateurs (UDF)

Exploration du moteur de requêtes Impala

Impala : définition, caractéristiques et rayon d’action
Impala, Pig et Hive : concurrence et complémentarités
Impala dans le monde des bases de données relationnelles
Exemples d’utilisations du Shell Impala

Utilisation d’Impala pour l’analyse de données

Utiliser la syntaxe Impala
Connaître les types de données et leurs caractéristiques
Techniques de tri et de filtrage des données récoltées
Méthodes d’assemblage de données
Optimiser les performances

Conclusion

Informations générales.

Quelles sont les modalités d'évaluation ?

Quelle méthodologie pour les formations Sparks ?

Formation des publics en situation de handicap

Vous serez également interessé·e par ces formations.

Formation Hadoop

SF33389

● 3 jours ● à partir de 2100 €HT* ● Administrateurs systèmes et réseaux, DSI, Administrateurs de base de données, Développeurs

Nos autres formations en Big Data .

Formation Bases de données NoSQL : introduction, enjeux et panorama des solutions

SF33386

● 2 jours ● à partir de 1400 €HT* ● Administrateurs systèmes et réseaux, Architectes techniques, Chefs de projet, DSI, Administrateurs de base de données, Développeurs

Formation Big Data – Sécurité des données

SF34046

● 2 jours ● à partir de 1700 €HT* ●

Formation Big Data : état de l’art

SF33385

● 2 jours ● à partir de 1500 €HT* ● Managers, Administrateurs systèmes et réseaux, Architectes techniques, Chefs de projet, DSI, Administrateurs de base de données, Développeurs

Notre charte qualité et éthique.

A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.

Des chiffres étincelants.

19 années

à vos côtés

+ de 1000

sujets de formation

8155

stagiaires formés en 2023

238

formateurs actifs en 2023

97,9%

de stagiaires satisfaits

24622

heures de formation réalisées en 2023

Remplissez ce formulaire et recevez votre proposition de formation Pig, Hive et Impala avec Hadoop.

C'est gratuit et sans engagement - Devis valable 30 jours - 4.54% d'avis positifs (3317 notes)

Nos formations sont certifiées Qualiopi et prises en charge par l’ensemble des OPCO

Besoin d'aide ?

Appelez-nous au

DU LUNDI AU VENDREDI DE 09H00 À 12H00 ET DE 14H00 À 18H00. Depuis la Suisse, la Belgique et le Luxembourg, composez le +33 (0)4 78 22 10 38 ou contactez-nous par Chat

Votre Formation

Format intra-entreprise

À partir de 2 collaborateurs, une session privatisée pour former vos équipes, au sein même de votre organisation ou dans nos locaux. Date à votre convenance, programme et durée adaptables selon les besoins.

Format cours particulier

En tête-à-tête avec le formateur, une session de formation sur-mesure, pour coller au plus près à vos attentes. Le format privilégié en cas d'urgence d'un projet de formation, de localisation complexe ou de besoin très spécifique.

Vos coordonnées

Je participe à la formation

Votre message

J’atteste avoir lu et accepté les conditions générales liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel. Je pourrai à tout moment modifier l’usage de mes données et exercer mes droits en envoyant un email à l’adresse rgpd@sparks-formation.com

J’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part de Sparks. Je peux à tout moment me désinscrire en utilisant le lien de désabonnement de vos envois.

Prochaines sessions pour la formation Pig, Hive et Impala avec Hadoop.

Formation Pig, Hive et Impala avec Hadoop.

formation Pig, Hive et Impala avec Hadoop

Programme de formation Pig, Hive et Impala avec Hadoop.

Chapitre introductif

Exploration de l’outil Apache Pig

Utilisation de Pig pour traiter des données basiques

Utilisation de Pig pour traiter des données complexes

Utilisation avancée de Pig

Résolution de problèmes et optimisation

Exploration de l’outil Apache Hive

Utilisation de Hive pour l’analyse de données relationnelles

Gestion des données avec Hive

Analyse de données textuelles et études sémantiques

Optimisation et utilisation avancée

Exploration du moteur de requêtes Impala

Utilisation d’Impala pour l’analyse de données

Conclusion

Vous serez également interessé·e par ces formations.

Formation Hadoop

Nos autres formations en Big Data .

Formation Airflow

Formation Apache Kafka

Formation Apache NiFi

Formation Bases de données NoSQL : introduction, enjeux et panorama des solutions

Formation Big Data – Sécurité des données

Formation Big Data : état de l’art