Formation Site Reliability Engineering (SRE) Practitioner, avec certification.
Score de satisfaction : 4.54/5
Durée :
3 jours
15/01/2025 à Lyon
numero vert : 0805 950 800 (service et appel gratuits)
à partir de
2400 €HT

Référence :
SF33817
Durée :
3 jours

Réservez vos places pour la session du
Vous souhaitez une session sur-mesure (intra) ?
Ce stage comprend
 21 heures de formation
Support de cours numérique
Pauses et snacks à volonté
Prise en charge OPCO possible

Formation Site Reliability Engineering (SRE) Practitioner, avec certification.

3 jours de formation pour obtenir votre certification DevOps officielle !

La formation SRE Practitioner offre des méthodes pour améliorer l'agilité et la résilience des services d'une organisation. Les participants apprendront à travers des scénarios réels et seront équipés pour mettre en œuvre des modèles SRE adaptés, améliorer l'observabilité dans les systèmes distribués et répondre efficacement aux incidents.

Objectifs pédagogiques.

1Comprendre et mettre en œuvre une culture SRE au sein de votre organisation

2Acquérir une vision claire des principes sous-jacents de la SRE

3Maîtriser les Indicateurs de niveau de service (SLIs) et les Objectifs de niveau de service (SLOs) dans un écosystème distribué

4Construire la sécurité et la résilience par conception dans un environnement distribué

5Mettre en œuvre l'observabilité full stack et le traçage distribué

6Collecter des données en utilisant l'IA pour passer d'une gestion réactive à une gestion proactive et prédictive des incidents

7Comprendre le rôle et les responsabilités du SRE

Prérequis : Connaissance de la terminologie, des concepts et des principes courants en matière de SRE et expérience professionnelle correspondante. Être titulaire de la certification SRE Foundation.
Partagez cette formation

Programme de formation Site Reliability Engineering (SRE) Practitioner, avec certification.

Anti-patterns SRE

Reprendre l’image des Ops ou DevOps ou Dev en tant que SRE
Les utilisateurs remarquent un problème avant vous
Jusqu’où mesurer
Les faux positifs sont pires que l’absence d’alertes
Le piège de la gestion de la configuration
La réponse aux incidents
Fixation des points
Gardien de l’état de préparation à la mise en production
La sécurité intégrée, vraiment ?

Le SLO est un indicateur du bonheur du client

Définir des SLI qui mesurent de manière significative la fiabilité d’un service du point de vue de l’utilisateur
Définir les limites du système dans un écosystème distribué pour définir des SLI corrects
Utiliser les budgets d’erreur pour aider votre équipe à avoir de meilleures discussions et à prendre de meilleures décisions basées sur les données
Globalement, la fiabilité est seulement aussi bonne que le maillon le plus faible de votre graphique de service
Seuils d’erreur en cas d’utilisation de services tiers

Construire des systèmes sûrs et fiables

SRE et leur rôle dans la construction de systèmes sûrs et fiables
Conception pour une architecture changeante
Conception tolérante aux fautes
Conception pour la sécurité
Conception pour la résilience
Conception pour l’évolutivité
Conception pour la performance
Conception pour la fiabilité
Garantir la sécurité et la confidentialité des données

Observabilité full stack

Les applications modernes sont complexes et imprévisibles
La lenteur est la nouvelle règle
Les piliers de l’observabilité
Mise en œuvre d’un contrôle synthétique et d’un contrôle de l’utilisateur final
Développement axé sur l’observabilité
Traçage distribué
Qu’advient-il de la surveillance ?
Instrumentation à l’aide de bibliothèques et d’agents

Platform Engineering et AIOps

Adopter une vision centrée sur la plateforme permet de résoudre les problèmes d’évolutivité de l’organisation tels que la fragmentation, l’incohérence et l’imprévisibilité.
Comment utiliser les AIOps pour améliorer la résilience ?
Comment les DataOps peuvent-ils vous aider dans cette démarche ?
Une recette simple pour mettre en œuvre l’AIOps
Mesures indicatives de l’AIOps

SRE et gestion des réponses aux incidents

Responsabilités clés du SRE en matière de réponse aux incidents
DevOps & SRE et ITIL
OODA et la réponse aux incidents SRE
Remédiation en boucle fermée et ses avantages
Swarming – Matière à réflexion
L’IA/ML pour une meilleure gestion des incidents

Ingénierie du chaos

Naviguer dans la complexité
Définition de l’ingénierie du chaos
Quelques faits sur l’ingénierie du chaos
Histoire de l’origine du Chaos Monkey
Qui adopte l’ingénierie du chaos
Mythes du chaos
Expériences d’ingénierie du chaos
Exercices GameDay
Sécurité de l’ingénierie du chaos
Ressources sur l’ingénierie du chaos

SRE est la forme la plus pure de DevOps

Principes clés du SRE
Les SRE aident à augmenter la fiabilité dans l’ensemble du spectre des produits
Mesures de réussite
Sélection des domaines cibles
Modèle d’exécution SRE
La culture et les compétences comportementales sont essentielles
Étude de cas SRE

Passage de l’examen de certification SRE Practitioner

En ligne, en fin de session ou en différé
La réussite (65%) à l’examen de 90 minutes, composé de 40 questions à choix multiples, permet d’obtenir le certificat SRE Practitioner.

Notre charte qualité et éthique.

A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.

Amandine de Sparks
Des chiffres étincelants.
19 années
à vos côtés
+ de 1000
sujets de formation
8155
stagiaires formés en 2023
238
formateurs actifs en 2023
97,9%
de stagiaires satisfaits
24622
heures de formation réalisées en 2023
HAUT