Ingénierie de la fiabilité des sites
Objectifs
- Expliquer le SRE
- Différencier le SRE et le DevOps
- Lister des labeurs
Cours
Ingénierie de la fiabilité des sites
DevOpsIngénierie de la fiabilité des sites
Site Reliability Engineering (SRE)
SRE is what you get when you treat operations as if it’s a software problem.
Créé en 2004 chez Google par Ben Treynor Sloss.
Le principe : Un·e ingénieur·e logiciel qui s'occupe de l'opérationnel.
Développe des outils pour automatiser les tâches opérationnelles.
Collaboration entre les équipes.
Automatisation des tâches (tâches manuelles répétitives à bannir).
SRE précède d'environ 3 ans DevOps (2007).
SRE est une pratique, DevOps est une culture.
DevOps se concentre sur la livraison de logiciels, SRE sur la fiabilité des systèmes
Élimination des labeurs (toil)
Une tâche est probablement un labeur lorsque c'est :
Manuel : intervention humaine
Répétitif : refaire la même chose
Automatisable : une machine peut le faire
réactif (pas proactif) : répondre à des événements au lieu de prévenir leur apparition
Sans valeur ajoutée durable : réparer sans améliorer
Pas scalable : O(n) au lieu de O(1)
Conséquences des labeurs (toil)
Si on perd trop de temps à faire des labeurs :
Carrière stagnante : pas de temps pour apprendre/évoluer
Moral bas : chacun·e a une limite de labeurs supportables
Lessons Learned from Two Decades of Site Reliability Engineering
F pour passer en plein écran ou
O pour afficher la vue d'ensemble.
Versions
sans animation,
plein écran,
imprimable.
Lire les Lessons Learned from Two Decades of Site Reliability Engineering
Se répartir les 11 sections, résumer et présenter les points clés.
Voir aussi Why Heroism Is Bad.
Références