Aller au contenu principal

Ingénierie de la fiabilité des sites

Objectifs

Cours

Ingénierie de la fiabilité des sites

DevOps

Ingénierie de la fiabilité des sites

Site Reliability Engineering (SRE)

SRE is what you get when you treat operations as if it’s a software problem.

SRE

  • Créé en 2004 chez Google par Ben Treynor Sloss.

  • Le principe : Un·e ingénieur·e logiciel qui s'occupe de l'opérationnel.

  • Développe des outils pour automatiser les tâches opérationnelles.

SRE vs DevOps

  • Similarités :

    • Collaboration entre les équipes.

    • Automatisation des tâches (tâches manuelles répétitives à bannir).

  • Différences :

    • SRE précède d'environ 3 ans DevOps (2007).

    • SRE est une pratique, DevOps est une culture.

    • DevOps se concentre sur la livraison de logiciels, SRE sur la fiabilité des systèmes

Élimination des labeurs (toil)

Une tâche est probablement un labeur lorsque c'est :

  • Manuel : intervention humaine

  • Répétitif : refaire la même chose

  • Automatisable : une machine peut le faire

  • réactif (pas proactif) : répondre à des événements au lieu de prévenir leur apparition

  • Sans valeur ajoutée durable : réparer sans améliorer

  • Pas scalable : O(n) au lieu de O(1)

Conséquences des labeurs (toil)

Si on perd trop de temps à faire des labeurs :

  • Carrière stagnante : pas de temps pour apprendre/évoluer

  • Moral bas : chacun·e a une limite de labeurs supportables

Lessons Learned from Two Decades of Site Reliability Engineering

https://sre.google/resources/practices-and-processes/twenty-years-of-sre-lessons-learned/

F pour passer en plein écran ou O pour afficher la vue d'ensemble.
Versions sans animation, plein écran, imprimable.

Lire les Lessons Learned from Two Decades of Site Reliability Engineering

Se répartir les 11 sections, résumer et présenter les points clés.

Références