Site Reliability Engineering

Total time
Location
At location, Online
Starting date and place

Site Reliability Engineering

GFU Cyrus AG
Logo GFU Cyrus AG
Provider rating: starstarstarstarstar_border 7.9 GFU Cyrus AG has an average rating of 7.9 (out of 13 reviews)

Need more information? Get more details on the site of the provider.

Starting dates and places
computer Online: Zoom
11 Feb 2026 until 12 Feb 2026
placeKöln
20 May 2026 until 21 May 2026
computer Online: Zoom
20 May 2026 until 21 May 2026
placeKöln
2 Sep 2026 until 3 Sep 2026
computer Online: Zoom
2 Sep 2026 until 3 Sep 2026
placeKöln
11 Nov 2026 until 12 Nov 2026
computer Online: Zoom
11 Nov 2026 until 12 Nov 2026
Description

Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen

Seminarziel

Am Ende des Seminars sind die Teilnehmenden in der Lage, SRE-Praktiken effektiv zu nutzen, um die Zuverlässigkeit, Skalierbarkeit und Sicherheit ihrer Systeme zu verbessern. Sie lernen, wie sie Projekte planen, entwickeln, integrieren und testen, um verschiedene Anforderungen abzudecken und die Systemleistung zu optimieren.

Inhalt

  • Einführung in Site Reliability Engineering (SRE)
    • Was ist SRE und warum ist es wichtig? Historische Entwicklung und Hauptmerkmale
    • Kerngedanken hinter SRE, Unterschiede zu traditionellen Operations- und DevOps-Ansätzen
    • Typische Anwendungsbereiche und Szenarien, in denen SRE eingesetzt wird
  • SLI / SLO / SLA - Definition und Bedeutung
    • Service Level In…

Read the complete description

Frequently asked questions

There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.

Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen

Seminarziel

Am Ende des Seminars sind die Teilnehmenden in der Lage, SRE-Praktiken effektiv zu nutzen, um die Zuverlässigkeit, Skalierbarkeit und Sicherheit ihrer Systeme zu verbessern. Sie lernen, wie sie Projekte planen, entwickeln, integrieren und testen, um verschiedene Anforderungen abzudecken und die Systemleistung zu optimieren.

Inhalt

  • Einführung in Site Reliability Engineering (SRE)
    • Was ist SRE und warum ist es wichtig? Historische Entwicklung und Hauptmerkmale
    • Kerngedanken hinter SRE, Unterschiede zu traditionellen Operations- und DevOps-Ansätzen
    • Typische Anwendungsbereiche und Szenarien, in denen SRE eingesetzt wird
  • SLI / SLO / SLA - Definition und Bedeutung
    • Service Level Indicators (SLI)
    • Service Level Objectives (SLO)
    • Service Level Agreements (SLA)
  • Monitoring/Alerting Werkzeuge
    • Einführung in gängige Überwachungs- und Logging-Tools (z.B. Prometheus, Grafana, ELK Stack)
    • Tools und Prozesse zur Incident-Erkennung und -Behebung (z.B. PagerDuty, Opsgenie)
  • Praktische Übung: Einrichtung einer Überwachungs- und Incident Management-Lösung
    • Problemstellung: Einrichtung einer Überwachungs- und Incident Management-Lösung für eine Beispielanwendung
    • Lösung: Installation und Konfiguration von Prometheus und Grafana zur Überwachung, Einrichtung von Incident Management-Tools wie PagerDuty
    • Ergebnis: Ein funktionierendes Überwachungs- und Incident Management-System für die Beispielanwendung
  • Continuous Delivery und Release Engineering
    • Kleine Deployments
    • Automatisierte Deployments
    • Canary Releases
    • Feature Toggles
  • Infrastruktur als Code
    • Definition
    • Nutzen
    • Beispiele: Ansible / Terraform
  • Zusammenarbeit zwischen Entwicklung und Betrieb
    • Error Budgets: Konzept und Anwendung von Error Budgets zur Verwaltung von Systemstabilität und Featureentwicklung
    • Reduzierung der operativen Last: Automatisierung, Toil-Reduzierung und Best Practices zur Effizienzsteigerung
  • Incident Management
    • Umgang mit Vorfällen und Ausfällen
    • Status-Seite
    • Post-Mortem-Analysen und Lessons Learned
    • Hochverfügbarkeit vs. Notfallwiederherstellung
  • Security & Compliance
    • DSGVO
  • Fortgeschrittene Techniken
    • Chaos Engineering
    • Kapazitätsplanung - datenbasiert
    • Automatische Skalierung - in Public und Private Cloud
  • Abschlussdiskussion und Feedbackrunde
There are no reviews yet.
Share your review
Do you have experience with this course? Submit your review and help other people make the right choice. As a thank you for your effort we will donate $1.- to Stichting Edukans.

There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.