Site Reliability Engineering
computer Online: Zoom 11 Feb 2026 until 12 Feb 2026 |
placeKöln 20 May 2026 until 21 May 2026 |
computer Online: Zoom 20 May 2026 until 21 May 2026 |
placeKöln 2 Sep 2026 until 3 Sep 2026 |
computer Online: Zoom 2 Sep 2026 until 3 Sep 2026 |
placeKöln 11 Nov 2026 until 12 Nov 2026 |
computer Online: Zoom 11 Nov 2026 until 12 Nov 2026 |
Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen
Seminarziel
Am Ende des Seminars sind die Teilnehmenden in der Lage, SRE-Praktiken effektiv zu nutzen, um die Zuverlässigkeit, Skalierbarkeit und Sicherheit ihrer Systeme zu verbessern. Sie lernen, wie sie Projekte planen, entwickeln, integrieren und testen, um verschiedene Anforderungen abzudecken und die Systemleistung zu optimieren.Inhalt
-
Einführung in Site Reliability Engineering (SRE)
- Was ist SRE und warum ist es wichtig? Historische Entwicklung und Hauptmerkmale
- Kerngedanken hinter SRE, Unterschiede zu traditionellen Operations- und DevOps-Ansätzen
- Typische Anwendungsbereiche und Szenarien, in denen SRE eingesetzt wird
-
SLI / SLO / SLA - Definition und Bedeutung
- Service Level In…
There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.
Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen
Seminarziel
Am Ende des Seminars sind die Teilnehmenden in der Lage, SRE-Praktiken effektiv zu nutzen, um die Zuverlässigkeit, Skalierbarkeit und Sicherheit ihrer Systeme zu verbessern. Sie lernen, wie sie Projekte planen, entwickeln, integrieren und testen, um verschiedene Anforderungen abzudecken und die Systemleistung zu optimieren.Inhalt
- Einführung in Site Reliability Engineering (SRE)
- Was ist SRE und warum ist es wichtig? Historische Entwicklung und Hauptmerkmale
- Kerngedanken hinter SRE, Unterschiede zu traditionellen Operations- und DevOps-Ansätzen
- Typische Anwendungsbereiche und Szenarien, in denen SRE eingesetzt wird
- SLI / SLO / SLA - Definition und Bedeutung
- Service Level Indicators (SLI)
- Service Level Objectives (SLO)
- Service Level Agreements (SLA)
- Monitoring/Alerting Werkzeuge
- Einführung in gängige Überwachungs- und Logging-Tools (z.B. Prometheus, Grafana, ELK Stack)
- Tools und Prozesse zur Incident-Erkennung und -Behebung (z.B. PagerDuty, Opsgenie)
- Praktische Übung: Einrichtung einer Überwachungs- und
Incident Management-Lösung
- Problemstellung: Einrichtung einer Überwachungs- und Incident Management-Lösung für eine Beispielanwendung
- Lösung: Installation und Konfiguration von Prometheus und Grafana zur Überwachung, Einrichtung von Incident Management-Tools wie PagerDuty
- Ergebnis: Ein funktionierendes Überwachungs- und Incident Management-System für die Beispielanwendung
- Continuous Delivery und Release Engineering
- Kleine Deployments
- Automatisierte Deployments
- Canary Releases
- Feature Toggles
- Infrastruktur als Code
- Definition
- Nutzen
- Beispiele: Ansible / Terraform
- Zusammenarbeit zwischen Entwicklung und Betrieb
- Error Budgets: Konzept und Anwendung von Error Budgets zur Verwaltung von Systemstabilität und Featureentwicklung
- Reduzierung der operativen Last: Automatisierung, Toil-Reduzierung und Best Practices zur Effizienzsteigerung
- Incident Management
- Umgang mit Vorfällen und Ausfällen
- Status-Seite
- Post-Mortem-Analysen und Lessons Learned
- Hochverfügbarkeit vs. Notfallwiederherstellung
- Security & Compliance
- DSGVO
- Fortgeschrittene Techniken
- Chaos Engineering
- Kapazitätsplanung - datenbasiert
- Automatische Skalierung - in Public und Private Cloud
- Abschlussdiskussion und Feedbackrunde
There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.
