Site Reliability Engineering (SRE) Practitioner (SREP)
Starting dates and places
Description
Kursinhalt
Einführung in den Kurs
Modul 1: SRE-Anti-Patterns
- Umbenennung von Ops oder DevOps oder Dev in SRE
- Benutzer bemerken ein Problem, bevor Sie es bemerken
- Messen bis zum Rand
- Falschmeldungen sind schlimmer als keine Warnmeldungen
- Konfigurationsmanagement-Falle für Schneeflocken
- Der Dogpile: Reaktion auf einen Mob-Vorfall
- Punktbefestigung
- Gatekeeper für die Produktionsbereitschaft
- Fail-Safe wirklich?
Modul 2: SLO ist ein Proxy für Kundenzufriedenheit
- Definition von SLIs, die die Zuverlässigkeit eines Dienstes aus Sicht der Nutzer sinnvoll messen
- Festlegung von Systemgrenzen in einem verteilten Ökosystem zur Bestimmung korrekter SLIs
- Verwenden Sie Fehlerbudgets, damit Ihr Team besse…
Frequently asked questions
There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.
Kursinhalt
Einführung in den Kurs
Modul 1: SRE-Anti-Patterns
- Umbenennung von Ops oder DevOps oder Dev in SRE
- Benutzer bemerken ein Problem, bevor Sie es bemerken
- Messen bis zum Rand
- Falschmeldungen sind schlimmer als keine Warnmeldungen
- Konfigurationsmanagement-Falle für Schneeflocken
- Der Dogpile: Reaktion auf einen Mob-Vorfall
- Punktbefestigung
- Gatekeeper für die Produktionsbereitschaft
- Fail-Safe wirklich?
Modul 2: SLO ist ein Proxy für Kundenzufriedenheit
- Definition von SLIs, die die Zuverlässigkeit eines Dienstes aus Sicht der Nutzer sinnvoll messen
- Festlegung von Systemgrenzen in einem verteilten Ökosystem zur Bestimmung korrekter SLIs
- Verwenden Sie Fehlerbudgets, damit Ihr Team bessere Diskussionen führen und bessere datengestützte Entscheidungen treffen kann.
- Insgesamt ist die Zuverlässigkeit nur so gut wie das schwächste Glied in Ihrem Servicegraph
- Fehlerschwellen bei der Nutzung von Drittanbieterdiensten
Modul 3: Aufbau sicherer und zuverlässiger Systeme
- SRE und ihre Rolle beim Aufbau sicherer und zuverlässiger Systeme
- Design für eine sich verändernde Architektur
- Fehlertolerantes Design
- Design für Sicherheit
- Design für Resilienz
- Design für Skalierbarkeit
- Design für Leistung
- Design für Zuverlässigkeit
- Gewährleistung von Datensicherheit und Datenschutz
Modul 4: Beobachtbarkeit des gesamten Systems
- Moderne Apps sind komplex und unberechenbar
- Langsam ist das neue Down
- Säulen der Beobachtbarkeit
- Implementierung der synthetischen und Endbenutzer-Überwachung
- Beobachtungsorientierte Entwicklung
- Verteilte Rückverfolgung
- Was geschieht mit der Überwachung?
- Instrumentierung mit Bibliotheken und Agenten
Modul 5: Plattformtechnik und AIOPs
- Eine plattformzentrierte Sichtweise löst organisatorische Skalierbarkeitsprobleme wie Fragmentierung, Inkonsistenz und Unvorhersehbarkeit.
- Wie nutzen Sie AIOps zur Verbesserung der Ausfallsicherheit?
- Wie kann DataOps Ihnen auf diesem Weg helfen?
- Ein einfaches Rezept zur Umsetzung von AIOps
- Indikative Messung von AIOps
Modul 6: SRE & Incident Response Management
- SRE-Schlüsselzuständigkeiten für die Reaktion auf Vorfälle
- DevOps, SRE und ITIL
- OODA und SRE Reaktion auf Vorfälle
- Geschlossene Kreislaufsanierung und ihre Vorteile
- Schwärmen - ein Denkanstoß
- KI/ML für ein besseres Störungsmanagement
Modul 7: Chaos Engineering
- Komplexität bewältigen
- Chaos Engineering definiert
- Schnelle Fakten über Chaos Engineering
- Die Entstehungsgeschichte des Chaos-Affen
- Wer macht sich Chaos Engineering zu eigen?
- Mythen des Chaos
- Chaos-Engineering-Experimente
- GameDay-Übungen
- Sicherheit Chaos Engineering
- Chaos Engineering Ressourcen
Modul 8: SRE ist die reinste Form von DevOps
- Schlüsselprinzipien von SRE
- SREs helfen, die Zuverlässigkeit über das gesamte Produktspektrum hinweg zu erhöhen
- Metriken für den Erfolg
- Auswahl der Zielgebiete
- SRE-Ausführungsmodell
- Kultur und Verhaltenskompetenz sind entscheidend
- SRE Fallstudie
Aufgaben/Übungen nach dem Unterricht
- Nicht-abstraktes Design in großem Maßstab (nach Tag 1)
- Beobachtbarkeit und Überwachung (nach Tag 2)
- Chaos Engineering Instrumentation
Voraussetzungen
Es wird dringend empfohlen, vor der Teilnahme am SRE Practitioner Kurs den Site Reliability Engineering (SRE) Foundation (SREF) Kurs bei einem akkreditierten DevOps Institute Education Partner zu besuchen. Ein Verständnis und Kenntnisse der gängigen SRE-Terminologie, -Konzepte und -Prinzipien sowie entsprechende Berufserfahrung werden empfohlen.
Bitte beachten Sie: Die DevOps Institute SRE Foundation Zertifizierung ist eine Voraussetzung für die SRE Practitioner Prüfung.
Zielgruppe
Die Zielgruppe für den SRE-Practitioner-Kurs sind Fachleute, darunter:
- Alle, die sich mit der Skalierbarkeit und Zuverlässigkeit von Diensten in großem Maßstab befassen
- Alle, die sich für moderne IT-Führung und organisatorische Veränderungsansätze interessieren
- Business-Manager
- Wirtschaftliche Stakeholder
- Agenten des Wandels
- Berater
- DevOps-Praktiker
- IT-Direktoren
- IT-Manager
- IT-Teamleiter
- Produktverantwortliche
- Scrum Masters
- Software-Ingenieure
- Ingenieure für Standortzuverlässigkeit
- System Integrators
- Tool-Anbieter
Share your review
Do you have experience with this course? Submit your review and help other people make the right choice. As a thank you for your effort we will donate $1.- to Stichting Edukans.There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.