Incident verwalten
Nach dem Erstellen begleitest du einen Incident durch seinen Lebenszyklus -- von der Untersuchung über Status-Updates bis zur Auflösung und dem Postmortem.
Die Incident-Übersicht
Unter "Vorfälle" in der Seitenleiste findest du alle Incidents, filterbar nach Status:
- Alle: Offene und behobene Incidents
- Offen: Nur aktive, noch nicht behobene Incidents
- Behoben: Abgeschlossene Incidents
Die Tabelle zeigt:
| Spalte | Beschreibung |
|---|---|
| Titel | Der Name des Incidents |
| Schweregrad | Gering, Erheblich oder Kritisch (als farbiges Badge) |
| Status | Untersuchung, Identifiziert, Überwachung oder Behoben |
| Erstellt | Wann der Incident angelegt wurde |
| Aktionen | Menü zum Bearbeiten, Beheben oder Löschen |
Klicke auf den Titel, um die Detailseite zu öffnen.
Bulk-Aktionen
Mehrere Incidents gleichzeitig auswählen und gesammelt als behoben markieren oder löschen -- praktisch, wenn nach einer Störung mehrere Incidents auf einmal aufgelöst werden.
Die Incident-Detailseite
Der Header zeigt Titel, Schweregrad und Status (als Badges), Erstellt von (oder "Automatisch") sowie die Zeitstempel für Erstellung und letzte Aktualisierung.
Darunter findest du mehrere Tabs:
| Tab | Inhalt |
|---|---|
| Übersicht | Aktuelle Informationen, betroffene Services, letzte Nachricht |
| Verlauf | Chronologische Timeline aller Status-Updates |
| Kommentare | Interne Team-Kommentare (nicht öffentlich) |
| Postmortem | Nachbetrachtung nach der Auflösung |
| Services | Alle betroffenen Services mit aktuellem Status |
Status-Updates posten (Timeline)
Die Timeline ist das Herzstück der Incident-Kommunikation: Jeder Statuswechsel und jede Nachricht wird chronologisch aufgelistet.
So postest du ein Update
- Öffne die Incident-Detailseite
- Klicke auf "Update hinzufügen"
- Wähle den neuen Status (Untersuchung, Identifiziert, Überwachung oder Behoben)
- Schreibe eine Nachricht, die erklärt, was sich geändert hat
- Entscheide, ob Abonnenten benachrichtigt werden sollen
- Klicke auf "Update posten"
Automatische Updates
Updates aus der automatischen Erstellung oder Auflösung werden mit einem "Automatisch"-Tag markiert -- so unterscheidest du sie von manuellen Einträgen.
Gute Updates schreiben
Ein gutes Update beantwortet drei Fragen: Was ist passiert?, Was wird unternommen? und Wann gibt es Neuigkeiten?
Beispiel:
"Wir haben die Ursache für die erhöhten Antwortzeiten identifiziert. Ein Kapazitätsengpass in unserer Infrastruktur führt dazu, dass Anfragen langsamer verarbeitet werden. Wir skalieren gerade die betroffenen Systeme hoch. Das nächste Update folgt in 30 Minuten."
Interne Kommentare
Kommentare sind nur für dein Team sichtbar und tauchen nicht auf der Statuspage auf. Nutze sie für die interne Abstimmung:
- Team-Kommunikation: Erkenntnisse teilen, Aufgaben koordinieren, Stand festhalten
- Markdown: Überschriften, Listen, Links und Code werden unterstützt
- Bearbeiten und Löschen: Eigene Kommentare lassen sich nachträglich anpassen
Incident beheben (Resolve)
- Öffne die Incident-Detailseite
- Klicke auf "Update hinzufügen"
- Wähle den Status "Behoben"
- Schreibe eine abschließende Nachricht, die zusammenfasst, was passiert ist und wie es gelöst wurde
- Entscheide, ob Abonnenten benachrichtigt werden sollen
- Klicke auf "Update posten"
Beim Beheben passiert automatisch: Der Auflösungs-Zeitstempel wird gesetzt, alle verknüpften Services werden als "Wiederhergestellt" markiert und Abonnenten werden benachrichtigt (wenn aktiviert).
Wieder öffnen
Tritt das Problem erneut auf, setzt du den Status wieder auf "Untersuchung" oder einen anderen offenen Status -- der Incident gilt dann wieder als aktiv.
Postmortem schreiben
Nach der Auflösung empfehlen wir ein Postmortem -- eine strukturierte Nachbetrachtung. Du kannst auch schon während der Bearbeitung beginnen. Ein Postmortem enthält:
| Abschnitt | Was gehört rein? |
|---|---|
| Zusammenfassung | Was ist passiert? (Kurzfassung) |
| Ursache | Was hat das Problem ausgelöst? |
| Auswirkung | Welche Services und Kunden waren betroffen? Wie lange? |
| Maßnahmen | Was wurde getan? Was verhindert eine Wiederholung? |
| Zusätzliche Details | Weitere relevante Informationen |
Als Entwurf ist es nur intern sichtbar, veröffentlicht erscheint es auf deiner Statuspage.
Incident löschen
- Öffne das Aktionsmenü (drei Punkte)
- Wähle "Löschen" und bestätige
Achtung -- endgültig
Das Löschen ist unwiderruflich. Status-Updates, interne Kommentare, Postmortem und Service-Zuordnungen werden entfernt. Überlege, ob du den Incident stattdessen als behoben markierst -- dann bleibt die Historie erhalten.
Tipps für effektives Incident-Management
- Regelmäßig updaten: Ein kurzes Update zeigt, dass du aktiv daran arbeitest
- Schnell beheben: Markiere behoben, sobald der Service wieder läuft
- Postmortem nicht vergessen: Bei erheblichen und kritischen Incidents immer eines schreiben -- für Kunden und fürs Team
- Vorlagen nutzen: Incident-Vorlagen sparen Zeit und sorgen für konsistente Kommunikation
Weiterführende Themen
- Incident erstellen -- Einen neuen Incident anlegen
- Interne Kommentare -- Team-Kommunikation während des Incidents
- Postmortems -- Strukturierte Nachbetrachtung schreiben
- Automatische Erkennung -- Wie automatische Incidents funktionieren
- Incident-Richtlinien -- Erkennung und Benachrichtigungen konfigurieren
- Incident-Vorlagen -- Vorlagen für schnellere Incident-Erstellung