Incidents verstehen
Ein Incident (Vorfall) repräsentiert eine Störung mit einem oder mehreren deiner Services. LIVCK Cloud verfolgt Vorfälle von der Erkennung bis zur Lösung und kommuniziert sie transparent an deine Kunden.
Was ist ein Incident?
Ein Incident dokumentiert eine unerwartete Beeinträchtigung -- etwa einen Website-Ausfall, langsame API-Antworten oder einen nicht erreichbaren Server. Er bietet dir:
- Zentrale Dokumentation: Alles zu einer Störung an einem Ort
- Status-Verlauf: Jede Veränderung wird in der Timeline protokolliert
- Transparente Kommunikation: Veröffentliche Incidents auf deiner Statuspage
- Team-Zusammenarbeit: Interne Kommentare für die Abstimmung im Team
Schweregrade
Jeder Incident hat einen Schweregrad, der die Auswirkung beschreibt:
| Schweregrad | Bedeutung | Beispiel |
|---|---|---|
| Gering | Kleine Einschränkung, der Service ist grundsätzlich verfügbar | Einzelne Seiten laden langsamer als gewöhnlich |
| Erheblich | Deutliche Beeinträchtigung, Teile des Services sind betroffen | Login-Funktion nicht verfügbar, API liefert Fehler |
| Kritisch | Komplettausfall oder schwerwiegende Störung | Website komplett nicht erreichbar |
Den richtigen Schweregrad wählen
Frage dich: "Wie stark sind meine Kunden betroffen?" -- Können sie den Service noch nutzen (Gering), ist ein wichtiger Teil eingeschränkt (Erheblich), oder geht gar nichts mehr (Kritisch)?
Status-Verlauf
Jeder Incident durchläuft einen definierten Status-Verlauf:
| Status | Bedeutung |
|---|---|
| Untersuchung | Das Problem wurde erkannt, die Ursache wird gesucht |
| Identifiziert | Die Ursache ist bekannt, eine Lösung wird vorbereitet |
| Überwachung | Ein Fix wurde angewendet, das Ergebnis wird beobachtet |
| Behoben | Das Problem ist gelöst, der Service läuft wieder normal |
Typischer Ablauf
Die meisten Incidents starten mit Untersuchung und werden schrittweise auf Identifiziert, Überwachung und Behoben gesetzt. Jeder Statuswechsel kann an deine Kunden kommuniziert werden.
Manuell vs. Automatisch erstellt
Ein Incident entsteht auf zwei Wegen:
Manuell -- Du erstellst ihn selbst, etwa bei von Kunden gemeldeten Problemen, Performance-Einbußen oder zur Vorab-Kommunikation bekannter Störungen. So erstellst du einen Incident manuell
Automatisch -- LIVCK erstellt einen Incident, sobald die Mehrheit der Monitoring-Standorte einen Fehler bestätigt. Diese Incidents tragen ein "Automatisch"-Tag. Mehr zur automatischen Erkennung
Was du mit Incidents tun kannst
- Erstellen und veröffentlichen -- Manuell oder automatisch, als Entwurf oder direkt auf der Statuspage
- Status-Updates posten -- Halte Kunden über den Fortschritt auf dem Laufenden (Timeline)
- Interne Kommentare -- Koordiniere dich im Team, ohne dass Kunden es sehen (Kommentare)
- Betroffene Services zuordnen -- Verknüpfe einen oder mehrere Services
- Postmortem schreiben -- Dokumentiere Ursache und Maßnahmen (Postmortems)
Incidents vs. Wartungen
| Incident | Wartung | |
|---|---|---|
| Art | Ungeplante Störung | Geplante Arbeiten |
| Wann erstellt? | Wenn etwas schiefgeht | Im Voraus, für geplante Arbeiten |
| Statuspage | Zeigt aktive Störung an | Zeigt geplante Wartung an |
| Automatisch erkannt? | Ja, möglich | Nein, immer manuell |
Kurz gesagt
Incidents = Etwas ist kaputt, wir arbeiten daran. Wartungen = Wir machen geplant etwas, kurze Unterbrechung möglich.
Weiterführende Themen
- Incident erstellen -- Schritt für Schritt einen Vorfall anlegen
- Incident verwalten -- Updates posten, kommentieren und auflösen
- Automatische Erkennung -- Wie LIVCK Ausfälle selbst erkennt
- Postmortems -- Nach dem Incident: Ursachen dokumentieren
- Incident-Richtlinien -- Erkennung und Benachrichtigungen konfigurieren
- Incident-Vorlagen -- Wiederkehrende Incidents schneller erstellen