LIVCK Cloud

Incidents verstehen

Ein Incident (Vorfall) repräsentiert eine Störung mit einem oder mehreren deiner Services. LIVCK Cloud verfolgt Vorfälle von der Erkennung bis zur Lösung und kommuniziert sie transparent an deine Kunden.

Was ist ein Incident?

Ein Incident dokumentiert eine unerwartete Beeinträchtigung -- etwa einen Website-Ausfall, langsame API-Antworten oder einen nicht erreichbaren Server. Er bietet dir:

  • Zentrale Dokumentation: Alles zu einer Störung an einem Ort
  • Status-Verlauf: Jede Veränderung wird in der Timeline protokolliert
  • Transparente Kommunikation: Veröffentliche Incidents auf deiner Statuspage
  • Team-Zusammenarbeit: Interne Kommentare für die Abstimmung im Team

Schweregrade

Jeder Incident hat einen Schweregrad, der die Auswirkung beschreibt:

SchweregradBedeutungBeispiel
GeringKleine Einschränkung, der Service ist grundsätzlich verfügbarEinzelne Seiten laden langsamer als gewöhnlich
ErheblichDeutliche Beeinträchtigung, Teile des Services sind betroffenLogin-Funktion nicht verfügbar, API liefert Fehler
KritischKomplettausfall oder schwerwiegende StörungWebsite komplett nicht erreichbar

Den richtigen Schweregrad wählen

Frage dich: "Wie stark sind meine Kunden betroffen?" -- Können sie den Service noch nutzen (Gering), ist ein wichtiger Teil eingeschränkt (Erheblich), oder geht gar nichts mehr (Kritisch)?

Status-Verlauf

Jeder Incident durchläuft einen definierten Status-Verlauf:

StatusBedeutung
UntersuchungDas Problem wurde erkannt, die Ursache wird gesucht
IdentifiziertDie Ursache ist bekannt, eine Lösung wird vorbereitet
ÜberwachungEin Fix wurde angewendet, das Ergebnis wird beobachtet
BehobenDas Problem ist gelöst, der Service läuft wieder normal

Typischer Ablauf

Die meisten Incidents starten mit Untersuchung und werden schrittweise auf Identifiziert, Überwachung und Behoben gesetzt. Jeder Statuswechsel kann an deine Kunden kommuniziert werden.

Manuell vs. Automatisch erstellt

Ein Incident entsteht auf zwei Wegen:

Manuell -- Du erstellst ihn selbst, etwa bei von Kunden gemeldeten Problemen, Performance-Einbußen oder zur Vorab-Kommunikation bekannter Störungen. So erstellst du einen Incident manuell

Automatisch -- LIVCK erstellt einen Incident, sobald die Mehrheit der Monitoring-Standorte einen Fehler bestätigt. Diese Incidents tragen ein "Automatisch"-Tag. Mehr zur automatischen Erkennung

Was du mit Incidents tun kannst

  • Erstellen und veröffentlichen -- Manuell oder automatisch, als Entwurf oder direkt auf der Statuspage
  • Status-Updates posten -- Halte Kunden über den Fortschritt auf dem Laufenden (Timeline)
  • Interne Kommentare -- Koordiniere dich im Team, ohne dass Kunden es sehen (Kommentare)
  • Betroffene Services zuordnen -- Verknüpfe einen oder mehrere Services
  • Postmortem schreiben -- Dokumentiere Ursache und Maßnahmen (Postmortems)

Incidents vs. Wartungen

IncidentWartung
ArtUngeplante StörungGeplante Arbeiten
Wann erstellt?Wenn etwas schiefgehtIm Voraus, für geplante Arbeiten
StatuspageZeigt aktive Störung anZeigt geplante Wartung an
Automatisch erkannt?Ja, möglichNein, immer manuell

Kurz gesagt

Incidents = Etwas ist kaputt, wir arbeiten daran. Wartungen = Wir machen geplant etwas, kurze Unterbrechung möglich.

Weiterführende Themen