Incident, Problem und Change
Was ist ein Incident?
Definition und Abgrenzung
Ein Incident ist ein ungeplantes Ereignis, das den normalen Betrieb eines IT-Services stört oder die Qualität eines Services spürbar mindert. Stell dir vor, das E-Mail-System deines Unternehmens ist plötzlich für alle Beschäftigten nicht mehr erreichbar. Das ist ein klassischer Incident, weil eine Kernfunktion gestört ist und dies direkte Auswirkungen auf die Arbeitsfähigkeit vieler hat. Incidents erfordern eine schnelle Reaktion, um den Service so rasch wie möglich wieder in Stand zu setzen. Sie unterscheiden sich von Service Requests, bei denen es sich um geplante Anfragen für neue Services, Informationen oder Standardanpassungen handelt (z.B. die Anforderung eines neuen Laptops).
Ablauf des Incident Managements
Ziel des Incident Managements ist es, den normalen Servicebetrieb so schnell wie möglich wieder in Stand zu setzen und die negativen Folgen für das Geschäft zu minimieren. Der Ablauf umfasst typischerweise folgende Schritte:
- Aufnahme (Recording): Jeder Incident wird dokumentiert – wer hat was wann gemeldet?
- Einstufung (Classification): Der Incident wird kategorisiert (z.B. Hardwaredefekt, Softwarefehler, Netzwerkausfall), um das richtige Team für die Bearbeitung zu finden.
- Priorität festlegen (Prioritization): Die Dringlichkeit und der Einfluss des Incidents auf das Geschäft werden bewertet, um die Reihenfolge der Abarbeitung festzulegen. Ein Totalausfall des Bestellsystems hat eine höhere Priorität als ein einzelner defekter Drucker.
- Abarbeiten (Investigation & Diagnosis, Resolution & Recovery): Die Ursache wird untersucht und eine Methode zum Beheben (oft ein Workaround) implementiert, um den Service wieder nutzbar zu machen.
- Abschluss (Closure): Nach erfolgreichem Beheben und dem Okay der meldenden Person wird der Incident geschlossen und dokumentiert.
Was ist ein Problem?
Definition und Abgrenzung
Ein Problem ist die unbekannte zugrunde liegende Ursache eines oder mehrerer bereits aufgetretener oder potenzieller Incidents. Während sich das Incident Management auf die schnelle Wiederaufnahme des Services konzentriert (oft durch einen Workaround), zielt das Problem Management darauf ab, die Ursache (Root Cause) zu finden und dauerhaft zu beheben, um zukünftige Incidents zu vermeiden. Wenn beispielsweise der Drucker im Marketing-Büro jeden Montagmorgen ausfällt (mehrere Incidents), ist das ein Hinweis auf ein tieferliegendes Problem (z.B. ein veralteter Treiber, ein Netzwerkdefekt am Standort oder ein Hardwaredefekt am Drucker selbst).
Vom Incident zum Problem
Häufige oder schwerwiegende Incidents deuten oft auf ein tieferliegendes Problem hin. Das Incident Management liefert hierfür wichtige Daten (z.B. Beschreibungen der Fehler, betroffene Systeme), die das Problem Management zum Erkennen und Analysieren von Problemen nutzt.
Ablauf des Problem Managements
Ziel des Problem Managements ist es, die Ursachen von Incidents zu finden, zu analysieren und dauerhafte Lösungswege zu entwickeln, um zukünftige Incidents zu vermeiden. Der Ablauf beinhaltet:
- Erkennen (Problem Identification): Probleme werden durch Analyse von Incident-Daten, proaktive Trendanalysen oder Meldungen erkannt.
- Analyse (Problem Analysis/Diagnosis): Die Ursache des Problems wird systematisch untersucht. Hier kommen Techniken wie die "5 Whys" zum Einsatz.
- Beheben (Error Control & Resolution): Ein Workaround (temporärer Lösungsweg zur Umgehung des Problems) wird bereitgestellt und ein dauerhafter Lösungsweg (z.B. ein Software-Update, Austausch von Hardware) wird entwickelt und oft über das Change Management zum Implementieren vorgeschlagen.
- Abschluss (Problem Closure): Nachdem der dauerhafte Lösungsweg implementiert und seine Wirksamkeit getestet wurde, wird das Problem geschlossen.
Was ist ein Change?
Definition und Arten von Changes
Ein Change (Anpassung) ist das geplante Hinzufügen, Modifizieren oder Entfernen von etwas, das Effekte auf (IT-)Services haben könnte. Ziel des Change Managements ist es, sicherzustellen, dass Anpassungen kontrolliert und mit minimalem Risiko für den laufenden Betrieb umgesetzt werden.
Arten von Changes
Es gibt verschiedene Arten von Changes:
- Standard Change: Eine vorab freigegebene, risikoarme und häufig durchgeführte Anpassung mit einem etablierten Verfahren. Beispiel: Das Zurücksetzen eines Passworts durch den Helpdesk nach einem standardisierten Verfahren oder das Installieren eines bereits freigegebenen Softwarepakets auf einem neuen Arbeitsplatz.
- Normal Change: Eine Anpassung, die nicht Standard ist und den normalen Change-Prozess durchlaufen muss, einschließlich Beurteilen, Freigabe und Planen. Beispiel: Das Installieren eines neuen Sicherheitspatches auf einem Server oder das Upgrade einer zentralen Unternehmenssoftware.
- Emergency Change (Notfall-Change): Eine Anpassung, die so schnell wie möglich implementiert werden muss, um einen schwerwiegenden Incident zu beheben oder zu vermeiden. Beispiel: Das sofortige Austauschen einer defekten Festplatte in einem kritischen System, um einen Totalausfall zu vermeiden, oder das Einspielen eines dringenden Sicherheitsupdates bei einer akuten Gefahr.
Ablauf des Change Managements
Der Change Management Prozess stellt sicher, dass Anpassungen effizient und sicher erfolgen:
- Antrag (Request for Change – RfC): Die geplante Anpassung wird formal beantragt und beschrieben.
- Beurteilen (Assessment/Evaluation): Die Effekte, Risiken, Kosten und der Nutzen der Anpassung werden beurteilt.
- Freigabe (Authorization): Basierend auf dem Beurteilen wird der Change freigegeben oder abgelehnt.
- Implementieren (Implementation): Der Change wird geplant, gebaut, getestet und ausgerollt.
- Abschluss (Review and Closure): Nach dem Implementieren wird der Erfolg des Changes überprüft und der Change-Vorgang dokumentiert und geschlossen.
Zusammenspiel mit Incidents und Problems
Ist die Ursache eines Problems gefunden, erfordert das dauerhafte Beheben oft eine Anpassung der IT-Infrastruktur oder der Services. Dieser Lösungsweg wird dann als Change über das Change Management beantragt, beurteilt und implementiert. Nicht jede Anpassung an der IT-Umgebung verläuft reibungslos. Eine schlecht geplante oder fehlerhaft implementierte Anpassung (Change) kann selbst neue Incidents hervorrufen. Ein gutes Change Management minimiert dieses Risiko durch sorgfältiges Planen, Tests und Beurteilen der Risiken.
Lernziele
- das Konzept eines Incidents erklären, indem die Definition, die Abgrenzung zu anderen Ereignissen und die typischen Schritte im Incident Management Prozess (Erfassung, Klassifizierung, Priorisierung, Bearbeitung, Abschluss) anhand konkreter Beispiele dargestellt werden.
- das Konzept eines Problems erklären, indem die Definition, die Abgrenzung zu Incidents und die typischen Schritte im Problem Management Prozess (Identifizierung, Analyse, Lösung, Abschluss) anhand konkreter Beispiele dargestellt werden.
- das Konzept eines Changes erklären, indem die Definition, die verschiedenen Arten von Changes (Standard, Normal, Emergency) und die typischen Schritte im Change Management Prozess (Antrag, Bewertung, Genehmigung, Umsetzung, Abschluss) anhand konkreter Beispiele dargestellt werden.
- die Beziehungen zwischen Incident, Problem und Change Management interpretieren, indem die Schnittstellen und Abhängigkeiten zwischen den Prozessen analysiert und deren Bedeutung für die kontinuierliche Verbesserung der IT-Services dargestellt werden.