Welche der 340 Tickets kann ein Bot übernehmen?
340 offene Anfragen, eine Entscheidung
Woran machst du fest, ob ein KI-Chatbot dein Service-Team entlastet oder neue Probleme schafft?
Deine Teamleiterin Anja stellt genau diese Frage am Montag im Service-Workshop. Der Auslöser: 340 offene Tickets im System. Reaktionszeit bei 68 Stunden, das SLA gibt 24 vor. Über 200 Anfragen sind Retouren-Standardfragen: Rücksendeetikett anfordern, Bearbeitungsstand erfragen, Erstattung nachfragen. Dazwischen stecken wütende Mails von Kund:innen, deren defekte Ware seit drei Wochen nicht ersetzt wurde. Die Geschäftsführung will bis morgen eine Einschätzung. Letzten Monat sind drei Großkund:innen abgesprungen.
Erinnerst du dich an die Stärken und Grenzen der einzelnen Servicekanäle? Genau hier setzt die nächste Stufe an: KI-gestützte Servicekanäle, die Standardanfragen automatisiert bearbeiten, während sich Fachkräfte auf die schwierigen Fälle konzentrieren.
Vier Kriterien für die Chatbot-Entscheidung
Ob sich ein Chatbot lohnt, prüfst du an vier Kriterien:
- Anfragevolumen: Wie viele Anfragen pro Monat betreffen dasselbe Thema? Bei 2.000 Retourenanfragen monatlich ist das Volumen hoch genug, damit sich die Einrichtung rechnet.
- Standardisierungsgrad: Lassen sich die Anfragen mit festen Regeln beantworten? "Wo ist mein Rücksendeetikett?" folgt einem klaren Muster. "Mein Schuh löst sich nach drei Wochen auf" nicht.
- Erwartete Kostenersparnis: Was kostet eine manuelle Bearbeitung pro Ticket (z.B. 4,50 Euro), und wie viel entfällt durch Automatisierung? Bei 1.500 automatisierbaren Tickets ergibt das 6.750 Euro monatlich.
- Auswirkung auf die Kundenzufriedenheit (CSAT): Sinkt die Zufriedenheit, wenn Kund:innen mit einem Bot sprechen? Für Statusfragen meist nicht, für emotionale Beschwerden fast immer.
🤔 Frage dich: Wie würdest du die Chatbot-Bewertung anpassen, wenn dein Shop statt Sportartikeln erklärungsbedürftige Medizinprodukte verkauft?
Wann muss der Bot an einen Menschen übergeben?
Drei Trigger für die Übergabe
Der Chatbot fängt die 200 Standardfragen ab. Aber was passiert, wenn jemand seit drei Wochen auf den Ersatz defekter Laufschuhe wartet und beim Bot landet? Diese Person darf nicht in einer Sackgasse enden. Ein guter Eskalationspfad definiert drei Dinge: Wann wird übergeben, welche Daten gehen mit, und wer übernimmt?
Drei typische Übergabe-Trigger:
- Kund:innen wählen aktiv "Mit einer Person sprechen".
- Der Bot erkennt Schlüsselwörter wie "Anwalt", "Beschwerde" oder "seit Wochen".
- Der Konfidenzwert des Bots fällt unter einen Schwellenwert (z.B. 60 %) - die Anfrage ist zu komplex.
Daten und Rollen bei der Übergabe
Bei jedem Trigger gehen drei Datenpunkte automatisch an die menschliche Fachkraft:
- Kundennummer und Bestellhistorie - die Fachkraft muss nicht erneut fragen.
- Bisheriger Chatverlauf - die anfragende Person wiederholt sich nicht.
- Automatisch ermittelter Stimmungswert - die Fachkraft weiß sofort, ob Deeskalation nötig ist.
Die Rollenzuordnung hängt vom Anlass ab. Standardreklamationen gehen an den First-Level-Support. Fälle mit Eskalations-Triggern gehen direkt an Fachkräfte mit Entscheidungskompetenz, die z.B. Gutschriften oder Ersatzlieferungen freigeben können.
🧑🏫 Erkläre es im Kopf: Stell dir vor, du erklärst einer neuen Kollegin in zwei Sätzen, warum der Chatverlauf bei der Bot-Übergabe mitgeschickt werden muss - wie formulierst du das?
Was passiert, wenn die KI die Wut übersieht?
Sentiment-Analyse sortiert das Ticket-Backlog
Zurück zu Anjas 340 Tickets. Zwischen den Standardfragen stecken wütende Mails, aber welche? Eine Sentiment-Analyse (KI-gestützte Stimmungserkennung) scannt eingehende Tickets automatisch und vergibt einen Stimmungswert: positiv, neutral oder negativ.
Fünf Beispiel-Tickets:
- Ticket A: "Wo ist mein Rücksendeetikett?" - neutral, Priorität normal
- Ticket B: "Seit DREI WOCHEN warte ich! Das ist eine Frechheit!" - negativ, Priorität hoch
- Ticket C: "Können Sie mir die Größentabelle schicken?" - neutral, Priorität normal
- Ticket D: "Bin zufrieden, aber eine Frage zur Rechnung..." - positiv, Priorität normal
- Ticket E: "Wenn das nicht bis Freitag gelöst ist, storniere ich alles." - negativ, Priorität hoch
Ohne Analyse bearbeitet das Team alle Tickets nach Eingang. Mit Analyse rutschen B und E nach oben - die verärgerten Kund:innen bekommen schneller eine Antwort.
Zwei Risiken der automatischen Stimmungserkennung
Die Sentiment-Analyse hat blinde Flecken:
Fehlklassifikation durch Ironie: "Na toll, super Service" klingt für die KI positiv, ist aber sarkastisch gemeint. Solche Tickets landen in der falschen Prioritätsstufe und bleiben liegen.
Bias (systematische Verzerrung) durch einseitige Trainingsdaten: Wurde die KI überwiegend mit standarddeutschen Texten trainiert, ordnet sie Anfragen in gebrochenem Deutsch oder mit Dialektausdrücken schlechter ein. Bestimmte Kundengruppen werden systematisch benachteiligt.
Für Anjas Sportartikel-Shop bedeutet das: Die Sentiment-Analyse beschleunigt die Bearbeitung der 340 Tickets, ersetzt aber nicht die menschliche Prüfung bei Grenzfällen. Die drei Großkund:innen, die letzten Monat abgesprungen sind, hätte ein frühzeitig erkanntes negatives Sentiment vielleicht gehalten.
📝 Fasse mental zusammen: Drei KI-Werkzeuge, drei Probleme aus Anjas Ticket-Backlog. Welches Werkzeug adressiert welches Problem - und wo bleibt der Mensch unverzichtbar?
Teste dein Wissen
Du bewertest die Einführung eines KI-Chatbots für 2.000 monatliche Standardanfragen. Welches Kriterium ist laut Branchenstudien der primäre Treiber für die Wirtschaftlichkeit?