Datenqualität im E-Commerce sichern

4 min 3 Abschnitte
Was du nach diesem Konzept kannst 3
  1. Du bist in der Lage, typische Ursachen mangelhafter Datenqualität im E-Commerce (z. B. Doppelzählungen durch fehlerhafte Tracking-Pixel, Bot-Traffic, Duplikate, fehlende Werte) zu analysieren ,

    indem in einem Beispieldatensatz mindestens 3 Qualitätsprobleme identifiziert und deren Auswirkungen auf nachgelagerte Entscheidungen (Einkauf, Marketing) beschrieben werden.

  2. Du bist in der Lage, die Qualität eines Datenbestandes anhand zentraler Dimensionen (Vollständigkeit, Korrektheit, Konsistenz, Aktualität) zu bewerten ,

    indem 4 Qualitätsdimensionen auf einen konkreten Datensatz angewendet und in einem begründeten Gesamturteil mit Handlungsempfehlung zusammengeführt werden.

  3. Du bist in der Lage, ein Maßnahmenpaket zur Sicherung der Datenqualität in einem Onlineshop zu entwickeln ,

    indem mindestens 3 präventive (z. B. Bot-Filter, Validierungsregeln) und 2 reaktive Maßnahmen (z. B. Dublettenbereinigung) definiert und jeweils Verantwortlichkeit sowie Prüfintervall festgelegt werden.

Warum zeigt das Dashboard doppelt so viele Bestellungen wie der Versand?

1.200 im Dashboard, 580 im Versand

1.200 Bestellungen für Winterjacken laut Analytics-Dashboard. 580 versendete Pakete laut Versandabteilung. Donnerstag, 14:30 Uhr. Deine Teamleitung dreht den Bildschirm zu dir: "Die Zahlen können nicht stimmen. Der Einkauf will morgen früh auf Basis der 1.200 nachbestellen."

Beim Thema softwaregestützte Istwert-Ermittlung hast du gesehen, dass Daten aus verschiedenen Systemen voneinander abweichen können - durch Cookie-Banner, Stornierungen oder Zeitverzögerungen. Aber eine Differenz von über 100 Prozent? Das ist kein normaler Tracking-Verlust. Hier stecken grundlegende Datenqualitätsprobleme im System.

Wird auf Basis der falschen Zahl bestellt, liegen 400 Jacken zu viel im Lager: über 16.000 Euro gebundenes Kapital plus Lagerkosten pro Woche.

Drei Probleme im Rohdaten-Export

Du öffnest den Rohdaten-Export und vergleichst ihn mit den ERP-Daten. Drei Probleme fallen auf:

  1. Ein fehlerhaftes Tracking-Pixel verursacht Doppelzählungen: Bei jedem Seiten-Reload feuert das Kauf-Event erneut. Ein einziger Kauf erscheint im Dashboard als zwei oder drei Bestellungen.
  2. Bot-Traffic verfälscht die Seitenstatistik: Automatisierte Crawler rufen Produktseiten auf und erzeugen Verweildauern von über 45 Minuten pro Seite. Kein Mensch liest so lange eine Jacken-Produktseite.
  3. Bei 12 Prozent der Datensätze fehlt das Versanddatum. Ohne dieses Feld lässt sich nicht prüfen, ob eine Bestellung tatsächlich rausging.

Für den Einkauf bedeutet das: Doppelzählungen und Bot-Traffic treiben die Bestellzahl künstlich nach oben, fehlende Versanddaten verhindern den Abgleich mit dem tatsächlichen Absatz. Zusammen machen sie den Datensatz unbrauchbar für eine Nachbestellentscheidung.

🎬 Vorstellung: Öffne gedanklich das Analytics-Dashboard deines Ausbildungsbetriebs. Welche der drei Probleme könnten auch dort auftreten?

Wie bewertest du, ob ein Datensatz für Entscheidungen taugt?

Vier Qualitätsdimensionen als Prüfrahmen

Drei Probleme hast du gefunden. Aber wie bewertest du systematisch, ob der gesamte Datensatz für eine Einkaufsentscheidung taugt? Vier Qualitätsdimensionen helfen dir dabei:

Vollständigkeit - sind alle Pflichtfelder gefüllt? Im Jacken-Datensatz fehlen bei 12 Prozent der Einträge die Versanddaten.

Korrektheit - stimmen die Werte mit der Realität überein? Die doppelt gezählten Bestellungen sind formal vorhanden, aber inhaltlich falsch.

Konsistenz - passen die Daten aus verschiedenen Quellen zusammen? Dashboard und ERP widersprechen sich um den Faktor 2.

Aktualität - sind die Daten zum Entscheidungszeitpunkt noch gültig? Wenn der Einkauf morgen früh bestellt, muss der Datensatz den Stand von heute zeigen.

Gesamturteil für den Jacken-Datensatz

Wende die vier Dimensionen auf den Datensatz an:

Drei von vier Dimensionen sind mangelhaft. Gesamturteil: Dieser Datensatz ist nicht entscheidungsfähig. Empfehlung an den Einkauf: Nachbestellung stoppen, bis die Daten bereinigt sind.

🤔 Frage dich: Wie würdest du vorgehen, wenn deine Teamleitung trotz des mangelhaften Gesamturteils auf einer sofortigen Nachbestellung besteht?

Welche Maßnahmen verhindern, dass es wieder passiert?

Präventiv und reaktiv absichern

Ein Maßnahmenpaket gegen Datenqualitätsprobleme besteht aus zwei Säulen:

Präventiv - Fehler gar nicht erst entstehen lassen:

  1. Bot-Filter im Analytics-Tool aktivieren. Verantwortlich: IT. Prüfintervall: wöchentlich.
  2. Tracking-Pixel nach jedem Shop-Release validieren - ein Testkauf im Staging-System zeigt, ob das Kauf-Event genau einmal feuert. Verantwortlich: Online-Marketing. Prüfintervall: nach jedem Release.
  3. Pflichtfeld-Validierung im Bestellprozess einrichten, damit kein Datensatz ohne Versanddatum gespeichert wird. Verantwortlich: Entwicklung. Prüfintervall: bei jeder Shop-Änderung.

Reaktiv - bestehende Fehler aufspüren und bereinigen:

  1. Monatliche Dublettenbereinigung im Datensatz. Verantwortlich: Datenqualitäts-Team.
  2. Wöchentlicher Datenabgleich zwischen ERP und Analytics. Verantwortlich: Controlling.

Was wäre im Jacken-Fall anders gelaufen?

Mit diesem Maßnahmenpaket wäre die Differenz zwischen 1.200 und 580 gar nicht erst so groß geworden. Der Bot-Filter hätte die künstlichen Seitenaufrufe aussortiert. Die Pixel-Validierung hätte die Doppelzählung beim letzten Release aufgedeckt. Und der wöchentliche ERP-Abgleich hätte die fehlenden Versanddaten als Warnsignal gemeldet, bevor der Einkauf auf Basis falscher Zahlen bestellt.

Keine 400 überschüssigen Jacken, keine 16.000 Euro gebundenes Kapital.

📝 Fasse mental zusammen: Fünf Maßnahmen, zwei Säulen. Welche drei sind präventiv, welche zwei reaktiv - und wer ist jeweils verantwortlich?

Teste dein Wissen

In deinem E-Commerce-Team stellst du fest, dass die Anzahl der Bestellungen in Analytics die der Versandabteilung um 100 % übersteigt. Welche Ursache ist für diese Diskrepanz am wahrscheinlichsten?

Bereit für mehr?

Thema verstanden?

Teste dein Wissen interaktiv in unserer App. 7 Tage kostenlos, dann nur 5 € im Monat.

DSGVO-konform. Deine Daten auf deutschen Servern.