Primärdaten und Datenherkunft

Was sind Primärdaten?

Primärdaten: Die unverfälschte Informationsquelle

Primärdaten sind Rohdaten, die direkt an ihrer Entstehungsquelle und für einen spezifischen Untersuchungszweck erstmalig erhoben werden. Sie sind sozusagen die "Originalaufnahmen" und wurden noch nicht weiterverarbeitet, interpretiert oder zusammengefasst. Ihre Bedeutung liegt darin, dass sie die unverfälschte Grundlage für jede weitere Analyse und Entscheidungsfindung bilden und somit maßgeblich die Datenqualität bestimmen.

Beispiele für Primärdaten:

  • Die Messwerte eines Temperatursensors in einer Produktionshalle, die im Sekundentakt erfasst werden.
  • Die exakten, unveränderten Antworten von Teilnehmenden einer Online-Umfrage zu einem neuen Software-Feature.
  • Logfiles eines Webservers, die jeden einzelnen Klick und jede Anfrage mit Zeitstempel aufzeichnen.
  • Die Rohdaten eines Experiments, beispielsweise die Reaktionszeiten von Testpersonen in einer psychologischen Studie.

Primärdaten vs. Sekundärdaten: Der feine Unterschied

Im Gegensatz zu Primärdaten sind Sekundärdaten bereits vorhandene Daten, die ursprünglich für einen anderen Zweck gesammelt wurden und nun für eine neue Analyse herangezogen werden. Sie sind oft bereits aggregiert, gefiltert oder interpretiert.

Beispiele für Sekundärdaten:

  • Die einzelnen Kassenbons eines Supermarktes mit jedem verkauften Artikel, Preis und Zeitpunkt (Primärdaten) werden zu Monatsumsatzbericht, gruppiert nach Warengruppe zusammengefasst (Sekundärdaten).
  • Ein Energieversorger erstellt aus den stündlichen Verbrauchsmessungen (Primärdaten) einen Jahresverbrauchsbericht für jede Kundin und jeden Kunden (Sekundärdaten).
  • Ein Online-Shop wertet die Logfiles der Website (Primärdaten) aus und erstellt daraus eine Heatmap, die zeigt, welche Seitenbereiche von Nutzer:innen am häufigsten angeklickt werden (Sekundärdaten).

Warum ist die Herkunft von Daten (Provenienz) entscheidend?

Datenherkunft (Provenienz): Das "Woher" und "Wie" der Daten

Datenprovenienz (oder Datenherkunft) beschreibt die gesamte Entstehungsgeschichte und den Verarbeitungsweg von Daten. Sie ist wie der Lebenslauf einer Information und beantwortet Fragen wie:

  • Woher stammen die Daten ursprünglich (Quelle)? Zum Beispiel: Welcher Sensor hat den Wert geliefert? Aus welcher Datenbanktabelle stammt der Eintrag?
  • Wer oder was hat sie erzeugt? War es ein automatisiertes System, eine manuelle Eingabe durch eine bestimmte Person?
  • Wann wurden sie erzeugt und zuletzt geändert?
  • Welche Verarbeitungsschritte haben sie durchlaufen? Wurden sie transformiert, gefiltert, mit anderen Daten kombiniert oder aggregiert?
  • Unter welchen Bedingungen wurden sie erhoben? Gab es spezielle Umstände bei der Messung oder Eingabe?

Stell dir vor, du analysierst das Feedback von Kund:innen zu einem neuen Produkt. Die Provenienz würde dir sagen, ob das Feedback aus einer strukturierten Online-Umfrage mit geschlossenen Fragen stammt, ein frei formulierter Kommentar auf einer Social-Media-Plattform ist oder das Protokoll eines ausführlichen Telefongesprächs mit dem Support darstellt. Diese Herkunftsinformationen sind entscheidend für die korrekte Interpretation und den Kontext der Daten.

Vertrauenswürdigkeit und Nachvollziehbarkeit durch Provenienz

Eine klare und lückenlose Datenprovenienz ist fundamental für die Vertrauenswürdigkeit und Nachvollziehbarkeit von Daten und den daraus abgeleiteten Informationen und Entscheidungen.

  • Vertrauen und Datenqualität: Wenn du die Herkunft und den Verarbeitungsweg von Daten kennst, kannst du ihre Qualität, Genauigkeit und Verlässlichkeit besser einschätzen. Ein Finanzbericht ist beispielsweise vertrauenswürdiger, wenn klar dokumentiert ist, dass die zugrundeliegenden Zahlen direkt aus dem geprüften Buchhaltungssystem (Primärdatenquelle) stammen und welche Berechnungs- und Aggregationsschritte (Verarbeitung) für den Bericht durchgeführt wurden.
  • Nachvollziehbarkeit und Fehleranalyse: Bei unerwarteten Analyseergebnissen oder Fehlern ermöglicht die Provenienz, den Weg der Daten Schritt für Schritt zurückzuverfolgen und die Ursache zu finden. Wenn Sensordaten in einer Smart Factory plötzlich ungewöhnliche Werte für die Maschinenauslastung anzeigen, hilft die Provenienz festzustellen: Ist der Sensor selbst defekt? Gab es eine Störung im Netzwerk, das die Daten überträgt? Wurde eine Software zur Datenaggregation kürzlich fehlerhaft geändert?
  • Compliance und Rechenschaftspflicht: In vielen Bereichen, insbesondere beim Umgang mit personenbezogenen Daten gemäß der Datenschutz-Grundverordnung (DSGVO), ist die Dokumentation der Datenherkunft und -verarbeitung eine rechtliche Notwendigkeit. Unternehmen müssen beispielsweise nachweisen können, woher personenbezogene Daten stammen (z.B. Kontaktformular auf der Webseite, Einwilligung bei einem Messebesuch) und wie sie intern für welche Zwecke weiterverarbeitet wurden (z.B. Übertrag in das CRM-System, Nutzung für Newsletter-Versand nach expliziter Einwilligung).

Lernziele

  • den Begriff und die Bedeutung von Primärdaten erklären, indem die Entstehung von Primärdaten im Unterschied zu Sekundärdaten anhand von Beispielen wie Messwerten, Umfrageergebnissen oder Logfiles dargestellt und deren Rolle für die Datenqualität erläutert wird.
  • die Bedeutung der Datenherkunft (Provenienz) für die Vertrauenswürdigkeit und Nachvollziehbarkeit von Daten interpretieren, indem die Auswirkungen fehlender oder unklarer Herkunft auf Analyse, Compliance und Entscheidungsfindung anhand von Praxisbeispielen (z. B. Herkunft von Sensordaten in der Produktion, Quellenangaben in wissenschaftlichen Datenbanken) analysiert werden.

Genug gelesen? Zeit, es wirklich zu können!

Die Theorie aus diesem Artikel ist die perfekte Basis. In der asyoube Lernplattform wendest du dieses Wissen an, bekommst persönliches Feedback und bereitest dich interaktiv auf deine Ausbildung oder deine Prüfungen vor.

Für Ausbilder & Unternehmen

Möchten Sie Ihr gesamtes Team mit asyoube ausbilden? Entdecken Sie unsere B2B-Lösung mit einfacher Verwaltung, Fortschritts-Tracking für Ihre Azubis und attraktiven Team-Preisen.