Was ist Datensammlung?
Datensammlung bezeichnet den Prozess der Datenerhebung für unternehmerische Entscheidungen, strategische Planung, Forschung und andere Zwecke. Sie ist ein entscheidender Bestandteil von Datenanalyse-Anwendungen und Forschungsprojekten. Effektive Datensammlung liefert die Informationen, die benötigt werden, um Fragen zu beantworten, die Leistung des Unternehmens oder andere Ergebnisse zu analysieren und zukünftige Trends, Handlungen und Szenarien vorherzusagen.
In Unternehmen werden Daten auf verschiedenen Ebenen gesammelt. IT-Systeme erfassen regelmäßig Informationen über Kunden, Mitarbeiter, Verkäufe und andere Aspekte des Geschäftsbetriebs, wenn Transaktionen verarbeitet und Daten eingegeben werden. Unternehmen führen außerdem Umfragen durch und verfolgen soziale Medien, um Feedback von Kunden zu erhalten. Datenwissenschaftler, Analysten und Unternehmensbenutzer sammeln relevante Daten aus internen und externen Quellen für die Analyse. Die Datenvorbereitung umfasst das Sammeln und Aufbereiten von Daten für die Verwendung in Business Intelligence (BI) und Analyseanwendungen.
In der Wissenschaft, Medizin, Hochschulbildung und anderen Bereichen ist die Datensammlung oft ein spezialisierter Prozess, bei dem Forscher Maßnahmen erstellen und umsetzen, um bestimmte Datensätze zu sammeln. Sowohl im Geschäftsbereich als auch in der Forschung müssen die gesammelten Daten jedoch genau sein, um sicherzustellen, dass Analyse- und Forschungsergebnisse gültig sind.
Methoden der Datensammlung
Um die gesuchten Informationen bereitzustellen, können Daten aus einer oder mehreren Quellen gesammelt werden. Ein Einzelhändler könnte beispielsweise Kundendaten aus Transaktionsaufzeichnungen, Website-Besuchen, mobilen Anwendungen, seinem Treueprogramm und einer Online-Umfrage sammeln, um Verkäufe und die Wirksamkeit seiner Marketingkampagnen zu analysieren.
Die Methoden zur Datensammlung variieren je nach Art der Anwendung. Es gibt sowohl technologische als auch manuelle Verfahren zur Datensammlung. Im Folgenden sind einige gängige Methoden aufgeführt:
- Automatisierte Datensammlungsfunktionen, die in Unternehmensanwendungen, Websites und mobilen Apps integriert sind
- Sensoren, die operationale Daten von Industrieanlagen, Fahrzeugen und anderen Maschinen sammeln
- Sammlung von Daten von Informationsdienstleistern und anderen externen Datenquellen
- Verfolgung sozialer Medien, Diskussionsforen, Bewertungsseiten, Blogs und anderer Online-Kanäle
- Umfragen, Fragebögen und Formulare, die online, persönlich oder telefonisch, per E-Mail oder auf dem Postweg durchgeführt werden
- Fokusgruppen und Einzelinterviews
- Direkte Beobachtung der Teilnehmer an einer Forschungsstudie
Explizite und Implizierte Methoden der Datensammlung
Die folgende Tabelle zeigt verschiedene Methoden zur Datensammlung von Kunden. Diese Methoden können in zwei Hauptkategorien eingeteilt werden: explizite Datensammlung, bei der Kunden ihre Informationen bewusst bereitstellen, und implizite Datensammlung, bei der Daten unbemerkt oder ohne direktes Einverständnis des Kunden gesammelt werden.
Explizite Methoden umfassen Kundenformulare, Treueprogramme, Umfragen, Servicevereinbarungen und Wettbewerbe, bei denen Kunden aktiv Informationen bereitstellen. Im Gegensatz dazu beinhalten implizite Methoden die Erfassung von Daten aus Transaktionsaufzeichnungen, Cookies, Website-Besuchen, sozialen Medien und Schlüsselwort-Trackern, ohne dass die Kunden unbedingt davon Kenntnis haben.
Diese Unterscheidung ist wichtig, um die verschiedenen Wege zu verstehen, wie Unternehmen Daten sammeln und nutzen, um ihre Produkte und Dienstleistungen anzupassen und zu verbessern.
KATEGORIE | DATENSAMMLUNGSMETHODEN |
---|---|
EXPLIZIT | Kundenformulare |
Treueprogramme | |
Umfragen | |
Servicevereinbarungen | |
Wettbewerbe | |
IMPLIZIT | Transaktionsaufzeichnungen |
Cookies | |
Website-Besuche | |
Soziale Medien | |
Schlüsselwort-Tracker |
Herausforderungen bei der Datensammlung
Rohdaten enthalten oft Fehler, Inkonsistenzen und andere Probleme. Es ist ideal, wenn Datensammlungsmaßnahmen so konzipiert sind, dass solche Probleme vermieden oder minimiert werden. In den meisten Fällen ist dies jedoch nicht narrensicher. Daher müssen gesammelte Daten in der Regel durch Datenprofilerstellung identifiziert und durch Datenbereinigung behoben werden.
Es ist wichtig, relevante Daten zu finden. Das Sammeln von Daten zur Analyse kann bei einer Vielzahl von Systemen, die navigiert werden müssen, eine komplizierte Aufgabe für Datenwissenschaftler und andere Benutzer in einer Organisation sein. Die Verwendung von Datenkuratierungstechniken erleichtert den Zugriff auf Daten. Dazu gehört beispielsweise die Erstellung eines Datenkatalogs und durchsuchbarer Indizes. Es ist wichtig, zu entscheiden, welche Daten gesammelt werden sollen.
Dies ist ein grundlegendes Problem bei der Sammlung von Rohdaten sowie bei der Datensammlung für Analyseanwendungen. Das Sammeln unnötiger Daten erhöht Zeit, Kosten und Komplexität des Prozesses. Das Auslassen nützlicher Daten kann jedoch den Geschäftswert eines Datensatzes begrenzen und Analyseergebnisse beeinflussen.
Big Data effektiv verwalten.
In Big-Data-Umgebungen, die oft eine Vielzahl von Datenarten wie strukturierte, unstrukturierte und halbstrukturierte Daten enthalten, wird die Komplexität der Datensammlungs- und Verarbeitungsprozesse noch verstärkt. Die Herausforderung besteht darin, diese verschiedenen Datenformate zu integrieren und zu harmonisieren, um einen konsistenten und aussagekräftigen Datensatz zu erhalten. Dies erfordert fortgeschrittene Datenmanagementtechniken und -werkzeuge, um die Daten effektiv zu erfassen, zu speichern und zu verarbeiten.
Darüber hinaus müssen Datenwissenschaftler in Big-Data oft mit großen Datensätzen arbeiten, die in Data Lakes gespeichert sind. Das Filtern und Aufbereiten dieser Daten für spezifische Analyseanwendungen erfordert komplexe Abfragen und Transformationen, um die relevanten Informationen herauszufiltern und sie für die Analyse zugänglich zu machen.
Im Bereich der Forschung können neben einer niedrigen Rücklaufquote auch andere Probleme auftreten, die die Qualität und Gültigkeit der gesammelten Daten beeinträchtigen können. Dazu gehören Schwierigkeiten bei der Rekrutierung von Teilnehmern, mangelnde Motivation zur Teilnahme an Studien und unzureichende Schulung des Personals für die Datensammlung. Um diesen Herausforderungen zu begegnen, ist es wichtig, umfassende Schulungsprogramme und Qualitätskontrollverfahren einzurichten, um sicherzustellen, dass die gesammelten Daten korrekt und zuverlässig sind.
Wichtigste Schritte bei der Datensammlung
Gut konzipierte Datensammlungsprozesse umfassen die folgenden Schritte:
Identifizieren eines unternehmerischen oder Forschungsproblems und Festlegen von Zielen für das Projekt, Sammeln von Datenanforderungen, Identifizieren der Datensätze, die die gewünschten Informationen liefern können, und Festlegen eines Plans zur Datensammlung einschließlich der verwendeten Sammelmethoden.
Es wird damit begonnen, verfügbare Daten zu sammeln und die Arbeit zur Vorbereitung der Analyse durchzuführen. Bei der Datensammlung sollten bewährte Verfahren angewendet werden. Es gibt zwei Hauptarten von Daten: quantitative Daten und qualitative Daten. Quantitative Daten sind numerisch, zum Beispiel Preise, Beträge, Statistiken und Prozentsätze. Qualitative Daten sind beschreibender Natur, zum Beispiel Farbe, Geruch, Aussehen und Meinung.
Organisationen nutzen Sekundärdaten aus externen Quellen, um Geschäftsentscheidungen zu unterstützen. Hersteller und Einzelhändler könnten US-Zensusdaten verwenden, um ihre Marketingstrategien und -kampagnen zu planen. Unternehmen könnten staatliche Gesundheitsstatistiken und externe Gesundheitsstudien nutzen, um ihre Krankenversicherungspläne zu analysieren und zu optimieren.
Die Datenschutz-Grundverordnung (DSGVO) der Europäischen Union und andere in den letzten Jahren erlassene Datenschutzgesetze haben dazu geführt, dass Datenschutz und -sicherheit bei der Datensammlung, insbesondere von personenbezogenen Informationen von Kunden, stärker berücksichtigt werden müssen. Das Datenverwaltungsprogramm einer Organisation sollte Richtlinien enthalten, um sicherzustellen, dass Datensammlungspraktiken im Einklang mit Gesetzen wie der DSGVO stehen.
Verfahren bei der Datensammlung
Es ist wichtig, sicherzustellen, dass die gesammelten Daten die spezifischen Anforderungen und Ziele eines Geschäftsprojekts oder Forschungsvorhabens erfüllen. Dazu bedarf es einer sorgfältigen Planung und Analyse, um die richtigen Datenquellen zu identifizieren und die erforderlichen Informationen zu extrahieren. Sowohl quantitative als auch qualitative Daten sollten berücksichtigt werden, um ein umfassendes Verständnis des Themas zu gewährleisten.
Die Genauigkeit der Daten ist von entscheidender Bedeutung. Fehlerhafte oder ungenaue Daten können zu falschen Schlussfolgerungen führen und die Effektivität der Analyse oder Forschungsergebnisse beeinträchtigen. Daher müssen während des gesamten Datenerfassungs- und -aufbereitungsprozesses geeignete Qualitätskontrollen implementiert werden, um sicherzustellen, dass die Daten korrekt sind und den höchsten Standards entsprechen.
Ein weiterer wichtiger Aspekt ist die Vermeidung der Erfassung irrelevanter Daten. Das Sammeln unnötiger Daten kann Zeit und Ressourcen verschwenden und die Analyseprozesse unnötig komplex machen. Durch eine klare Definition der Forschungsfragen oder Geschäftsziele können unnötige Datenquellen eliminiert und der Fokus auf die Erfassung relevanter Informationen gelegt werden. Eine effiziente Nutzung von Ressourcen verbessert die Qualität der Analyse- oder Forschungsergebnisse.