Was ist ein Datentyp?
In der Programmierung ist ein Datentyp eine Klassifizierung, die angibt, welche Art von Wert eine Variable hat und welche Art von mathematischen, relationalen oder logischen Operationen auf sie angewendet werden können, ohne einen Fehler zu verursachen.
Ein String ist zum Beispiel ein Daten-Typ, der zur Klassifizierung von Text verwendet wird, und ein Integer ist ein Datentyp, der zur Klassifizierung ganzer Zahlen verwendet wird.
Datentyp |
Nutzung / Anwendung |
Beispiel |
---|---|---|
String |
Alphanumerische Zeichen |
hello world, Alice, Bob123 Anzeige |
Integer |
Ganze Zahlen |
7, 12, 999 |
Float (floating point) |
Zahlen mit Dezimalstelle |
3.15, 9.06, 00.13 |
Character |
Numerische Kodierung von Text |
97 (in ASCII ist niedriger 97 als ‚a‘) |
Boolean |
Darstellung von logischen Werten |
TRUE, FALSE |
Der Datentyp legt fest, welche Operationen sicher durchgeführt werden können, um die Variable oder andere Daten zu erstellen, zu transformieren und in einer anderen Berechnung zu verwenden.
Wenn eine Programmiersprache vorschreibt, dass eine Variable nur unter Berücksichtigung ihres Daten-Typs verwendet werden darf, spricht man von einer starken Typisierung der Sprache. Dadurch werden Fehler vermieden, denn während es logisch ist, den Computer aufzufordern, eine Fließkommazahl mit einer Ganzzahl zu multiplizieren (1,5 x 5), ist es unlogisch, den Computer aufzufordern, eine Fließkommazahl mit einer Zeichenkette zu multiplizieren (1,5 x Alice).
Wenn eine Programmiersprache es zulässt, dass eine Variable eines Daten-Typs so verwendet wird, als wäre sie ein Wert eines anderen Datentyps, wird die Sprache als schwach typisiert bezeichnet.
Technisch gesehen ist das Konzept einer stark typisierten oder schwach typisierten Programmiersprache ein Trugschluss. In jeder Programmiersprache haben alle Werte einer Variablen einen statischen Typ – aber der Typ kann einer sein, dessen Werte in eine oder mehrere Klassen eingeteilt sind. Und während einige Klassen angeben, wie der Wert des Datentyps kompiliert oder interpretiert wird, gibt es andere Klassen, deren Werte erst zur Laufzeit mit ihrer Klasse gekennzeichnet werden.
Das Ausmaß, in dem eine Programmiersprache Typfehler entmutigt oder verhindert, wird als Typsicherheit bezeichnet.
Allgemeine Datentypen
Integer (int)
Dies ist der gebräuchlichste numerische Datentyp, der zum Speichern von Zahlen ohne Nachkommastellen (-707, 0, 707) verwendet wird.
Floating Point (Float)
Dies ist ebenfalls ein numerischer Datentyp, der zum Speichern von Zahlen verwendet wird, die eine gebrochene Komponente haben können, wie z. B. Geldwerte (707,07, 0,7, 707,00).
Bitte beachten Sie, dass number oft als Datentyp verwendet wird, der die beiden Typen int und float umfasst.
Character (char)
Er wird verwendet, um einen einzelnen Buchstaben, eine Ziffer, ein Satzzeichen, ein Symbol oder ein Leerzeichen zu speichern.
String (str oder text)
Dies ist eine Folge von Zeichen und der am häufigsten verwendete Datentyp zum Speichern von Text. Außerdem kann eine Zeichenkette auch Ziffern und Symbole enthalten, wird aber immer als Text behandelt.
Eine Telefonnummer wird in der Regel als String gespeichert (+49-123-356-789), kann aber auch als Ganzzahl (0123456789) gespeichert werden.
Boolean (bool)
Er steht für die Werte wahr und falsch. Bei der Arbeit mit dem booleschen Datentyp ist es hilfreich, sich vor Augen zu halten, dass ein boolescher Wert manchmal auch als 0 (für falsch) und 1 (für wahr) dargestellt wird.
Aufzählungstyp (enum)
Er enthält eine kleine Menge vordefinierter eindeutiger Werte (auch als Elemente oder Aufzählungszeichen bezeichnet), die verglichen und einer Variablen des Aufzählungsdatentyps zugewiesen werden können.
Die Werte eines Aufzählungstyps können textbasiert oder numerisch sein. Der boolesche Datentyp ist eine vordefinierte Aufzählung der Werte wahr und falsch.
Wenn z. B. Rock und Jazz die Aufzählungszeichen sind, kann einer Aufzählungsvariablen Genre einer der beiden Werte zugewiesen werden, aber nicht beide.
Angenommen, Sie werden aufgefordert, Ihre Präferenzen in einer Musik-App einzugeben und über ein Dropdown-Menü eines der beiden Genres auszuwählen, dann wird die Variable Genre entweder Rock oder Jazz speichern.
Bei Aufzählungstypen können Werte als numerische Indizes (0, 1, 2) oder als Strings gespeichert und abgerufen werden.
Array
Ein Array, auch als Liste bekannt, ist ein Datentyp, der eine Reihe von Elementen in einer bestimmten Reihenfolge speichert, die in der Regel alle vom gleichen Typ sind.
Da ein Array mehrere Elemente oder Werte speichert, wird die Struktur der in einem Array gespeicherten Daten als Array-Datenstruktur bezeichnet.
Jedes Element eines Arrays kann über einen ganzzahligen Index (0, 1, 2,…) abgerufen werden, und die Gesamtzahl der Elemente in einem Array stellt die Länge des Arrays dar.
Zum Beispiel kann eine Array-Variable Genre eines oder mehrere der Elemente Rock, Jazz und Blues speichern. Die Indizes der drei Werte sind 0 (Rock), 1 (Jazz) und 2 (Blues), und die Länge des Arrays ist 3 (da es drei Elemente enthält).
Um beim Beispiel der Musik-App zu bleiben: Wenn Sie aufgefordert werden, eines oder mehrere der drei Genres auszuwählen, und Ihnen alle drei gefallen (Prost!), speichert die Variable genre alle drei Elemente (rock, jazz, blues).
Datum
Muss nicht erklärt werden; speichert normalerweise ein Datum im Format JJJJ-MM-TT (ISO 8601-Syntax).
Uhrzeit
Speichert eine Uhrzeit im Format hh:mm:ss. Neben der Tageszeit kann auch die verstrichene Zeit oder das Zeitintervall zwischen zwei Ereignissen, das mehr als 24 Stunden betragen kann, gespeichert werden. Die Zeit, die seit einem Ereignis verstrichen ist, kann zum Beispiel 72+ Stunden (72:00:59) betragen.
Datetime
Speichert einen Wert, der sowohl Datum als auch Uhrzeit im Format JJJJ-MM-TT hh:mm:ss enthält.
Timestamp
Ein Zeitstempel (Timestamp) wird in der Regel in Unix-Zeit dargestellt und gibt die Anzahl der Sekunden an, die seit Mitternacht (00:00:00 UTC) am 1. Januar 1970 verstrichen sind.
Er wird in der Regel von Computersystemen verwendet, um das genaue Datum und die Uhrzeit eines Ereignisses bis auf die Anzahl der Sekunden in einem Format zu protokollieren, das von Zeitzonen nicht beeinflusst wird. Im Gegensatz zu datetime bleibt der Zeitstempel also unabhängig von Ihrem geografischen Standort gleich.
Beispiele für Datentypen
Verschiedene Programmiersprachen bieten verschiedene andere Datentypen für unterschiedliche Zwecke an, aber die am häufigsten verwendeten Datentypen, die Sie kennen müssen, um datenbasiert zu arbeiten, wurden bereits behandelt.
Eine gute Möglichkeit, über Datentypen nachzudenken, ist, wenn Sie auf ein Formular oder eine Umfrage stoßen.
Wenn Sie sich ein Standard-Anmeldeformular ansehen, sollten Sie daran denken, dass jedes Feld Werte eines bestimmten Datentyps annimmt.
Ein Textfeld speichert die Eingabe als Zeichenkette, während ein Zahlenfeld in der Regel eine ganze Zahl akzeptiert.
Namen und E-Mail-Adressen sind immer vom Typ String, während Zahlen als numerischer Typ oder als String gespeichert werden können, da ein String eine Menge von Zeichen einschließlich Ziffern ist.
In Feldern mit einer oder mehreren Optionen, bei denen aus vordefinierten Optionen ausgewählt werden muss, kommen die Datentypen Aufzählungstyp und Arrays ins Spiel.
Zeichenketten wie Passwörter sind immer gehasht oder verschlüsselt (oder sollten es zumindest sein).
Sehen wir uns nun die Bedeutung von Datentypen an.
Bedeutung der Datentypen
Sie fragen sich vielleicht, warum es wichtig ist, all diese Datentypen zu kennen, wenn es doch in erster Linie darum geht, zu verstehen, wie man Kundendaten nutzen kann. Dafür gibt es nur einen Hauptgrund – die Sammlung sauberer und konsistenter Daten.
Ihr Wissen über die Datentypen wird Ihnen in zwei Phasen Ihrer Datenerfassung nützlich sein, die im Folgenden beschrieben werden.
Datennutzung
Der Prozess der Verfolgung und Übermittlung von Daten an externe Tools und Systeme wird als Instrumentierung bezeichnet, und der allererste Schritt in diesem Prozess ist die Erstellung eines Datenverfolgungsplans. Alles, was Sie über einen Verfolgungsplan wissen müssen, wird in diesem Leitfaden behandelt.
Bei der Entscheidung, welche Ereignisse verfolgt werden sollen und welche Eigenschaften gesammelt werden sollen (sowohl Ereignis- als auch Entitätseigenschaften), macht die Angabe des Datentyps jeder Eigenschaft im Verfolgungsplan den Instrumentierungsprozess viel effizienter und lässt wenig Raum für Fehler.
Dies ist besonders hilfreich für Ingenieure, die mit der Implementierung betraut sind. Indem sichergestellt wird, dass jede Eigenschaft mit dem richtigen Datentyp gesendet wird, können Dateninkonsistenzen vermieden werden.
Datenerhebungen
Als datengesteuerter Fachmann werden Sie wahrscheinlich während der gesamten Customer Journey – vom Onboarding bis zur Abwanderung – Daten von Ihren Kunden über Umfragen sammeln.
Die Fragen, die Sie in einer Umfrage stellen, können offen sein (Text oder Zahlen) oder mit vordefinierten Auswahlmöglichkeiten wie einer Dropdown-Liste (enum), Kontrollkästchen (array), Optionsfeldern (boolean) oder sogar einem Schieberegler (depends) versehen sein.
Für jedes Feld in Ihrer Umfrage müssen Sie den Eigenschaftsnamen, der den Wert speichert (industry_name, job_role, cancellation_reason, is_satisfied, usw.) und den Datentyp (string, number, boolean, usw.) angeben.
Auf diese Weise können Sie die Datenkonsistenz wahren und die Analyse erleichtern. Denken Sie daran, dass offene Fragen die Analyse erschweren, da Sie die Antworten nicht zusammenfassen können, es sei denn, Sie analysieren automatisch jede Antwort und extrahieren den Text, der einer vorgegebenen Regel entspricht.
Bei vordefinierten Auswahlmöglichkeiten ist die Analyse einfach und wird auch dann nicht beeinträchtigt, wenn Sie die Auswahlmöglichkeiten zu einem späteren Zeitpunkt ändern (siehe Enum- und Array-Datentypen).
Fazit
Die Anwendung Ihres Wissens über Datentypen beschränkt sich nicht nur auf die Datenerfassung oder Instrumentierung; auch andere Aktivitäten wie die Datenintegration und die interne Anwendungsentwicklung (unter Verwendung von No-Code- oder Low-Code-Tools) dürften jetzt, da Sie die verschiedenen Datentypen kennen, viel einfacher werden.