Zentrale Themen

Was macht Big Data so besonders?

Abstract

Big Data

Big Data vs. Small Data

„Small Data“ sind übersichtliche Datensätze, die in strukturierter Form vorliegen: zum Beispiel Tabellen oder Datenbanken auf einem Rechner. Bei Big Data können die Datensätze aus zahlreichen, unstrukturierten Quellen stammen und an verschiedenen Orten liegen. Häufig sind sie in einer Datencloud gespeichert.

Dabei müssen die Daten nicht einheitlich sortiert sein. Denn Computernetzwerke können auch mit Daten arbeiten, die nicht aufbereitet sind. Beim Bereinigen und Verknüpfen können KI-Methoden zum Einsatz kommen. Bei Small Data hingegen geht es um gut strukturierte Daten, die Menschen leicht verstehen können, etwa in Form einer Tabelle mit klaren Bezeichnungen. 

Image
Image
Grafik Klemmbrett vs. Festplatten

Unterscheiden lassen sich Small Data und Big Data auch anhand ihrer Zweckmäßigkeit: Small Data werden meist von vornherein für einen bestimmten Zweck erhoben. Bei Big Data werden oft alle verfügbaren Daten gesammelt und erst danach überlegt man, was man damit tun könnte.

Einfach gesagt: Small Data ist wie Einkaufen genau nach der Zutatenliste für ein bestimmtes Rezept. Big Data sind wie Hamsterkäufe. Ferner handelt es sich bei Small Data oft um eine Momentaufnahme, während es bei Big Data mehr um eine kontinuierliche Datensammlung geht. 

Aufgabe

Description

Welche Aspekte gehören zu Small Data, welche zu Big Data? Ordne zu.

Interactive tasks

Wie wird Big Data verarbeitet?

Bei manchen Prozessen fallen riesige Datenmengen an. Deshalb wird vorab entschieden, welche Daten überhaupt gespeichert werden. Nach Bedarf werden für diese Vorab-Auswertung bzw. Datenfusion Rechnercluster eingesetzt.

Diese Cluster aus vielen Rechnern haben einen unschlagbaren Vorteil: Sie bewältigen viel Arbeit quasi in Echtzeit. Zudem sorgen sie dafür, dass die großen Datenmengen aus verschiedenen Quellen vereinheitlicht werden. Nur so ist gewährleistet, dass die Erkenntnisse aus den Daten verlässlich sind.  

Image
Image
Symbolisierte Rechner

Der zweite Schritt ist die eigentliche Auswertung der Daten. So lassen sich mit einer großen Datenmenge verschiedene Fälle durchspielen, also „Was wäre, wenn”-Berechnungen vornehmen. Mithilfe von Big Data kann ein Unternehmen mit sehr vielen Fällen gleichzeitig arbeiten und zusätzlich externe Daten hinzuziehen.

Auf diese Weise lässt sich beispielsweise vorhersagen, wie Kund*innen auf neue Produkte reagieren. Auf Basis der Erkenntnisse trifft ein Unternehmen dann Entscheidungen. Die Ergebnisse der komplexen Berechnungen werden oft in sogenannten Dashboards angezeigt. Damit können viele Zahlen in Echtzeit grafisch dargestellt werden, sodass alle für eine Entscheidung wichtigen Werte im Auge behalten werden können.

Aufgabe

Description

Was sind die einzelnen Schritte bei der Big-Data-Verarbeitung?

Bring die Begriffe in die richtige Reihenfolge.

Interactive tasks