- Datenbestände die Aufgrund des Umfangs, der Unterschiedlichkeit oder Schnelllebigkeit nur begrenzt mit bisherigen Datenbanken und Werkzeugen verarbeitete werden können
- Betrachtete werden eigentlich immer Querschnittliche Daten
- 4 (bzw. 8) V's sind typische Eigenschaft, für sich genommen aber noch nicht aussagekräftig
- BigData Analyses wollen üblicherweise Vorhersagen treffen
- Alle möglichen Daten werden erhoben, alle möglichen Modelle werden automatisch generiert (ohne viel Bereinigung), Auswahl des Aussagekäftigsten Modells
- Datenqualität ist nicht so wichtig, Korrelation ersetzt Kausalität
- Nicht Stichprobenartig erhoben, Anzahl der Datensätze möglichst hoch (nicht Zweckgebunden), Inhalt ggf. Unstrukturiert
Defintion nach Pusttchi:
Big Data ist die automatisierte Generierung und Auswertung quantitativ-empirischer Modelle auf sehr großen und zugleich querschnittlichen Datenmengen mit dem Ziel der Extrapolation