Spielt Big Data immer noch eine Rolle?

Eine Big Data-Definition für eine neue Ära

Mit fortschreitender Technologie und weiterentwickeltem Business Intelligence ändert sich auch die Definition von Big Data. Die jeweils gültige Definition hängt davon ab, wie ein Unternehmen es verwendet. In jedem Fall muss Big Data spezifische Geschäftsziele, das Kundenverhalten sowie langfristige Markttrends berücksichtigen.

Was ist Big Data? Big Data Definition

Die Anfänge von "Big Data"

Die erste Erwähnung des Begriffs "Big Data" fiel vor über zwei Jahrzehnten in der Bibliothek der Association for Computer Machinery (ACM). Michael Cox und David Ellsworth schrieben: "Visualisierung stellt eine interessante Herausforderung für Computersysteme dar: Datensätze sind im Allgemeinen ziemlich groß und belasten die Kapazitäten des Hauptspeichers, der lokalen Festplatte und sogar der Remote-Festplatte. Wir nennen es das Big Data-Problem. Wenn Datensätze weder auf die lokale Festplatte noch in den Hauptspeicher (im Core) passen, erwirbt man in der Regel einfach mehr Ressourcen." Mit anderen Worten, zu dieser Zeit lautete die Definition von Big Data im Wesentlichen "Daten, die nicht mehr auf die verfügbare Hardware passen".

Was ist Big Data heute?

Zwei Jahrzehnten später - nach dem Siegeszug des Internets, von Smartphones, dem Internet of Things sowie von Cloud Computing - hat sich die Big Data-Definition weit über die Grenzen einer "lokalen Festplatte" hinaus erweitert.

Die Big Data Definition von Wikipedia bezeichnet "ein Feld, das Möglichkeiten zur Analyse, systematischen Extraktion von Informationen oder anderweitigem Umgang mit Datensätzen behandelt, die zu groß oder komplex sind, um von herkömmlicher datenverarbeitender Anwendungssoftware verarbeitet zu werden". Einige Experten definieren Big Data mit den "vier Vs": Volumen, die Menge der produzierten Informationen; Vielfalt, die Vielfalt der Daten; Velocity (Geschwindigkeit), die Zeitspanne, in der Daten erstellt werden; und Veracity (Wahrhaftigkeit), die Integrität und Genauigkeit der Daten, die Sie erstellen und sammeln.

Aber für viele sind diese Definitionen nicht präzise genug. Geben Sie den Satz "Was ist Big Data" in Quora oder Google ein, Sie werden eine Vielzahl von Antworten finden. Schlaue könnten nun fragen: "Wie groß müssen Daten sein, um "groß" zu sein?" "Wenn 'Big Data' Daten sind, die mit den typischen Tools nicht gehandhabt werden können, welche Tools gelten dann als 'typisch'?" OK, selbst wenn wir Big Data richtig definieren - kann die Anhäufung riesiger Sammlungen an Datensätzen das richtige Ziel für heutige Unternehmen sein?

Eine neue Big Data-Definition

Im Jahr 2015 schrieb Gartner-Analyst Nick Heudecker, dass Big Data "kein Thema mehr an und für sich ist". Stattdessen könnte der Begriff nun in mehrere andere Termini aufgeteilt werden, darunter Advanced Analytics und Data Science, Business Intelligence, Enterprise Information-Management und mehr. Er schrieb: "Die Eigenschaften, die Big Data definiert haben ... sind nicht mehr exotisch. Sie sind alltäglich geworden. Die Technologielandschaft verändert sich weiterhin rasant, aber neue Optionen sehen zunehmend wie alte Optionen aus, und alte Optionen entwickeln sich schnell weiter." Ein vernünftiger Ansatz, so Heudecker, besteht darin, weniger über das "Tun" von Big Data nachzudenken als über "tatsächliche Geschäftsanforderungen, Auswirkungen auf die Infrastruktur und wie sich Ihre Unternehmensarchitekturen weiterentwickeln müssen".

Für Teradata war dies ein hilfreicher Rahmen, da wir Unternehmen dabei helfen, greifbare Ergebnisse aus Daten zu ziehen. Wir hielten es für das Beste, Big Data in Bezug zu wertschöpfenden Maßnahmen zu setzen, um Unternehmen tatsächlich voranzubringen. Zu oft wenden Unternehmen zu viel Zeit, Mühe und Geld für die Vorbereitung und das Laden von Big Data auf und nicht annähernd genug für Analysen, um unterschiedliche Erkenntnisse zu gewinnen.

Big Data ist nicht bloß ein Ansatz oder Werkzeug – zum Beispiel werden einmal Visualisierungen benötigt, ein anderes Mal vernetzte Analysen. Bei Big Data kommt es vorrangig auf die geschäftlichen Probleme und Ziele an. Suchen Benutzer…

  • …zeitliche Muster oder geografische Ansichten von Marktdaten?

  • …verfahrenstechnische Erkenntnisse aus Maschinenprotokollen oder Sensordaten?

  • …Korrelationen von Verhaltensmustern für ein einzelnes, eventuell noch zu lancierendes Produkt oder gar mehrere?

Bei Big Data geht es oft um Vorhersagefähigkeiten und Empfehlungs-Engines. Es geht aber auch um operatives Handeln, das vom Markt bestimmt wird. Und um tieferes Verständnis der Struktur und Natur von Beziehungen zwischen Menschen und Prozessen sowie Definitionen von Mustern, die zu benutzerdefinierten Ergebnissen führen.

Am Ende kommt es bei der Definition von Big Data darauf an, wie ein bestimmtes Unternehmen es nutzt. Experten debattieren darüber, ob sich Unternehmen auf Datenminimierung und Smart Data anstelle von Big Data konzentrieren sollten. In der Zwischenzeit werden die Unternehmen, die sich auf die Nutzung von Daten konzentrieren, erfolgreich sein. Damit Big Data funktioniert, bedarf es eines strategischen Designs und einer durchdachten Architektur, die nicht nur aktuelle Datenströme und Repositories untersucht, sondern auch spezifische Geschäftsziele, das Kundenverhalten und längerfristige Markttrends berücksichtigt.

Sind Sie neugierig, wie Teradata Ihnen helfen kann, Daten effektiv zu nutzen?