AI-United » Allgemein » Was ist Big Data: die Eigenschaften, die Klassifizierung, die Beispiele

Was ist Big Data: die Eigenschaften, die Klassifizierung, die Beispiele

Was ist Big Data

Was ist Big Data (Massendaten)? Im Oxford English Dictionary findet man Folgendes:

Die Daten stellen Kenngrößen, Zeichen oder Symbole dar, mit denen der Computer operiert, die in Form von elektrischen Signalen gespeichert und weitergeleitet, die auf optischen oder mechanischen Datenträgern gespeichert werden können.

Der Fachbegriff Big Data wird zur Beschreibung eines großen Datensatzes verwendet, der exponentiell wächst. Um solch eine Datenmenge zu verarbeiten, wird das maschinelle Lernen benötigt.

Die Vorteile von Massendaten:

  1. Das Datensammeln aus verschiedenen Quellen.
  2. Die Verbesserung von Geschäftsvorgängen durch die Analytik in Echtzeit.
  3. Die Aufbewahrung eines sehr großen Datenumfangs.
  4. Einsichten. Die Massendaten sind für die versteckte Information mit Hilfe von strukturierten und halbstrukturierten Daten durchdringender.
  5. Massendaten helfen dank der Risiko-Analytik das Risiko zu senken und richtige Entscheidungen zu treffen.

Beispiele von Massendaten

Die New York Stock Exchange generiert täglich 1 Terabyte Daten für jede Auktion.

Soziale Medien: 500 Terabyte neue Daten werden jeden Tag in die Datenbank von Facebook heruntergeladen, hauptsächlich durch das Herunterladen von Bildern und Videos, den Nachrichtenaustausch usw.

Ein Düsentriebwerk generiert alle 30 Minuten 10 Terabyte Daten während des Fluges. Der Datenumfang beträgt Petabyte, weil Tausende Flüge jeden Tag erfolgen.

Die Klassifizierung von Massendaten

Es gibt folgende Formen von Massendaten:

  • die strukturierte
  • die unstrukturierte
  • die halbstrukturierte

Die strukturierte Form

Strukturierte Daten sind Daten, die in der Form mit dem festen Format zugänglich sein, bewahrt und bearbeitet werden können. Die Computerwissenschaften haben beim Umgang mit diesem Typ von Daten große Erfolge erreicht. Doch heutzutage werden Probleme beobachtet, die mit dem Wachstum des Umfangs bis zu einigen Zettabyte verbunden sind.

1 Zettabyte beträgt eine Milliarde Terabyte

Die Bearbeitung und die Aufbewahrung von Big Data ist wirklich problematisch.

Die Daten, die in der Relationsdatenbasis bewahrt werden, sind strukturiert und haben, zum Beispiel, die Form einer Tabelle mit Mitarbeitern.

Die unstrukturierte Form

Unstrukturierte Daten weisen die unbekannte Struktur auf. Solche Form wird durch Schwierigkeiten beim Verarbeiten und der Extraktion von nützlicher Information gekennzeichnet. Ein Beispiel von unstrukturierten Daten ist die heterogene Quelle, die die Kombination von einfachen Textdateien, Bildern und Videos enthält. Heute haben Organisationen Zugang zu großen Volumen von unstrukturierten Daten, doch sie wissen nicht, wie sie aus ihnen Nutzen ziehen können.

Ein Beispiel dieser Kategorie von Big Data ist das Ergebnis der Google Suche:

Die halbstrukturierte Form

Diese Kategorie enthält beide oben beschriebenen Kategorien. Deshalb weisen halbstrukturierte Daten eine gewisse Form auf, aber sie werden mit Hilfe von Tabellen in den Relationsdatenbasen nicht bestimmt. Ein Beispiel dieser Kategorie sind persönliche Daten in der XML File.

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Die Eigenschaften von Big Data

Das Wachstum von Big Data mit der Zeit:

Die strukturierten Daten (Enterprise Data) sind mit blauer Farbe markiert, die in den Relationsdatenbasen bewahrt werden. Die unstrukturierten Daten aus verschiedenen Quellen (das Voice over IP, Soziale Netzwerke und Webapplikationen) sind mit einer anderen Farben markiert.

Die Massendaten unterscheiden sich durch den Umfang, die Schnelle des Generierens, die Vielfalt und die Unbeständigkeit.

  1. Der Umfang. Der Begriff Big Data bedeutet Daten von großem Umfang. Der Umfang der Daten ist der wichtigste Wert bei der Bestimmung der möglichen Wertigkeit. Jeden Tag benutzen 6 Millionen Menschen digitale Massenmedien, wobei nach vorläufigen Schätzungen 2.5 Trillion Datenbyte generiert werden.
  2. Die Vielfalt. Diese Eigenschaft nimmt Bezug auf heterogene Quellen und das Wesen von Daten, die sowohl strukturiert, als auch unstrukturiert sein können. Früher stellten Kalkulationstabellen und Datenbasen die einzige Informationsquelle dar, die in den meisten Applikationen behandelt wurden. Heutzutage werden Daten in Form von E-Mails, Bildern, Videos, PDF Files, Audios auch in analysenorientierten Applikationen berücksichtigt. Solch eine Vielfalt von unstrukturierten Daten bedingt Probleme beim Aufbewahren und der Analyse: 27% Unternehmen sind nicht sicher, dass sie mit geeigneten Daten arbeiten.
  3. Die Schnelle des Generierens. Die Schnelle des Generierens und der Bearbeitung von Daten bestimmt das Potenzial. Die Schnelle schätzt die Schnelle des Zuflusses der Information aus den Quellen — den Geschäftsvorgängen, Sozialen Netzwerken, Mobilgeräten. Der Datenstrom ist riesig und zeitlich-kontinuierlich.
  4. Die Unbeständigkeit beschreibt die Unbeständigkeit von Daten zu bestimmten Zeitpunkten, was die Datenverarbeitung und die Verwaltung erschwert. Die Mehrheit von Daten ist von Natur aus unstrukturiert.

Die Analytik von Big Data: die Vorteile von Massendaten

Die Einführung von Waren und Dienstleistungen: Der Zugriff zu Daten aus Suchmaschinen und Seiten, wie Facebook und Twitter, hilft den Unternehmen die Vermarktungsstrategien besser zu entwickeln.

Die Verbesserung des Services für Käufer: Traditionelle Rückmeldesysteme mit den Käufern werden durch neue ersetzt, wo Big Data und die linguistische Datenverarbeitung zum Lesen und Bewerten von Kundenbewertungen verwendet werden.

Die Risikoberechnung, was mit der Herstellung vom neuen Produkt oder Service verbunden ist.

Die Operationseffektivität: Die Massendaten werden strukturiert, damit man die Information und das genaue Ergebnis schneller erhalten kann. Die Technologien von Big Data helfen Unternehmen den Umgang mit der Information zu optimieren, die selten verwendet wird.

Quelle

AI-United-Redaktion

Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.