Wenn Unternehmen eine Datendiät brauchen

By | January 23, 2024

Es kommt zu einer Datenüberflutung. Die Fülle moderner IT-Systeme, auf denen Unternehmensanwendungen mit Datendiensten laufen, die sich über die gesamte Breite der Cloud-Netzwerke auf dem Planeten erstrecken, führt dazu, dass das Datenwachstum in gewisser Weise außer Kontrolle geraten ist. Zwar verfügen wir über „Bewältigungsmechanismen“ in Form von Data Lakes (Informationsressourcen, die Ströme unstrukturierter Daten enthalten sollen, die wir zunächst nicht in einem umfassenden funktionalen Umfang verarbeiten oder nutzen können) und Data Warehouses (in denen wir a (Wenn wir ein gewisses Maß an Ordnung in unserem Speicher haben), leben wir immer noch in einer Welt der Datenflut.

Angesichts der zunehmenden Verbreitung von Large Language Models (LLMs), um den Anforderungen der generativen künstlichen Intelligenz gerecht zu werden, sind sich viele einig, dass sich die Datenüberflutung nun noch weiter verschärfen wird. Dank Richtlinien zu Datenschutz und -speicherung, Video-Streaming, Online-Gaming usw. sind die Datenmengen in den letzten Jahren sprunghaft angestiegen. Obwohl Cloud-basierte Speicherdienste zusammen mit lokalen Datenspeichern mittlerweile vergleichsweise günstig sind, benötigen Rechenzentren physischen Platz und viel Strom.

Ist es Zeit für eine Datendiät?

Der Datenschutz- und Wiederherstellungsanbieter Cohesity weist unter anderem auf die derzeitige Überfülle an Daten hin. Das Unternehmen hat Branchendaten zusammengestellt, die Probleme mit der Stromversorgung von Rechenzentren hervorheben und darauf hinweisen, dass die Effizienz nicht mit dem Datenwachstum Schritt halten kann, was an sich schon direkte Auswirkungen hat, es sei denn, Unternehmen beginnen, Daten zu verlieren. Einige Ihrer Daten verloren? Ja… vielleicht ist es an der Zeit, ein paar Kilo abzunehmen und eine Datendiät zu machen.

Das Internationale Büro für Maß und Gewicht ist die älteste internationale wissenschaftliche Einrichtung der Welt. Seit ihrer Gründung im Jahr 1875 hat die Organisation die Aufgabe, ein weltweit einheitliches Einheitensystem zu fördern. Auf seiner letzten alle vier Jahre stattfindenden Konferenz (Treffen alle vier Jahre, dies ist kein Ort für schnelle Lösungen oder übereilte Entscheidungen) mit Vertretern aus 62 Mitgliedstaaten erklärte der Ausschuss, dass er angesichts des rasanten Anstiegs der Datenmengen zwei neue Daten einführen sollte Einheiten zum ersten Mal seit 1991: Ronnabyte & Quettabyte und Ronnabyte.

Ein Ronnabyte hat 27 Nullen, ein Quettabyte sogar 30. Aufgeschrieben sieht letzteres so aus: 1.000.000.000.000.000.000.000.000.000.000.

Wenn wir ein Quettabyte in einem modernen Smartphone speichern wollten, bräuchten wir so viele Geräte, dass sie aneinandergereiht etwa 150 Millionen Kilometer lang wären. Cohesity weist darauf hin, dass dies in etwa der Entfernung der Erde von der Sonne entspricht. Das Unternehmen erinnert daran, dass der Grund für die gigantischen neuen Datenmengen das rasante Wachstum der globalen Datenmengen sei. Während Menschen weltweit im Jahr 2010 knapp zwei Zettabytes an Daten generierten, ist diese Zahl bis 2022 auf fast 104 Zettabytes angestiegen.

Umweltbelastung

„All dies deutet auf eine ‚große Menge‘ an Daten hin, daher der Vorschlag einer Datendiät“, sagte Mark Molyneux, Chief Technology Officer für EMEA bei Cohesity. „Mit diesem (zugegebenermaßen etwas frechen) Begriff meinen wir, dass Unternehmen moderne Datenklassifizierungs- und Anwendungsanalysetechniken nutzen sollten, um geschäftskritische Daten direkter von anderen Restinformationsströmen zu unterscheiden, die – obwohl sie immer noch Sicherheits- und Compliance-Maßnahmen unterliegen – sein können.“ aus dem Aufnahmestrom entfernt, dem sich ein Unternehmen öffnet. Mithilfe von Datenverwaltungsprozessen, die durch moderne künstliche Intelligenz (KI)-Engines ermöglicht werden, können wir jetzt handeln, bevor unsere Datenrückgrate bei einer Verschlechterung der Situation so etwas wie eine Magenbypass-Operation in Betracht ziehen müssen.“

Molyneux spricht von einer „immer schlimmeren Situation“ und zum jetzigen Zeitpunkt sind die Auswirkungen der Datenstreuung auf die Umwelt – zumindest vorerst – noch begrenzt. Nach Angaben der Internationalen Energieagentur hat sich das Datenvolumen in Rechenzentren zwischen 2015 und 2021 mehr als verdreifacht. Der Energieverbrauch von Rechenzentren ist jedoch nahezu konstant geblieben. Dies ist vor allem auf große Effizienzsteigerungen und die Umstellung auf modernere Hyperscale-Rechenzentren zurückzuführen.

„Rechenzentren sind effizienter geworden, haben aber fast das optimale Effizienzniveau erreicht, das sie erreichen können“, warnt Molyneux von Cohesity. „Die Effizienzsteigerungen sind nur noch marginal. Schätzungen gehen davon aus, dass die derzeitige Anzahl an Rechenzentren auf dem Planeten im Jahr 2030 mit den derzeitigen Formen der Energieerzeugung insgesamt 496 Millionen Tonnen Kohlendioxid produzieren wird. Das wäre mehr, als Frankreich im Jahr 2021 insgesamt emittiert hat.“ ”

KI ist eine große Parallelordnung

In Anlehnung an die Analogie des Unternehmens zum Kalorienzählen können wir durchaus davon ausgehen, dass die KI viele zusätzliche Daten zum Verbrauchsstapel hinzufügt. Eine Studie des Massachusetts Institute of Technology (MIT) aus dem Jahr 2019 kam zu dem Schluss, dass das Training neuronaler Netze im gesamten Lebenszyklus so viel Kohlendioxid produziert wie fünf Autos mit Verbrennungsmotor. Eine Studie von Google und der UC Berkeley aus dem Jahr 2021 ergab, dass das Training von GPT-3, dem KI-Modell hinter der Originalversion von ChatGPT, 1.287 Gigawattstunden verbrauchte und daher 502 Tonnen Kohlendioxid ausstieß. Dies entspräche dem Stromverbrauch von 120 amerikanischen Haushalten pro Jahr.

„Wir können unseren digitalen Fußabdruck kaum verwalten“, betont Molyneux. „Unternehmen sitzen oft auf einem riesigen Berg an „dunklen“ Daten und benötigen nicht mehr viel davon, löschen sie aber trotzdem nicht. Dies ist häufig auf eine mangelnde Klassifizierung der Daten zurückzuführen. Unternehmen wissen oft nicht einmal, welche Daten sich noch auf ihren Servern befinden. Der Begriff „Datendiät“ beschreibt eine Änderung der Einstellung, die Unternehmen annehmen können, um die Gesamtmenge der Daten, die sie speichern möchten, zu reduzieren. Dieser Wandel führt dazu, dass Unternehmen einen proaktiveren Ansatz bei der Indizierung, Klassifizierung und Sammlung von Daten über den gesamten Lebenszyklus der Datenverwaltung verfolgen. Es bedeutet auch, positive Schritte zu unternehmen, um die Datenspeicher-Workloads eines Unternehmens auf einer einzigen, gemeinsamen Plattform zu konsolidieren.“

Obwohl hier keine Atkins-Diät-Methodik angeboten wird, weist das Cohesity-Team auf einige bewährte Praktiken hin, die ihrer Meinung nach die Datendiät erleichtern können, von der sich Unternehmen täglich, wöchentlich und sogar jährlich ernähren.

Atkins für Daten?

Der oben erwähnte Prozess der möglichst genauen Indizierung von Daten über eine Datenverwaltungsplattform kann Unternehmen dabei helfen, Datenströme zu identifizieren, die veraltet, redundant, verwaist oder einfach veraltet sind. Im Einklang mit dieser Aktivität kann der Einsatz von Deduplizierungstools auf Datenplattformebene dazu beitragen, die Datenspeicherlast überraschend stark zu reduzieren, d. h. je nach „Art“ der betreffenden Daten um bis zu 97 Prozent. obwohl diese Zahl möglicherweise umstritten ist.

„Hier liegt eine entscheidende Effizienzchance, die Unternehmen branchenübergreifend nutzen können. Durch die Bereinigung des Datenspeichers einer Organisation erzielt das Unternehmen einen Sieg, der vier große „Lebensmittel“-Gruppen umfasst. Man kann sagen, dass dieser Ansatz a) den CO2-Fußabdruck eines Unternehmens durch die Verwendung genauerer Cloud-Ressourcen verringert, b) das Risiko von Rechtsstreitigkeiten im Zusammenhang mit veralteten personenbezogenen Daten (PII) in den Daten des Unternehmens verringert und c) Sicherstellen, dass der KI-Ansatz des Unternehmens auf den schlanksten und genauesten Informationsressourcen basiert, die sich über die gesamte Organisation erstrecken, und d) wahrscheinlich dazu beiträgt, dass das IT-Team Gewicht verliert, da es agiler wird und weniger von der nächtlichen Datenkonstruktion überwältigt wird, die in die Pizza zum Mitnehmen eingespeist wird.“ schloss Molyneux von Cohesity.

Die Datendiät mag eine interessante Idee sein, die lediglich dazu gedacht ist, uns zum Nachdenken über die Rationalisierung und Verwaltung von Informationen auf neue Weise anzuregen, und ja, es handelt sich um ein Konzept, das von einem Anbieter für Datenschutz und -wiederherstellung mit einer Prise Salz vorgeschlagen wurde. Überlegen Sie es sich noch einmal: Nehmen Sie es nicht mit zusätzlichem Salz ein, Ihre Natriumaufnahme ist bereits hoch genug und wir müssen mit unserem Würfelteller vorsichtiger sein.

Bitte ohne Salz würzen.

Leave a Reply

Your email address will not be published. Required fields are marked *