Die Rolle, die Speicherung im AI-Datenzyklus spielt.

Da die künstliche Intelligenz (KI)-Branche weiter wächst, erfordert sie den Aufbau einer robusten Infrastruktur zur Schulung von Modellen und Bereitstellung von Diensten – was sich erheblich auf die Daten- und Speicherverwaltung auswirkt. Dies hat bedeutende Auswirkungen auf die Menge der generierten Daten und vor allem darauf, wie und wo diese Erkenntnisse gespeichert werden sollen.

Die Fähigkeit, diese Daten effizient zu verwalten, wird immer wichtiger, da die Datenerfordernisse aufgrund des kontinuierlichen Wachstums und der Entwicklung von KI-Tools exponentiell zunehmen. Daher muss die Speicherinfrastruktur, die diese Systeme unterstützt, in der Lage sein, parallel zu den schnellen Fortschritten in KI-Anwendungen und -Fähigkeiten zu skalieren.

Mit KI, die neue Daten erstellt und bestehende Daten noch wertvoller macht, entsteht schnell ein Zyklus, in dem eine erhöhte Datenerzeugung zu erweiterten Speicherbedürfnissen führt. Dies treibt die weitere Datenerzeugung an – und bildet einen „glücklichen KI-Datenzyklus“, der die KI-Entwicklung vorantreibt. Um das volle Potenzial von KI auszuschöpfen, müssen Organisationen nicht nur diesen Zyklus erfassen, sondern auch die Auswirkungen auf Infrastruktur und Ressourcenmanagement vollständig verstehen.

Peter Hayles

Soziale Links Navigation

Peter Hayles, Produktmarketingmanager HDD, Western Digital.

Ein sechsstufiger KI-Datenzyklus

Der KI-Datenzyklus besteht aus einem sechsstufigen Rahmen, der entworfen wurde, um die Datenverarbeitung und -speicherung zu optimieren. Die erste Stufe konzentriert sich auf die Sammlung vorhandener Rohdaten und Speicherung. Daten werden hier aus verschiedenen Quellen gesammelt und gespeichert, und die Analyse der Qualität und Vielfalt der gesammelten Daten ist entscheidend – sie bildet die Grundlage für die nächsten Stufen. Für diese Phase des Zyklus werden Enterprise-Festplattenlaufwerke (eHDDs) mit hoher Kapazität empfohlen, da sie die höchste Kapazität pro Laufwerk und den niedrigsten Kosten pro Bit bieten.

LESEN  Erreichen ländlicher Wähler in North Carolina nach dem Hurrikan Helene

Die nächste Stufe ist die Vorbereitung der Daten für die Aufnahme und die Auswertung der vorherigen Stufe, die für Trainingszwecke durchgeführt wird. Um diese Stufe zu unterstützen, setzen Rechenzentren auf aktualisierte Speicherinfrastrukturen – wie schnelle Datenseen – um Daten für die Vorbereitung und Aufnahme bereitzustellen. Hier sind hochkapazitive SSDs erforderlich, um vorhandenen HDD-Speicher zu optimieren oder neue All-Flash-Speichersysteme zu erstellen. Dies gewährleistet schnellen Zugriff auf organisierte und vorbereitete Daten.

Dann kommt die nächste Phase des Trainings von KI-Modellen, um genaue Prognosen mit Trainingsdaten zu erstellen. Diese Phase findet typischerweise auf Hochleistungs-Supercomputern statt – und erfordert spezifische und leistungsstarke Speicherlösungen, um so effektiv wie möglich zu arbeiten. Hier werden Hochbandbreiten-Flash-Speicher und leistungsstarke eSSDs mit geringer Latenz erstellt, um die spezifischen Anforderungen dieser Phase zu erfüllen und die erforderliche Geschwindigkeit und Präzision bereitzustellen.

Anschließend erfolgt nach dem Training die Inferenz- und Aufforderungsstufe, die sich auf die Erstellung einer benutzerfreundlichen Benutzeroberfläche für KI-Modelle konzentriert. Diese Phase umfasst die Verwendung einer Anwendungsprogrammschnittstelle (API), Dashboards und Tools, die Kontext zu bestimmten Daten mit Endbenutzeranfragen kombinieren. Dann können KI-Modelle in Internet- und Clientanwendungen integriert werden, ohne dass aktuelle Systeme ausgetauscht werden müssen. Dies bedeutet, dass die Aufrechterhaltung der aktuellen Systeme neben neuen KI-Berechnungen zusätzlichen Speicherplatz erfordern wird.

Hier sind größere und schnellere SSDs für KI-Upgrades in Computern unerlässlich, und höherkapazitive eingebettete Flash-Geräte werden für Smartphones und IoT-Systeme benötigt, um eine nahtlose Funktionalität in Echtzeitanwendungen aufrechtzuerhalten.

LESEN  Lage in Gaza ein "Horrorfilm", sagt norwegischer NGO-Leiter.

Die KI-Inferenzmaschinenstufe folgt, bei der trainierte Modelle in Produktionsumgebungen positioniert werden, um die Untersuchung neuer Daten durchzuführen, neuen Inhalt zu erstellen oder Echtzeitvorhersagen bereitzustellen. In dieser Phase ist die Effizienz der Maschine entscheidend für schnelle und genaue KI-Antworten. Daher ist eine umfassende Datenanalyse von erheblicher Speicherleistung erforderlich. Um diese Phase zu unterstützen, können hochkapazitive SSDs für das Streaming oder zur Modellierung von Daten in Inferenzservern je nach Skalierung oder Antwortzeit verwendet werden, während leistungsstarke SSDs für das Zwischenspeichern verwendet werden können.

Die letzte Stufe ist die Erstellung neuer Inhalte, wobei Erkenntnisse von KI-Modellen produziert und dann gespeichert werden. Diese Phase schließt den Datenzyklus ab, indem kontinuierlich der Datenwert für zukünftiges Modelltraining und Analyse verbessert wird. Der erzeugte Inhalt wird auf Enterprise-Festplatten für Archivzwecke im Rechenzentrum und sowohl auf hochkapazitiven SSDs als auch auf eingebetteten Flash-Geräten für KI-Edge-Geräte gespeichert, um für zukünftige Analysen bereit zu sein.

Ein selbsttragender Datenzyklus

Indem Unternehmen die sechs Stufen des KI-Datenzyklus vollständig verstehen und die richtigen Speicherwerkzeuge zur Unterstützung jeder Phase einsetzen, können sie die KI-Technologie effektiv aufrechterhalten, ihre internen Abläufe optimieren und die Vorteile ihrer KI-Investition maximieren.

Die heutigen KI-Anwendungen verwenden Daten, um Texte, Videos, Bilder und verschiedene andere Formen interessanter Inhalte zu produzieren. Diese kontinuierliche Schleife von Datenverbrauch und -erzeugung beschleunigt den Bedarf an leistungsstarken und skalierbaren Speichertechnologien zur Verwaltung großer KI-Datensätze und zur effizienten Umstrukturierung komplexer Daten, um weitere Innovationen voranzutreiben.

Die Nachfrage nach geeigneten Speicherlösungen wird im Laufe der Zeit deutlich steigen, da die Rolle von KI in den Betriebsabläufen immer präsenter und integraler wird. Dementsprechend werden der Zugang zu Daten, die Effizienz und Genauigkeit von KI-Modellen sowie größere, hochwertigere Datensätze zunehmend wichtig. Darüber hinaus können Partner und Kunden erwarten, dass Speicher-Komponentenhersteller ihre Produkte so anpassen, dass für jede Phase des KI-Datenzyklus eine geeignete Lösung vorhanden ist.

LESEN  Apotheker warnen vor 5 Hauterkrankungen - wie man sie erkennt

Wir haben den besten Datenwiederherstellungsdienst vorgestellt.

Dieser Artikel wurde im Rahmen des Expert Insights-Kanals von TechRadarPro produziert, in dem wir die besten und klügsten Köpfe der Technologiebranche von heute vorstellen. Die hier geäußerten Ansichten sind die des Autors und müssen nicht unbedingt die von TechRadarPro oder Future plc widerspiegeln. Wenn Sie interessiert sind, finden Sie hier weitere Informationen: https://www.techradar.com/news/submit-your-story-to-techradar-pro

Schreibe einen Kommentar