Re Rating Memory and Storage
Warum der aktuelle Memory-Aufschwung im KI-Bereich struktureller ist als frühere Zyklen
Der Bedarf an High-Bandwidth-Memory (HBM) und leistungsstarkem Speicher entwickelt sich derzeit anders als in früheren Aufschwungphasen der Halbleiterindustrie. Während frühere Zyklen stark vom Smartphone- und PC-Markt abhängig waren, entstehen heute mehrere Nachfragequellen gleichzeitig, die sich teilweise überlappen und langfristig wirken.
Die zentralen Nachfragetreiber
Im Data-Center-Bereich steigt der Bedarf durch das Training immer größerer Modelle sowie durch Inference.
Besonders relevant ist dabei Agentic AI. Im Gegensatz zu klassischen Chat-Modellen führen agentenbasierte Systeme mehrschrittige Aufgaben eigenständig aus, nutzen Tools, planen und müssen über längere Zeiträume hinweg Kontext und Zwischenzustände speichern.
Das führt zu einem deutlich höheren Bedarf an Speicherbandbreite und Kapazität. Analystenschätzungen, unter anderem von Goldman Sachs, gehen von einem sehr starken Anstieg des weltweiten Token-Verbrauchs in den kommenden Jahren aus – getrieben nicht nur durch mehr Nutzer, sondern vor allem durch komplexere, agentenartige Anwendungen.
Ein weiterer wachsender Bereich ist der Edge-Bereich, also Geräte, die KI direkt vor Ort ausführen. Dazu zählen AI-PCs, aber vor allem neue Anwendungsfelder wie autonome Systeme.
Robotaxi und humanoide Roboter als zusätzliche strukturelle Treiber
Bei Robotaxis ist der Speicherbedarf bereits heute hoch, da große Datenmengen von Sensoren und Kameras in Echtzeit verarbeitet werden müssen. Noch deutlicher wird der Bedarf jedoch bei humanoiden Robotern. Systeme wie Tesla Optimus oder vergleichbare Plattformen anderer Hersteller benötigen nicht nur hohe Rechenleistung, sondern auch erhebliche Mengen an Onboard-Memory.
Der Grund
Viele Funktionen – von der Echtzeit-Bildverarbeitung über die motorische Steuerung bis hin zur Planung und Interaktion mit der Umwelt – müssen mit geringer Latenz ablaufen. Eine zu starke Abhängigkeit von Cloud-Verbindungen wäre hier problematisch. Deshalb wird erwartet, dass humanoide Roboter in Zukunft vergleichsweise große Mengen an High-Bandwidth-Memory direkt an Bord benötigen. Dies stellt einen neuen, potenziell sehr großen Nachfragepool dar, der über die nächsten Jahre hinweg skalieren könnte.
Technologische Verstärker
Mehr Speicher pro Chip
Parallel dazu ermöglichen Fortschritte im Chip-Packaging, dass pro Prozessor deutlich mehr HBM-Stacks untergebracht werden können. Während aktuelle Generationen oft 8 bis 12 HBM-Stacks pro GPU unterstützen, sind für die Jahre 2028 und 2029 bereits Technologien in der Roadmap, die 16 bis 24 Stacks ermöglichen sollen. Dadurch steigt die Speicherkapazität pro einzelnem Chip spürbar – unabhängig davon, wie viele Chips insgesamt produziert werden.
Warum das den Zyklus verändert
Die Kombination aus mehreren gleichzeitig wachsenden Anwendungsfeldern (Data Center inklusive Agentic AI, Robotaxi, humanoide Roboter) und der Möglichkeit, pro Chip mehr Speicher zu verbauen, macht die Nachfrage breiter aufgestellt als in früheren Memory-Zyklen. Der klassische Smartphone-Markt war lange der dominante Volumentreiber, ist aber inzwischen ein reifer Markt mit relativ moderatem Speicherbedarf pro Gerät und typischen Austauschzyklen von drei bis vier Jahren.
Viele Marktbeobachter, darunter auch NVIDIA-CEO Jensen Huang, gehen deshalb davon aus, dass der aktuelle Engpass bei fortschrittlichem Speicher länger anhalten könnte. NVIDIA hat in den vergangenen Monaten mehrfach die enge Zusammenarbeit mit Memory-Herstellern wie SK Hynix betont und Kapazitäten für die kommenden Jahre abgesichert.
Ob und in welchem Ausmaß es mittelfristig zu einer Normalisierung kommt, hängt unter anderem davon ab, wie schnell neue Produktionskapazitäten bei den Memory-Herstellern hochgefahren werden können und wie stark die Nachfrage aus Robotik und agentenbasierten Systemen tatsächlich zunimmt.