Architektura Vera Rubin ma szansę zrewolucjonizować przetwarzanie kontekstu w systemach AI. Koszt tego postępu może jednak okazać się dotkliwy dla całego rynku pamięci masowych. Z najnowszych analiz wynika, że apetyt NVIDII na pamięć NAND, wynikający z nowego podejścia do zarządzania kontekstem, może w najbliższych latach zachwiać globalnym łańcuchem dostaw. Tymczasem Jensen Huang otwarcie bagatelizuje głosy ostrzegające przed niekontrolowanym rozwojem AI, nazywając je „sianiem paniki”.
ICMS: Odciążenie HBM kosztem SSD
Kluczowym wyzwaniem w rozwoju Agentic AI przestaje być sama moc obliczeniowa, a staje się efektywne zarządzanie pamięcią. Generowanie i utrzymywanie ogromnych logów kontekstowych (KV Cache) przy architekturze opartej głównie na HBM jest dziś zarówno kosztowne, jak i trudne do skalowania.
Odpowiedzią NVIDII w platformie Vera Rubin jest technologia ICMS (Inference Memory Context Storage). Przy wsparciu jednostek DPU BlueField-4 pozwala ona przenieść ciężar składowania kontekstu z deficytowych i drogich modułów HBM na wyspecjalizowane podsystemy SSD.
Skala problemu – 115 eksabajtów popytu
Z perspektywy inżynierskiej to logiczny krok, jednak skala zapotrzebowania na pamięć flash, jaką wygeneruje to rozwiązanie, jest bezprecedensowa. Według analizy Citi, pojedynczy system w konfiguracji NVL72 może wymagać implementacji aż 1152 TB pamięci NAND (zakładając około 16 TB na każdy układ GPU w szafie).
Jeśli prognozy dotyczące skali wdrożeń się potwierdzą platform Vera Rubin na poziomie 100 tysięcy jednostek w 2027 roku, zapotrzebowanie samej NVIDII może sięgnąć 115,2 miliona TB. To oznacza, że jedna firma może zaabsorbować blisko 9,3% globalnego popytu na pamięć NAND, co niemal na pewno doprowadzi do szoku podażowego, którego branża jeszcze nie uwzględniła w swoich kalkulacjach.
Jensen Huang kontra „siewcy paniki”
W obliczu tak agresywnej ekspansji sprzętowej, CEO NVIDII, Jensen Huang, zdecydowanie odrzuca narrację o zagrożeniach płynących z rozwoju AI. W niedawnym wywiadzie określił on tzw. „doomer narrative” (narrację katastroficzną) mianem „niezwykle krzywdzącej” i szkodliwej dla społeczeństwa oraz branży. Huang sugeruje wprost, że osoby nawołujące do ścisłych regulacji, w tym prawdopodobnie konkurenci tacy jak CEO Anthropic, Dario Amodei, są „głęboko skonfliktowani wewnętrznie”, a ich intencje niekoniecznie służą interesom społecznym. Według szefa NVIDII, próby spowalniania branży są bezzasadne, a technologia jest z powodzeniem wykorzystywana do poprawy funkcjonalności AI, w tym jej rozumowania.

NVIDIA coraz wyraźniej zaczyna dyktować warunki nie tylko na rynku akceleratorów AI, ale również, pośrednio w segmencie storage. Jeśli scenariusz Vera Rubin się zmaterializuje, dostępność i ceny dysków SSD mogą stać się kolejnym wąskim gardłem dla firm modernizujących centra danych. Planowanie infrastruktury pod AI przestaje być wyłącznie problemem mocy obliczeniowej, a staje się grą o pamięć i jej dostępność.

