reklama

Architektura Vera Rubin ma szansę zrewolucjonizować przetwarzanie kontekstu w systemach AI. Koszt tego postępu może jednak okazać się dotkliwy dla całego rynku pamięci masowych. Z najnowszych analiz wynika, że apetyt NVIDII na pamięć NAND,  wynikający z nowego podejścia do zarządzania kontekstem, może w najbliższych latach zachwiać globalnym łańcuchem dostaw. Tymczasem Jensen Huang otwarcie bagatelizuje głosy ostrzegające przed niekontrolowanym rozwojem AI, nazywając je „sianiem paniki”.

ICMS: Odciążenie HBM kosztem SSD

Kluczowym wyzwaniem w rozwoju Agentic AI przestaje być sama moc obliczeniowa, a staje się efektywne zarządzanie pamięcią. Generowanie i utrzymywanie ogromnych logów kontekstowych (KV Cache) przy architekturze opartej głównie na HBM jest dziś zarówno kosztowne, jak i trudne do skalowania.

Odpowiedzią NVIDII w platformie Vera Rubin jest technologia ICMS (Inference Memory Context Storage). Przy wsparciu jednostek DPU BlueField-4 pozwala ona przenieść ciężar składowania kontekstu z deficytowych i drogich modułów HBM na wyspecjalizowane podsystemy SSD.

reklama

Skala problemu – 115 eksabajtów popytu

Z perspektywy inżynierskiej to logiczny krok, jednak skala zapotrzebowania na pamięć flash, jaką wygeneruje to rozwiązanie, jest bezprecedensowa. Według analizy Citi, pojedynczy system w konfiguracji NVL72 może wymagać implementacji aż 1152 TB pamięci NAND (zakładając około 16 TB na każdy układ GPU w szafie). 

Jeśli prognozy dotyczące skali wdrożeń się potwierdzą platform Vera Rubin na poziomie 100 tysięcy jednostek w 2027 roku, zapotrzebowanie samej NVIDII może sięgnąć 115,2 miliona TB. To oznacza, że jedna firma może zaabsorbować blisko 9,3% globalnego popytu na pamięć NAND, co niemal na pewno doprowadzi do szoku podażowego, którego branża jeszcze nie uwzględniła w swoich kalkulacjach.

Jensen Huang kontra „siewcy paniki”

W obliczu tak agresywnej ekspansji sprzętowej, CEO NVIDII, Jensen Huang, zdecydowanie odrzuca narrację o zagrożeniach płynących z rozwoju AI. W niedawnym wywiadzie określił on tzw. „doomer narrative” (narrację katastroficzną) mianem „niezwykle krzywdzącej” i szkodliwej dla społeczeństwa oraz branży. Huang sugeruje wprost, że osoby nawołujące do ścisłych regulacji, w tym prawdopodobnie konkurenci tacy jak CEO Anthropic, Dario Amodei, są „głęboko skonfliktowani wewnętrznie”, a ich intencje niekoniecznie służą interesom społecznym. Według szefa NVIDII, próby spowalniania branży są bezzasadne, a technologia jest z powodzeniem wykorzystywana do poprawy funkcjonalności AI, w tym jej rozumowania.

NVIDIA coraz wyraźniej zaczyna dyktować warunki nie tylko na rynku akceleratorów AI, ale również, pośrednio w segmencie storage. Jeśli scenariusz Vera Rubin się zmaterializuje, dostępność i ceny dysków SSD mogą stać się kolejnym wąskim gardłem dla firm modernizujących centra danych. Planowanie infrastruktury pod AI przestaje być wyłącznie problemem mocy obliczeniowej, a staje się grą o pamięć i jej dostępność.

Share.

Cześć! W redakcji 3D-Info będę odpowiadał za większość testów podzespołów komputerowych m.in: procesorów, płyt głównych, kart graficznych, ale także urządzeń sieciowych. Możecie spodziewać się również licznych tekstów okołosprzętowych, omówień bieżących wydarzeń i premier, rankingów czy porównań. Z góry przepraszam za mocno techniczny język. Jestem typowym geekiem komputerowym, który uwielbia zagłębiać się w szczegółach budowy podzespołów. Uwielbiam spędzać godziny na testach, a okno 3DMarka znam już chyba na pamięć. Lubię też wyszukiwać promocje na te najważniejsze i najdroższe komponenty komputerowe. I choć nie mam wieloletniego doświadczenia dziennikarskiego, mam nadzieję, że 3D-info to kolejny etap mojego rozwoju zawodowego.   Swoją przygodę z dziennikarstwem zaczynałem na 3D-Info niemal 10 lat temu. Jednak wtedy nie był to portal technologiczny, a bardziej blog teamu overclokingowego. Nasze wpisy skupiały się na raportowaniu naszych osiągnięć, czy podsumowania zawodów, w których braliśmy udział. Niestety, nie przetrwaliśmy próby czasu, a ekipa rozeszła się do „normalnej” pracy. Sam przez lata pracowałem w kilku sklepach ze sprzętem RTV i AGD. Mój powrót do dziennikarstwa nastąpił w 2019 roku, w sumie to z przypadku, na łamach portalu PCWorld.pl. Zaczynałem skromnie od pojedynczych testów pamięci RAM czy dysków. To opór Piotrka Opulskiego, naszego wydawcy spowodował, że zdecydowałem się w 2021 całkowicie zmienić swoją drogę kariery zawodowej i zostałem redaktorem na stałe.   Nie będzie raczej niespodzianką, jak powiem, że mimo upływu lat moje zamiłowanie do podkręcania nie ustąpiło. Obecnie pomału wracam do świata ekstremalnego overclockingu, by jeszcze bardziej poszerzyć swoją wiedzę technologiczną. Idealne popołudnie dla mnie to dewar pełen ciekłego azotu i odpalone na komputerze liczne benchmarki.

Exit mobile version