NVIDIA zapowiadana RTX 5000! Oto wszystko, co wiemy o nowych kartach graficznych

Podczas trwającej w Los Angeles konferencji SIGGRAPH, NVIDIA postanowiła zaprezentować nowe karty graficzne. Oto wszystkie najważniejsze informacje dotyczące RTX 5000, RTX 4500 oraz RTX 4000.

Choć wszyscy zakładali, że prezentacji NVIDII skupi się na ogłoszonym niedawno dołączeniu do projektu openUSD, czy rozwiązaniach dla centrów obliczeniowych, to czekała nas miła niespodzianka. Jensen Huang zademonstrował nowe karty graficzne. Tak mowa o tytułowym RTX 5000, jednak nie jest to następna generacja kart GeForce skierowana dla graczy. Mowa o GPU przeznaczonym dla stacji roboczych, przystosowanym do szkolenia sztucznej inteligencji. Czemu jednak ta premiera jest taka ważna?

Trzy nowe RTX, ale dla stacji roboczych

Jak już wspominałem, zapowiedziane zostały aż trzy nowe karty graficzne. Wszystkie bazują na znanej z desktopowych odpowiedników architekturze Ada Lovalace i docelowo mają trafić do stacji roboczych. Przyjrzyjmy się specyfikacji nowych modeli.

Najmocniejszym jest RTX 5000, który wykorzystuje rdzeń AD102. Ten sam który znajdziemy choćby w RTX 4090 czy RTX 6000 także przeznaczonym dla stacji roboczych. Ten posiada 12800 jednostek cieniujących, zwane także rdzeniami CUDA, oraz aż 400 rdzeni Tensor czwartej generacji. To właśnie one w głównej mierze odpowiadają za wydajności w zadaniach polegających na szkoleniu modeli sztucznej inteligencji. Karta otrzymała również 32 GB pamięci GDDR6 z korekcją błędów ECC połączonej przez 256 bitową magistralę. Wydajność w przypadku obliczeń pojedynczej precyzji (FP32) ma wynosić zawrotne 65.3 TeraFlopów.

RTX 6000RTX 5000RTX 4500RTX 4000
ArchitekturaAda LovelaceAda LovelaceAda LovelaceAda Lovelace
RdzeńGA102GA102GA104GA104
Rdzenie CUDA181761280076806144
Rdzenie Tensor568400240192
Wydajność pojedynczej precyzji91,1 TFLOPS65,3 TFLOPS39,6 TFLOPS26,7 TFLOPS
Wydajność rdzeni RT210,6 TFLOPS151 TFLOPS96,6 TFLOPS44,3 TFLOPS
Wydajność rdzeni Tensor1457 TFLOPS1044,4 TFLOPS634 TFLOPS427,6 TFLOPS
Pamięć48 GB GDDR6 ECC32 GB GDDR6 ECC24 GB GDDR6 ECC20 GB GDDR6 ECC
Szyna pamięci384 bit256 bit192 bit160 bit
Przepustowość960 GB/s576 GB/s432 GB/s360 GB/s
TDP300 W250 W210 W130 W

RTX 4500 oraz RTX 4000 wykorzystują natomiast rdzenie AD104. Zostały odpowiednio wyposażone w 7680 badź 6144 rdzeni CUDA, oraz 240 bądź 192 Tensor. W ich przypadku również postawiono na moduły GDDR6 z korekcją błędów. Wydajniejszy RTX 4500 posiada 24 GB pamięci natomiast RTX 4000 “tylko” 20 GB. 

Ceny nowych RTX mogą szokować

Znamy już specyfikację nowych kart graficznych, przejdźmy do najważniejszej kwestii ich ceny. Cóż rozwiązania kierowane do stacji roboczych nigdy nie były tymi najtańszymi. Wynika to po części z konieczności stosowania modułów pamięci wyposażonych w sprzętową korekcję błędów (ECC). Kolejnym powodem po prostu jest brak konkurencji. NVIDIA od wielu lat promuje swoje rozwiązania dedykowane dla stacji roboczych czy dużych centrów szkoleniowych AI, stając się największym dostawcą dedykowanych rozwiązań.

RTX 60006800 dolarów
RTX 50004000 dolarów
RTX 45002250 dolarów
RTX 40001250 dolarów

Cóż nowe RTX dla stacji roboczych nie będą wyjątkiem. RTX 5000 został wyceniony na 4000 dolarów, co po przeliczeniu i dodaniu podatków przełoży się w naszym kraju na niemal 18 tys. złotych. Mowa tu o cenie za jedną kartę, a przecież w pojedynczej stacji roboczej mogą zostać umieszczone nawet cztery takie układy! Również RTX 4500 oraz RTX 4000 nie będą wiele tańsze. Mówimy tu o 2250 oraz 1250 dolarach.

Jak zdominować rynek rozwiązań AI?

Cała prezentacji NVIDII podczas konferencji SIGGRAPH, dotyczyła rozwiązań powiązanych ze sztuczną inteligencją. I nie ma co się dziwić, biorąc pod uwagę dla kogo kierowana jest wspomniane konferencja. Organizacja SIGGRAPH od lat skupia wokół siebie twórców i artystów. A przecież Ci ostatnio coraz częściej sięgają po narzędzie bazujące na sztucznej inteligencji. Nvidia jako czołowy dostawca, rozwiązań dedykowanych szkoleniu AI, wykorzystuje okazje do promowania swoich technologii.

Nie ma zatem się co dziwić, że dużą część prezentacji poświęcono również omówieniu nowej platformy obliczeniowej wykorzystującej układy Grace Hopper. Nowa wersja GH200 otrzymała zgodnie z przypuszczeniami pamięć HBM3e. Jest to pierwszy na świecie układ wyposażony w te szybkie moduły. Dzięki temu zyskano nawet 50% lepszą przepustowość, w porównaniu z wariantem wykorzystującym standardowe kości HBM3. Dzięki temu sam pojedynczy rdzeń GPU ma osiągać wydajności aż 4 Petaflopów na sekundę. Podobnie jak w przypadku kart dla stacji roboczych konfiguracja serwera może składać się z wielu kart ukłądów Hooper, które dodatkowo jeszcze możemy łączyć w klastry superkomputera gotowego do szkolenia skomplikowanych modeli AI.

Konsekwencje dla rynku

Jak już pisałem w czerwcu w osobnym artykule, nie możemy oczekiwać obniżek cen kart graficznych. Prezentacja NVIDII dobitnie nam to udowadnia. Zauważcie, że od RTX 4070, w obu wariantach mówi się, że te nie sprzedają się zgodnie z oczekiwaniami NVIDII. Miało dojść do sytuacji gdzie zieloni ograniczają produkcję tych modeli. Nie oznacza to, jednak że całkowicie zrezygnowali z produkowania ich rdzeni. 

RTX 4070 TiRTX 4500RTX 4070RTX 4000
RdzeńAD104AD104AD104AD104
Rdzenie CUDA7680768058886144
Rdzenie Tensor240240184192
Wydajność pojedynczej precyzji40.09 TFLOP39,6 TFLOPS29.15 TFLOPS26,7 TFLOPS
Pamięć12 GB GDDR6X24 GB GDDR612 GB GDDR6X20 GB GDDR6
Cena799 dolarów2250 dolarów599 dolarów1250 dolarów

Czy zauważyliście podobieństwo RTX 4500 oraz RTX 4070 Ti? Obie karty bazują na tym samym rdzeniu AD104, posiadają tę samą ilość rdzeni CUDA i TENSOR. Oczywiście różnią się konfiguracją pamięci oraz co najważniejsze ceną. Karta dedykowana graczom jest wyceniana na 799 dolarów, natomiast jej odpowiednik przeznaczony dla stacji roboczych jak już pisałem 2250 dolarów. Jest to niemal trzy razy wyższa cena przy niemal identycznych kosztach produkcji. Każda karta produkcji NVIDII przeznaczona dla stancji roboczych jest kilkukrotnie droższa od swojego gamingowego odpowiednika. Nie ma co się zatem dziwić, że “zieloni” wolą się skupić na tym rynku, który przynosi im większy zysk. Trudno też odpowiedzieć czy nie doprowadzi to do kolejnego kryzysu i problemów z dostępnością kart graficznych przeznaczonych dla nie dla rozwiązań profesjonalnych.

Zagadka brakujących modeli GeForce Ti rozwiązana

Już od premiery RTX 4090 czy 4080 wspominało się o możliwości wprowadzenia modeli TI. Zresztą w przypadku serii “80” jednostki te towarzyszą nam niemal od 10 lat. Jednak wszystko wskazuje na to, że w przypadku kart opartych na rdzeniach Ada Lovelace modeli TI nie otrzymamy

Powód jest ten sam co w przypadku omawianym powyżej. Obecnie RTX 4090 nie ma dla siebie konkurencji ze strony AMD. Nie ma co się dziwić, że NVIDIA woli przeznaczań pełne rdzenie AD102 dla RTX 6000. Na każdej tej karcie zarabia przecież ponad 4 razy więcej. Możemy też przypuszczać, że układ, który miałby trafić do GeForca RTX 4080 TI napędza właśnie RTX 5000.

Prezentacja NVIDII poniekąd potwierdziła moje wcześniejsze przypuszczenie. Firma mocno stawia na rozwój swoich rozwiązań AI, nie chcąc stracić pozycji lidera. I choć zaprezentowane technologie oraz rozwiązania są imponujące, to wzbudzają pewien niepokój. Czy idąc za zyskiem, NVIDIA nie zrezygnuje całkowicie z rozwiązań dla zwykłych użytkowników?