
Podczas trwającej w Los Angeles konferencji SIGGRAPH, NVIDIA postanowiła zaprezentować nowe karty graficzne. Oto wszystkie najważniejsze informacje dotyczące RTX 5000, RTX 4500 oraz RTX 4000.
Choć wszyscy zakładali, że prezentacji NVIDII skupi się na ogłoszonym niedawno dołączeniu do projektu openUSD, czy rozwiązaniach dla centrów obliczeniowych, to czekała nas miła niespodzianka. Jensen Huang zademonstrował nowe karty graficzne. Tak mowa o tytułowym RTX 5000, jednak nie jest to następna generacja kart GeForce skierowana dla graczy. Mowa o GPU przeznaczonym dla stacji roboczych, przystosowanym do szkolenia sztucznej inteligencji. Czemu jednak ta premiera jest taka ważna?
Trzy nowe RTX, ale dla stacji roboczych
Jak już wspominałem, zapowiedziane zostały aż trzy nowe karty graficzne. Wszystkie bazują na znanej z desktopowych odpowiedników architekturze Ada Lovalace i docelowo mają trafić do stacji roboczych. Przyjrzyjmy się specyfikacji nowych modeli.

Najmocniejszym jest RTX 5000, który wykorzystuje rdzeń AD102. Ten sam który znajdziemy choćby w RTX 4090 czy RTX 6000 także przeznaczonym dla stacji roboczych. Ten posiada 12800 jednostek cieniujących, zwane także rdzeniami CUDA, oraz aż 400 rdzeni Tensor czwartej generacji. To właśnie one w głównej mierze odpowiadają za wydajności w zadaniach polegających na szkoleniu modeli sztucznej inteligencji. Karta otrzymała również 32 GB pamięci GDDR6 z korekcją błędów ECC połączonej przez 256 bitową magistralę. Wydajność w przypadku obliczeń pojedynczej precyzji (FP32) ma wynosić zawrotne 65.3 TeraFlopów.
RTX 6000 | RTX 5000 | RTX 4500 | RTX 4000 | |
Architektura | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace |
Rdzeń | GA102 | GA102 | GA104 | GA104 |
Rdzenie CUDA | 18176 | 12800 | 7680 | 6144 |
Rdzenie Tensor | 568 | 400 | 240 | 192 |
Wydajność pojedynczej precyzji | 91,1 TFLOPS | 65,3 TFLOPS | 39,6 TFLOPS | 26,7 TFLOPS |
Wydajność rdzeni RT | 210,6 TFLOPS | 151 TFLOPS | 96,6 TFLOPS | 44,3 TFLOPS |
Wydajność rdzeni Tensor | 1457 TFLOPS | 1044,4 TFLOPS | 634 TFLOPS | 427,6 TFLOPS |
Pamięć | 48 GB GDDR6 ECC | 32 GB GDDR6 ECC | 24 GB GDDR6 ECC | 20 GB GDDR6 ECC |
Szyna pamięci | 384 bit | 256 bit | 192 bit | 160 bit |
Przepustowość | 960 GB/s | 576 GB/s | 432 GB/s | 360 GB/s |
TDP | 300 W | 250 W | 210 W | 130 W |
RTX 4500 oraz RTX 4000 wykorzystują natomiast rdzenie AD104. Zostały odpowiednio wyposażone w 7680 badź 6144 rdzeni CUDA, oraz 240 bądź 192 Tensor. W ich przypadku również postawiono na moduły GDDR6 z korekcją błędów. Wydajniejszy RTX 4500 posiada 24 GB pamięci natomiast RTX 4000 “tylko” 20 GB.
Ceny nowych RTX mogą szokować
Znamy już specyfikację nowych kart graficznych, przejdźmy do najważniejszej kwestii ich ceny. Cóż rozwiązania kierowane do stacji roboczych nigdy nie były tymi najtańszymi. Wynika to po części z konieczności stosowania modułów pamięci wyposażonych w sprzętową korekcję błędów (ECC). Kolejnym powodem po prostu jest brak konkurencji. NVIDIA od wielu lat promuje swoje rozwiązania dedykowane dla stacji roboczych czy dużych centrów szkoleniowych AI, stając się największym dostawcą dedykowanych rozwiązań.
RTX 6000 | 6800 dolarów |
RTX 5000 | 4000 dolarów |
RTX 4500 | 2250 dolarów |
RTX 4000 | 1250 dolarów |
Cóż nowe RTX dla stacji roboczych nie będą wyjątkiem. RTX 5000 został wyceniony na 4000 dolarów, co po przeliczeniu i dodaniu podatków przełoży się w naszym kraju na niemal 18 tys. złotych. Mowa tu o cenie za jedną kartę, a przecież w pojedynczej stacji roboczej mogą zostać umieszczone nawet cztery takie układy! Również RTX 4500 oraz RTX 4000 nie będą wiele tańsze. Mówimy tu o 2250 oraz 1250 dolarach.
Jak zdominować rynek rozwiązań AI?
Cała prezentacji NVIDII podczas konferencji SIGGRAPH, dotyczyła rozwiązań powiązanych ze sztuczną inteligencją. I nie ma co się dziwić, biorąc pod uwagę dla kogo kierowana jest wspomniane konferencja. Organizacja SIGGRAPH od lat skupia wokół siebie twórców i artystów. A przecież Ci ostatnio coraz częściej sięgają po narzędzie bazujące na sztucznej inteligencji. Nvidia jako czołowy dostawca, rozwiązań dedykowanych szkoleniu AI, wykorzystuje okazje do promowania swoich technologii.

Nie ma zatem się co dziwić, że dużą część prezentacji poświęcono również omówieniu nowej platformy obliczeniowej wykorzystującej układy Grace Hopper. Nowa wersja GH200 otrzymała zgodnie z przypuszczeniami pamięć HBM3e. Jest to pierwszy na świecie układ wyposażony w te szybkie moduły. Dzięki temu zyskano nawet 50% lepszą przepustowość, w porównaniu z wariantem wykorzystującym standardowe kości HBM3. Dzięki temu sam pojedynczy rdzeń GPU ma osiągać wydajności aż 4 Petaflopów na sekundę. Podobnie jak w przypadku kart dla stacji roboczych konfiguracja serwera może składać się z wielu kart ukłądów Hooper, które dodatkowo jeszcze możemy łączyć w klastry superkomputera gotowego do szkolenia skomplikowanych modeli AI.

Konsekwencje dla rynku
Jak już pisałem w czerwcu w osobnym artykule, nie możemy oczekiwać obniżek cen kart graficznych. Prezentacja NVIDII dobitnie nam to udowadnia. Zauważcie, że od RTX 4070, w obu wariantach mówi się, że te nie sprzedają się zgodnie z oczekiwaniami NVIDII. Miało dojść do sytuacji gdzie zieloni ograniczają produkcję tych modeli. Nie oznacza to, jednak że całkowicie zrezygnowali z produkowania ich rdzeni.
RTX 4070 Ti | RTX 4500 | RTX 4070 | RTX 4000 | |
Rdzeń | AD104 | AD104 | AD104 | AD104 |
Rdzenie CUDA | 7680 | 7680 | 5888 | 6144 |
Rdzenie Tensor | 240 | 240 | 184 | 192 |
Wydajność pojedynczej precyzji | 40.09 TFLOP | 39,6 TFLOPS | 29.15 TFLOPS | 26,7 TFLOPS |
Pamięć | 12 GB GDDR6X | 24 GB GDDR6 | 12 GB GDDR6X | 20 GB GDDR6 |
Cena | 799 dolarów | 2250 dolarów | 599 dolarów | 1250 dolarów |
Czy zauważyliście podobieństwo RTX 4500 oraz RTX 4070 Ti? Obie karty bazują na tym samym rdzeniu AD104, posiadają tę samą ilość rdzeni CUDA i TENSOR. Oczywiście różnią się konfiguracją pamięci oraz co najważniejsze ceną. Karta dedykowana graczom jest wyceniana na 799 dolarów, natomiast jej odpowiednik przeznaczony dla stacji roboczych jak już pisałem 2250 dolarów. Jest to niemal trzy razy wyższa cena przy niemal identycznych kosztach produkcji. Każda karta produkcji NVIDII przeznaczona dla stancji roboczych jest kilkukrotnie droższa od swojego gamingowego odpowiednika. Nie ma co się zatem dziwić, że “zieloni” wolą się skupić na tym rynku, który przynosi im większy zysk. Trudno też odpowiedzieć czy nie doprowadzi to do kolejnego kryzysu i problemów z dostępnością kart graficznych przeznaczonych dla nie dla rozwiązań profesjonalnych.
Zagadka brakujących modeli GeForce Ti rozwiązana
Już od premiery RTX 4090 czy 4080 wspominało się o możliwości wprowadzenia modeli TI. Zresztą w przypadku serii “80” jednostki te towarzyszą nam niemal od 10 lat. Jednak wszystko wskazuje na to, że w przypadku kart opartych na rdzeniach Ada Lovelace modeli TI nie otrzymamy?
Powód jest ten sam co w przypadku omawianym powyżej. Obecnie RTX 4090 nie ma dla siebie konkurencji ze strony AMD. Nie ma co się dziwić, że NVIDIA woli przeznaczań pełne rdzenie AD102 dla RTX 6000. Na każdej tej karcie zarabia przecież ponad 4 razy więcej. Możemy też przypuszczać, że układ, który miałby trafić do GeForca RTX 4080 TI napędza właśnie RTX 5000.
Prezentacja NVIDII poniekąd potwierdziła moje wcześniejsze przypuszczenie. Firma mocno stawia na rozwój swoich rozwiązań AI, nie chcąc stracić pozycji lidera. I choć zaprezentowane technologie oraz rozwiązania są imponujące, to wzbudzają pewien niepokój. Czy idąc za zyskiem, NVIDIA nie zrezygnuje całkowicie z rozwiązań dla zwykłych użytkowników?