NVIDIA zapowiadana RTX 5000! Oto wszystko, co wiemy o nowych kartach graficznych

9 sierpnia 2023
7 minut czytania

NVIDIA zapowiadana RTX 5000! Oto wszystko, co wiemy o nowych kartach graficznych

Podczas trwającej w Los Angeles konferencji SIGGRAPH, NVIDIA postanowiła zaprezentować nowe karty graficzne. Oto wszystkie najważniejsze informacje dotyczące RTX 5000, RTX 4500 oraz RTX 4000.

Choć wszyscy zakładali, że prezentacji NVIDII skupi się na ogłoszonym niedawno dołączeniu do projektu openUSD, czy rozwiązaniach dla centrów obliczeniowych, to czekała nas miła niespodzianka. Jensen Huang zademonstrował nowe karty graficzne. Tak mowa o tytułowym RTX 5000, jednak nie jest to następna generacja kart GeForce skierowana dla graczy. Mowa o GPU przeznaczonym dla stacji roboczych, przystosowanym do szkolenia sztucznej inteligencji. Czemu jednak ta premiera jest taka ważna?

Trzy nowe RTX, ale dla stacji roboczych

Jak już wspominałem, zapowiedziane zostały aż trzy nowe karty graficzne. Wszystkie bazują na znanej z desktopowych odpowiedników architekturze Ada Lovalace i docelowo mają trafić do stacji roboczych. Przyjrzyjmy się specyfikacji nowych modeli.

Najmocniejszym jest RTX 5000, który wykorzystuje rdzeń AD102. Ten sam który znajdziemy choćby w RTX 4090 czy RTX 6000 także przeznaczonym dla stacji roboczych. Ten posiada 12800 jednostek cieniujących, zwane także rdzeniami CUDA, oraz aż 400 rdzeni Tensor czwartej generacji. To właśnie one w głównej mierze odpowiadają za wydajności w zadaniach polegających na szkoleniu modeli sztucznej inteligencji. Karta otrzymała również 32 GB pamięci GDDR6 z korekcją błędów ECC połączonej przez 256 bitową magistralę. Wydajność w przypadku obliczeń pojedynczej precyzji (FP32) ma wynosić zawrotne 65.3 TeraFlopów.

	RTX 6000	RTX 5000	RTX 4500	RTX 4000
Architektura	Ada Lovelace	Ada Lovelace	Ada Lovelace	Ada Lovelace
Rdzeń	GA102	GA102	GA104	GA104
Rdzenie CUDA	18176	12800	7680	6144
Rdzenie Tensor	568	400	240	192
Wydajność pojedynczej precyzji	91,1 TFLOPS	65,3 TFLOPS	39,6 TFLOPS	26,7 TFLOPS
Wydajność rdzeni RT	210,6 TFLOPS	151 TFLOPS	96,6 TFLOPS	44,3 TFLOPS
Wydajność rdzeni Tensor	1457 TFLOPS	1044,4 TFLOPS	634 TFLOPS	427,6 TFLOPS
Pamięć	48 GB GDDR6 ECC	32 GB GDDR6 ECC	24 GB GDDR6 ECC	20 GB GDDR6 ECC
Szyna pamięci	384 bit	256 bit	192 bit	160 bit
Przepustowość	960 GB/s	576 GB/s	432 GB/s	360 GB/s
TDP	300 W	250 W	210 W	130 W

RTX 4500 oraz RTX 4000 wykorzystują natomiast rdzenie AD104. Zostały odpowiednio wyposażone w 7680 badź 6144 rdzeni CUDA, oraz 240 bądź 192 Tensor. W ich przypadku również postawiono na moduły GDDR6 z korekcją błędów. Wydajniejszy RTX 4500 posiada 24 GB pamięci natomiast RTX 4000 “tylko” 20 GB.

Ceny nowych RTX mogą szokować

Znamy już specyfikację nowych kart graficznych, przejdźmy do najważniejszej kwestii ich ceny. Cóż rozwiązania kierowane do stacji roboczych nigdy nie były tymi najtańszymi. Wynika to po części z konieczności stosowania modułów pamięci wyposażonych w sprzętową korekcję błędów (ECC). Kolejnym powodem po prostu jest brak konkurencji. NVIDIA od wielu lat promuje swoje rozwiązania dedykowane dla stacji roboczych czy dużych centrów szkoleniowych AI, stając się największym dostawcą dedykowanych rozwiązań.

RTX 6000	6800 dolarów
RTX 5000	4000 dolarów
RTX 4500	2250 dolarów
RTX 4000	1250 dolarów

Cóż nowe RTX dla stacji roboczych nie będą wyjątkiem. RTX 5000 został wyceniony na 4000 dolarów, co po przeliczeniu i dodaniu podatków przełoży się w naszym kraju na niemal 18 tys. złotych. Mowa tu o cenie za jedną kartę, a przecież w pojedynczej stacji roboczej mogą zostać umieszczone nawet cztery takie układy! Również RTX 4500 oraz RTX 4000 nie będą wiele tańsze. Mówimy tu o 2250 oraz 1250 dolarach.

Jak zdominować rynek rozwiązań AI?

Cała prezentacji NVIDII podczas konferencji SIGGRAPH, dotyczyła rozwiązań powiązanych ze sztuczną inteligencją. I nie ma co się dziwić, biorąc pod uwagę dla kogo kierowana jest wspomniane konferencja. Organizacja SIGGRAPH od lat skupia wokół siebie twórców i artystów. A przecież Ci ostatnio coraz częściej sięgają po narzędzie bazujące na sztucznej inteligencji. Nvidia jako czołowy dostawca, rozwiązań dedykowanych szkoleniu AI, wykorzystuje okazje do promowania swoich technologii.

Nie ma zatem się co dziwić, że dużą część prezentacji poświęcono również omówieniu nowej platformy obliczeniowej wykorzystującej układy Grace Hopper. Nowa wersja GH200 otrzymała zgodnie z przypuszczeniami pamięć HBM3e. Jest to pierwszy na świecie układ wyposażony w te szybkie moduły. Dzięki temu zyskano nawet 50% lepszą przepustowość, w porównaniu z wariantem wykorzystującym standardowe kości HBM3. Dzięki temu sam pojedynczy rdzeń GPU ma osiągać wydajności aż 4 Petaflopów na sekundę. Podobnie jak w przypadku kart dla stacji roboczych konfiguracja serwera może składać się z wielu kart ukłądów Hooper, które dodatkowo jeszcze możemy łączyć w klastry superkomputera gotowego do szkolenia skomplikowanych modeli AI.

Konsekwencje dla rynku

Jak już pisałem w czerwcu w osobnym artykule, nie możemy oczekiwać obniżek cen kart graficznych. Prezentacja NVIDII dobitnie nam to udowadnia. Zauważcie, że od RTX 4070, w obu wariantach mówi się, że te nie sprzedają się zgodnie z oczekiwaniami NVIDII. Miało dojść do sytuacji gdzie zieloni ograniczają produkcję tych modeli. Nie oznacza to, jednak że całkowicie zrezygnowali z produkowania ich rdzeni.

	RTX 4070 Ti	RTX 4500	RTX 4070	RTX 4000
Rdzeń	AD104	AD104	AD104	AD104
Rdzenie CUDA	7680	7680	5888	6144
Rdzenie Tensor	240	240	184	192
Wydajność pojedynczej precyzji	40.09 TFLOP	39,6 TFLOPS	29.15 TFLOPS	26,7 TFLOPS
Pamięć	12 GB GDDR6X	24 GB GDDR6	12 GB GDDR6X	20 GB GDDR6
Cena	799 dolarów	2250 dolarów	599 dolarów	1250 dolarów

Czy zauważyliście podobieństwo RTX 4500 oraz RTX 4070 Ti? Obie karty bazują na tym samym rdzeniu AD104, posiadają tę samą ilość rdzeni CUDA i TENSOR. Oczywiście różnią się konfiguracją pamięci oraz co najważniejsze ceną. Karta dedykowana graczom jest wyceniana na 799 dolarów, natomiast jej odpowiednik przeznaczony dla stacji roboczych jak już pisałem 2250 dolarów. Jest to niemal trzy razy wyższa cena przy niemal identycznych kosztach produkcji. Każda karta produkcji NVIDII przeznaczona dla stancji roboczych jest kilkukrotnie droższa od swojego gamingowego odpowiednika. Nie ma co się zatem dziwić, że “zieloni” wolą się skupić na tym rynku, który przynosi im większy zysk. Trudno też odpowiedzieć czy nie doprowadzi to do kolejnego kryzysu i problemów z dostępnością kart graficznych przeznaczonych dla nie dla rozwiązań profesjonalnych.

Zagadka brakujących modeli GeForce Ti rozwiązana

Już od premiery RTX 4090 czy 4080 wspominało się o możliwości wprowadzenia modeli TI. Zresztą w przypadku serii “80” jednostki te towarzyszą nam niemal od 10 lat. Jednak wszystko wskazuje na to, że w przypadku kart opartych na rdzeniach Ada Lovelace modeli TI nie otrzymamy?

Powód jest ten sam co w przypadku omawianym powyżej. Obecnie RTX 4090 nie ma dla siebie konkurencji ze strony AMD. Nie ma co się dziwić, że NVIDIA woli przeznaczań pełne rdzenie AD102 dla RTX 6000. Na każdej tej karcie zarabia przecież ponad 4 razy więcej. Możemy też przypuszczać, że układ, który miałby trafić do GeForca RTX 4080 TI napędza właśnie RTX 5000.

Prezentacja NVIDII poniekąd potwierdziła moje wcześniejsze przypuszczenie. Firma mocno stawia na rozwój swoich rozwiązań AI, nie chcąc stracić pozycji lidera. I choć zaprezentowane technologie oraz rozwiązania są imponujące, to wzbudzają pewien niepokój. Czy idąc za zyskiem, NVIDIA nie zrezygnuje całkowicie z rozwiązań dla zwykłych użytkowników?

Może Cię zainteresować

KFA2 GeForce RTX 4070 SUPER 1-Click OC 2X, mały cichy wydajny… aż szkoda, że zablokowany

Recenzja

NVIDIA zapowiadana RTX 5000! Oto wszystko, co wiemy o nowych kartach graficznych

Trzy nowe RTX, ale dla stacji roboczych

Ceny nowych RTX mogą szokować

Jak zdominować rynek rozwiązań AI?

Konsekwencje dla rynku

Zagadka brakujących modeli GeForce Ti rozwiązana

Może Cię zainteresować

KFA2 GeForce RTX 4070 SUPER 1-Click OC 2X, mały cichy wydajny… aż szkoda, że zablokowany

Czym jest zjawisko Bottleneck i czy naprawdę da się go uniknąć?

Najlepsze zestawy komputerowe – lipiec 2024

Ghost of Tsushima Director’s Cut. Jak zostałem samurajem. Sprawdzam wersję na PC