Wraz z premierą kart graficznych RTX serii 4000, została zaprezentowana nowa wersja supersamplingu NVIDII. Mowa oczywiście o Deep Learning Super Sampling dumnie nazwanym DLSS3. Jednak tak naprawdę jedyną innowacją tej technologi było wprowadzenie generatora klatek. Dodatkowo ta została zastrzeżona na wyłączność tylko dla debiutujących GPU, co było dość głośno komentowane przez użytkowników. Wczoraj NVIDIA zaprezentowała kolejną wersję DLSS i jedyne co można powiedzieć to, że “zieloni” uczą się na swoich błędach. Oto wszystko, co wiemy o DLSS 3.5.
Jednak zacznijmy od początku, czym jest Deep Learning Super Sampling? W dużym uproszczeniu jest to technologia skalowania obrazu opracowana przez NVIDIE. Oznacza to, że obraz, który jest wyświetlany na naszym ekranie, tak naprawdę jest renderowany w niższej rozdzielczości, a zanim trafi na nasz monitor, przechodzi proces podbicia jakości. Technologia NVIDII jest w stanie dodać nawet więcej szczegółów niż natywnie renderowany obraz, zapewniając jednocześnie znaczny wzrost średniej liczby generowanych klatek na sekundę. By było to możliwe, „zieloni” przygotowali specjalne algorytmy, wykorzystujące uczenie maszynowe, w celu poprawy jakości obrazu.
NVIDIA mocno wierzy w swoją technologię i stale ją aktualizuje, aby poprawić wydajność oraz wrażenia wizualne. Dodatkowo wykorzystuje ją do promowania nowych kart graficznych. Zobaczcie jak duży nacisk, był kładziony na DLSS 3, w którym dodano unikalny komponent — Frame Generation. Działa on przecież tylko na RTX 4000, co wielokrotnie było podkreślane podczas premier następnych kart graficznych z rodziny Ada Lovelace. Zatem co nowego wnosi kolejna iteracja technologii NVIDII?
DLSS 3.5 to już nie tylko supersampling
Początkowo głównym założeniem DLSS była poprawa wydajności kart GeForce. Dzięki tej technologii była możliwa płynna rozgrywka z włączonymi opcjami śledzenia promieni, które co by nie mówić, w znaczącym stopniu obciążają karty graficzne. Jednak jak każda technologia ta nie była idealna od początku, a generowany obraz mimo wykorzystania algorytmów sztucznej inteligencji nie był pozbawiony wad. Następne odsłony nie tylko poprawiły jakość (DLSS 2) ale i znacząco wpłynęły na wydajność (DLSS 3), choć tylko na wybranych modelach GPU.
NVIDIA prezentując DLSS 3.5, skupia się po raz kolejny na jakości generowanego obrazu. W tym celu została wprowadzona funkcja Ray Reconstruction. Generowany obraz ma być jeszcze dokładniejszy dzięki zastosowaniu specjalnego procesu odszumiania.
Musimy zdać sobie sprawę, że Ray Tracing w grach ma swoje ograniczenia. Istnieje limit liczby promieni, które procesor graficzny może wygenerować na scenie. To ograniczenie jest kluczowe dla osiągnięcia fotorealistycznych efektów świetlnych w grach. Niestety, obecnie nie istnieje możliwość generowania nieskończonej ilości promieni, w celu uzyskania idealnej jakości obrazów jak ma to miejsce w filmach.
Przecież chcemy by środowisko, w którym się poruszamy było w pełni interaktywne, a postać reagowała na każde nasze polecenie w ułamku sekund. Tak samo musi zachowywać się oświetlenie w grze. Twórcy gier muszą wykorzystać różne sztuczki usprawniający cały proces, takie jak niepełne obliczanie oświetlenia czy rasteryzacje części odbić, czy cieni.
Dlatego przed przystąpieniem do renderowania sceny w nowoczesnych grach i na współczesnych kartach graficznych, uruchamiane są narzędzia do „usuwania szumów”. Ich celem jest pozbycie się ziarnistości, która wynika z braku pełnych danych o promieniach w kolejnych wyświetlanych klatkach gry. Przypomina to trochę proces generowania obrazów za pomocą sztucznej inteligencji Stable Diffusion, a jakość rezultatu jest zależna od dokładności (ilości kroków), które wykonuje program.
Jednak największym problemem dla klasycznych algorytmów odszumiania było właśnie DLSS. Po włączeniu tej opcji generowany jest przecież obraz w niższej rozdzielczości. Konwencjonalne układy eliminacji szumów, dostrojone ręcznie, przeprowadzają próbkowanie określonych obszarów sceny renderowanej. Proces ten może być tymczasowy, wykonywany na postawie danych z wielu klatek lub opierać się na modelu przestrzennym, który wykorzystującym sąsiednie piksele. Dane te są później używane do uzupełnienia brakujących pikseli, przez które jednak mogły nie przechodzić promienie. Właśnie to jest główna przyczyna powstania błędów przy generowaniu obrazów, czy ogólnie gorszej jakości odbić, czy globalnego oświetlenia.
Ray Reconstruction ma rozwiązać wszystkie te problemy. Funkcja ta zastępuje ręczne dostrajane denoisery, rozwiązaniem opartym po raz kolejny na sztucznej inteligencji. Ten został celowo przeszkolony, aby identyfikować dobre i złe piksele w trakcie zarówno temporalnego, jak i przestrzennego redukowania szumów. Dokładnie rozpoznaje efekty śledzenia promieni oraz uwzględnia różne aspekty gry, takie jak wektory ruchu czy kolory powierzchni. Dzięki temu gry wykorzystujące Ray Tracing mogą osiągnąć znacznie bardziej precyzyjne efekty wizualne. Sama NVIDIA podkreśla, że do szkolenia nowej funkcji używa nawet 5 razy więcej danych, niż w przypadku samej opcji upscalingu obrazu.
Niestety na chwilę obecną możemy zobaczyć działanie Ray Reconstruction tylko na materiałach przygotowanych przez samą NVIDIE. Na szczęście, by móc samemu przekonać się o możliwościach DLSS 3.5, nie będziemy musieli długo czekać. Technologia ta zadebiutuje jeszcze w tym roku, m.in w dodatku Phantom Liberty do Cyberpunka 2077, czy Alan Wake II.
Szerokie wsparcie dla DLSS 3.5 – zagranie pod publikę?
Mamy też dobre informacje. W przeciwieństwie do DLSS 3, a bardziej funkcji generatora klatek, który potrzebuje specjalnego wsparcie sprzętowego znanego jako „Optical Flow Accelerator”, dostępnego tylko w nowych kartach graficznych GeForce RTX z serii 4000. DLSS 3.5 działa na każdej karcie graficznej RTX. Oznacza to, że nawet posiadacze starszych modeli z serii RTX 2000, również będą mogli skorzystać z opcji Ray Reconstruction.
I choć możemy się cieszyć, że kolejne rozwiązanie NVIDII nie jest ukryte za „Pay Wallem”, to zastanówmy się, czy naprawdę mamy z czego? Jak podkreślają „zieloni”, DLSS 3.5 koncentruje się na jakości obrazu opartej na Ray Tracingu, a nie na szybkości działania. Oczywiście, zauważamy niewielki wzrost wydajności, w złożonych grach wykorzystujących Ray Tracing, w zależności od ilości denoiserów „Ray Reconstruction” używanych przez silnik gry. Nie oznacza to jednak, że Cyberpunk 2077: Phantom Liberty w trybie RT Overdrive w rozdzielczości 4K zacznie działać płynnie na RTX 2080. Nowe gry posiadające więcej źródeł światła i tak będą wymagały posiadania dużo wydajniejszego GPU przez nas bądź skorzystania z funkcji generatora klatek.
I choć nie poznamy prawdziwej motywacji ze strony NVIDII, to prywatnie nie mogę się aż doczekać, by sprawdzić dodatek do Cyberpunka 2077 z włączoną opcją Ray Reconstruction. Już w trybie RT Overdrive gra ta wyglądała niesamowicie, a według obietnic i zapewnień ze strony „zielonych”, ma być jeszcze lepiej. Zauważcie też, że prezentacja nowego rozwiązania nastąpiła, jeszcze przed długo wyczekiwaną premierą FSR 3, dumnie zapowiadanej konkurencyjnej technologii, również wykorzystującej generowane klatki. Nawet jeśli AMD ogłosi debiut nowej wersji swojego Super Samplingu podczas piątkowej konferencji na Gamescom, to i tak „zieloni” byli po raz kolejny pierwsi. NVIDIA po prostu chce być uważana za lidera na rynku, zarówno w przypadku rozwiązań wykorzystujących sztuczną Inteligencje, jak i jako producent kart graficznych.