reklama

OpenAI, lider w dziedzinie sztucznej inteligencji, stoi przed technologicznym przełomem, który może zmienić sposób, w jaki działają ich modele AI. Do tej pory firma korzystała głównie z potężnych układów produkcji NVIDII, ale teraz zaczyna testować alternatywę. Chodzi o procesory TPU od Google, specjalnie zaprojektowane do zadań związanych ze sztuczną inteligencją.

Dlaczego OpenAI szuka alternatywy?

Odpowiedź jest prosta: koszty i dywersyfikacja. Utrzymanie i skalowanie tak potężnych modeli jak GPT-4 na obecnej infrastrukturze NVIDII generuje gigantyczne wydatki. Szacuje się, że roczny budżet obliczeniowy OpenAI może sięgać nawet 40 miliardów dolarów!

Wprowadzenie układów Google TPU (Tensor Processing Unit), zwłaszcza najnowszej generacji v6e „Trillium”, ma na celu znaczące obniżenie tych kosztów. TPUs są projektowane specjalnie pod kątem tzw. inferencji, czyli procesu, w którym wytrenowany już model AI odpowiada na twoje zapytania. Mówiąc prościej, są zoptymalizowane do wydajnej pracy przy mniejszym zużyciu energii, co przekłada się na realne oszczędności.

reklama

Techniczne wyzwanie – czy to takie proste?

Niestety, nie jest to tylko kwestia podmiany jednych chipów na drugie. Największym wyzwaniem jest oprogramowanie. Cały ekosystem AI od lat budowany jest wokół CUDA, autorskiej platformy NVIDII. Przeniesienie i optymalizacja kodu pod zupełnie nową architekturę Google TPU to ogromne przedsięwzięcie. OpenAI nie rezygnuje całkowicie z NVIDII ani ze wsparcia Microsoft Azure. To raczej strategiczny ruch mający na celu uniezależnienie się od jednego dostawcy, co daje większą elastyczność i pole do negocjacji cenowych w przyszłości.

Dla nas, użytkowników, oznacza to potencjalnie szybsze i tańsze usługi AI w przyszłości. A dla branży? To wyraźny sygnał, że rynek akceleratorów AI staje się coraz bardziej konkurencyjny.

Share.

Cześć! W redakcji 3D-Info będę odpowiadał za większość testów podzespołów komputerowych m.in: procesorów, płyt głównych, kart graficznych, ale także urządzeń sieciowych. Możecie spodziewać się również licznych tekstów okołosprzętowych, omówień bieżących wydarzeń i premier, rankingów czy porównań. Z góry przepraszam za mocno techniczny język. Jestem typowym geekiem komputerowym, który uwielbia zagłębiać się w szczegółach budowy podzespołów. Uwielbiam spędzać godziny na testach, a okno 3DMarka znam już chyba na pamięć. Lubię też wyszukiwać promocje na te najważniejsze i najdroższe komponenty komputerowe. I choć nie mam wieloletniego doświadczenia dziennikarskiego, mam nadzieję, że 3D-info to kolejny etap mojego rozwoju zawodowego.   Swoją przygodę z dziennikarstwem zaczynałem na 3D-Info niemal 10 lat temu. Jednak wtedy nie był to portal technologiczny, a bardziej blog teamu overclokingowego. Nasze wpisy skupiały się na raportowaniu naszych osiągnięć, czy podsumowania zawodów, w których braliśmy udział. Niestety, nie przetrwaliśmy próby czasu, a ekipa rozeszła się do „normalnej” pracy. Sam przez lata pracowałem w kilku sklepach ze sprzętem RTV i AGD. Mój powrót do dziennikarstwa nastąpił w 2019 roku, w sumie to z przypadku, na łamach portalu PCWorld.pl. Zaczynałem skromnie od pojedynczych testów pamięci RAM czy dysków. To opór Piotrka Opulskiego, naszego wydawcy spowodował, że zdecydowałem się w 2021 całkowicie zmienić swoją drogę kariery zawodowej i zostałem redaktorem na stałe.   Nie będzie raczej niespodzianką, jak powiem, że mimo upływu lat moje zamiłowanie do podkręcania nie ustąpiło. Obecnie pomału wracam do świata ekstremalnego overclockingu, by jeszcze bardziej poszerzyć swoją wiedzę technologiczną. Idealne popołudnie dla mnie to dewar pełen ciekłego azotu i odpalone na komputerze liczne benchmarki.

Exit mobile version