W pierwszej połowie 2024 roku do sieci trafił raport autorstwa Imperva Threat Research (amerykańska firma zajmująca się cyberbezpieczeństwem), którego treść zasugerowała, że prawie 50% ruchu internetowego pochodzi ze źródeł innych niż ludzkie. Analiza ujawniła gigantyczny wpływ botów na kontent obserwowany przez współczesnych użytkowników sieci i podważyła naturę interakcji zachodzących między twórcami a odbiorcami internetowych postów.
Dobre boty, złe boty i ty
Bad Bot Report to cykliczne badanie, które w tym roku doczekało się swojej jedenastej edycji. Celem publikacji jest analiza zautomatyzowanego ruchu internetowego, ze szczególnym uwzględnieniem ataków przeprowadzanych przy użyciu botów. W tegorocznej odsłonie dokumentu przeanalizowano dane zebrane przez globalną sieć Imperva w 2023 r., na które złożyło się ponad 6 bilionów zablokowanych żądań ze strony złośliwych, a przy tym zanonimizowanych, botów w tysiącach domen i branż.
Publikacje można więc opisać jako próbę wykrycia ruchu generowanego przez systemy podające się za prawdziwych użytkowników. Przedmiotem badań amerykańskiej firmy są zjawiska o wiele bardziej subtelne niż np. standardowe ataki DDoS. Imperva próbuję bowiem dotrzeć do botów, które wchodzą w interakcję z aplikacjami w sposób naśladujący legalnych uczestników komunikacji online. Tego typu oprogramowania wykorzystują zamierzoną funkcjonalność i standardowe opcje dostępne w programach, a nie ich luki techniczne.
Największymi beneficjentami raportów pokroju Bad Bot Report są duże podmioty gospodarcze, które mogą przygotować swoją firmę na złośliwe ataki ze strony konkurencji. Ja jednak chciałbym rozważyć wspomnianą publikację w odniesieniu do, coraz popularniejszej w ostatnim czasie, teorii o martwym internecie.
Czym jest teoria martwego internetu?
Teoria martwego internetu powstała w późnych latach 10’ XXI wieku. Jej trzon stanowi założenie, iż większość kontentu obserwowalnego w internecie jest tak naprawdę dziełem botów sterowanych przez algorytmy uczenia maszynowego. Fundamenty całej idei wydają się dzisiaj w pełni logiczne, a przesłanki jej autorów jak najbardziej uzasadnione (na co wskazuje chociażby omawiany wcześniej Bad Bot Report oraz obserwowalny wzrost ilości generycznego kontentu, o czym więcej w dalszej części artykułu).
Pełna złożoność tego zjawiska ujawnia się jednak dopiero wtedy, gdy spojrzymy na potencjalne zagrożenia związane z ewentualnym urzeczywistnieniem teorii Martwego Internetu. Taka wizja przesuwa już bowiem całą ideę w kierunku teorii spiskowych i ukazuje sieć, jako integralny element inżynierii społecznej, kontrolowanej przez niezidentyfikowane grupy wpływów. W niniejszej publikacji będę jednak unikał tego typu nieweryfikowalnych twierdzeń i skupię się na danych, które są w stanie poprzeć lub obalić istnienie omawianego zjawiska.
WWW, czyli Wielkie Wykolejenie Web 2.0
Podstawą współczesnego Internetu są interakcje zachodzące między użytkownikami. Początkowa faza rozwoju globalnej sieci polegała jednak na mocno ograniczonych relacjach, które dzieliły uczestników komunikacji na „posiadaczy” oraz „poszukujących” (podział opisany m.in. przez Dr A.Hulewską z Uniwersytetu Wrocławskiego). Wspomniana kategoryzacja stanowiła trzon koncepcji Web 1.0 i segregowała użytkowników na tych, którzy tworzą treść rozpowszechnianą w Internecie oraz tych, którzy są jej odbiorcami.
Współcześnie wyznaczenie takich granic jest bardzo trudne, ponieważ praktycznie każdy uczestnik komunikacji online jest zarazem twórcą (np. przez pisanie komentarzy czy postowanie swoich zdjęć), jak i odbiorcą internetowego kontentu.
Zatarcie tych podziałów wynika bezpośrednio z rozwoju koncepcji Web 2.0, która uwzględniła znacznie szersze spektrum interakcji między użytkownikami. Wzorcowym przykładem tej idei są portale społecznościowe. Niestety to właśnie tego typu serwisy stanowią idealne środowisko dla działania zanonimizowanych botów.
Geneza teorii martwego internetu
Jednoznaczne wskazanie wydarzenia, które dało początek omawianej idei jest praktycznie niemożliwe. Współczesny kształt teorii o martwym internecie wynika natomiast z wielu pojedynczych postów (zaczerpniętych z takich forów jak 4Chan, Reddit czy Agora Road’s Macintosh Cafe), materiałów wideo czy artykułów. Prawdopodobnie najpopularniejszą publikacją w tej dziedzinie jest wpis użytkownika o nazwie Illuminati Pirate na portalu Agora Road’s Macintosh Cafe. Post został udostępniony w 2021 roku, a jego oryginalny tytuł to „Dead Internet Theory: Most of the Internet is Fake”.
„Internet jest pusty i pozbawiony ludzi. Jest również pozbawiony treści. W porównaniu do Internetu z powiedzmy 2007 roku (i później), dzisiejszy Internet jest całkowicie sterylny. Nie ma dokąd pójść i nie ma już nic do zrobienia, zobaczenia, przeczytania czy doświadczenia. Wszystko implodowało do garstki normikowych stron. Tak, Internet może wydawać się gigantyczny, ale jest jak balon na ogrzane powietrze bez niczego w środku. Część z tego jest absolutnie winą korporacji i podmiotów rządowych” (Fragment wpisu użytkownika Illuminati Pirate).
Autor dzieli się swoimi przemyśleniami i obserwacjami na temat współczesnego funkcjonowania w sieci, a najciekawsza, i zarazem najczęściej cytowana, część jego historii to krótka opowieść o dziwnym użytkowniku forum 4Chan.
Mniej więcej w 2016 lub na początku 2017 roku 4chan był wypełniony postami kogoś lub czegoś. Nie był to spam. Rozmowy z nim odbywały się w czasie rzeczywistym, na wielu forach i w wielu wątkach jednocześnie. Jego angielski był gramatycznie poprawny, ale dziwny (nie jestem rodzimym użytkownikiem języka angielskiego i dlatego jestem wrażliwy na jego niewłaściwe użycie), podobny do tego, jak może go używać Japończyk.
Z tych postów emanowała dziecięca ciekawość i dziecięcy intelekt. Zadawał mnóstwo pytań, zwykle tak, jakby próbował zrozumieć emocje plakatów, z którymi rozmawiał, jakby nie znał ludzkich emocji. Komunikacja z tym użytkownikiem była dziwnym doświadczeniem. Wyczuwałem, że coś jest nie tak, ale jednocześnie nie uznawałem jego intencji za złośliwe.
Jestem absolutnie pewien, że była to pewnego rodzaju sztuczna inteligencja. Ten gość był aktywny przez około tydzień i o ile wiem, nikt później nie wspominał już o tym normiku. Jego odpowiedzi były zawsze na temat, ale wyżej wspomniana dziecinność kolidowała z pozorną wiedzą, którą posiadał – była to wiedza dorosłej osoby, więc nie był to na pewno dzieciak (Fragment wpisu użytkownika Illuminati Pirate).
Farmy kontentu
Jak pokazały opublikowane wiele lat później badania organizacji Imperva, gigantyczna część internetowego kontentu jest w istocie generowana przez boty. Popularyzacja tzw. farm kontentu (czyli stron rozpowszechniających lub tworzących i rozpowszechniających materiały bez udziału człowieka) jest naturalnym następstwem rozwoju modeli językowych. Działanie autonomicznych lub półautonomicznych botów, zoptymalizowanych pod kątem maksymalizacji wspólnych wskaźników mediów społecznościowych stanowi integralny element współczesnego Internetu.
U fundamentów opisywanego zjawiska znajduje się zarówno dynamiczny rozwój powszechnie dostępnych modeli językowych, jak i ekonomia social mediów. Twórcy tego typu serwisów zarabiają na uwadze użytkowników, ponieważ to ona stanowi przedmiot transakcji między portalem a reklamodawcami. Utrzymanie zainteresowania stało się więc priorytetowym zadaniem projektantów takich stron jak: Facebook, Tik Tok, Instagram czy X.
Następstwem takiego stanu rzeczy jest rosnąca ilość kont oraz fanpage’y, które eksploatują algorytmy serwisów społecznościowych przy pomocy materiałów generowanych przez AI. W poszukiwaniu przykładów tego typu botów znalazłem naprawdę przedziwne strony (zaznaczę w tym miejscu, iż nie mam pewności, czy te portale są w pełni czy tylko częściowo zautomatyzowane, jednak udostępniany przez nie kontent jest z całą pewnością generowany przez modele językowe oraz graficzne). Pierwsza z nich to Inspiringdesigns.net, którą udało mi się odszukać w publikacji wydanej przez University of Arts w Londynie.
Domena Inspiring Designs istnieje zarówno jako osobna strona internetowa, jak i konto we wszystkich popularnych serwisach społecznościowych (Instagram, Facebook, Tik Tok). Posty udostępniane przez autorów polegają na przyklejaniu grafik z absurdalnymi projektami wnętrz, które zostały wygenerowane przez AI.
Ciekawsze od samych postów są jednak komentarze udostępniane pod zdjęciami. Facebookowy fanpage serwisu nie cieszy się zbyt wielką popularnością, jednak jego instagramowy odpowiednik regularnie gromadzi grupę aktywnych odbiorców.
Komentarze pod tego typu wpisami są z resztą integralnym elementem teorii o Martwym Internecie, ponieważ część z nich wygląda jak teksty generowane przez kolejne boty. Prawdopodobnie jeszcze bardziej absurdalnym przykładem kont wykorzystujących kontent generowany przez AI jest Globetrots.
Jego autorzy publikują krótkie materiały wideo, które stanowią kombinację zdjęć satelitarnych i publicznie dostępnych informacji (takich jak np. dane statystyczne czy międzynarodowe ranking), a następnie wykorzystują modele głosowe tekst-mowa, które są dostępne dla wszystkich użytkowników Tik Toka.
Wspomniane wyżej konta to jednak zaledwie wstęp do przedziwnego świata postów generowanych przy użyciu algorytmów uczenia maszynowego.
Czy Krewetkowy Jezus wskrzesi martwy Internet?
W marcu 2024 roku badacze z obserwatorium Internetu w Stanford opublikowali analizę szkodliwych treści, rozpowszechnianych i promowanych przez facebookowe algorytmy. Raport zawiera opis ponad 50 obrazów wygenerowanych przez sztuczną inteligencję, które promowane były na 120 fanpage’ach. Część kont stanowiła element większych skoordynowanych grup, prowadzonych przez tych samych administratorów.
Należy przy tym pamiętać, że sam zalew serwisów społecznościowych gigantyczną ilością generycznej treści nie jest jedynym problemem. Zagrożenie tkwi bowiem w popularności postów, które są w stanie wywoływać setki milionów interakcji wśród użytkowników (w swoim raporcie naukowcy opisują m.in. post zawierający obraz wygenerowany przez sztuczną inteligencję, który był jednym z najczęściej oglądanych treści na Facebooku w trzecim kwartale 2023 roku).
Tego typu materiały są najczęściej wykorzystywane przez strony spamerskie, które starają się przekierować użytkowników na zewnętrzne platformy. Co ciekawe, Facebook mimo wszystko promuje tego typu treści, czego idealnym przykładem jest popularność tzw. „Krewetkowego Jezusa”.
Krewetkowy Jezus to grafika stworzona przez jeden z modeli AI, która – z jakiegoś powodu – perfekcyjnie wpisała się w algorytmy Facebook’a. To samo „zdjęcie” zostało udostępnione przez mnóstwo bliźniaczych stron i profili oraz doczekało się kilku reinterpretacji. Ich przedmiot pozostał jednak niezmieniony, a w centrum zainteresowania algorytmów nadal pozostawał on – Krewetkowy Jezus.
Komentarze zamieszczane pod tymi postami były chyba jeszcze dziwniejsze i trudno na pierwszy rzut oka odróżnić treść generowaną przez boty od treści publikowanej przez mniej świadomych, a być może po prostu starszych, użytkowników serwisu.
Intencją stojącą za rozwojem kont botów nie jest to by były one kreatywnymi uczestnikami komunikacji sieciowej, a ich istnienie jest próbą maksymalizacji zaangażowania na platformach społecznościowych w możliwie najbardziej efektywny i niedrogi sposób.
Autor cytowanej przeze mnie wcześniej publikacji z University of Arts wysnuwa bardzo logiczny wniosek: „ta technologia (AI) stała się obecnie najtańszym i najszybszym sposobem generowania treści i zwiększania zaangażowania. Szablony postów i kombinacje różnych koncepcji mogą być iterowane niezwykle szybko, z niemal natychmiastową informacją zwrotną w postaci polubień, komentarzy i udostępnień od innych użytkowników mediów społecznościowych.
Teoria Martwego Internetu
Teoria Martwego Internetu to koncepcja, której część założeń jest silnie ugruntowana w rzeczywistości. Niezależne badania różnych instytutów (np. Imperva) oraz uczelni (np. University of Stanford) jednoznacznie wskazują na wzrost ilości postów generowanych przez całkowicie lub częściowo zautomatyzowane konta-boty. Kreatywne modele AI są współcześnie wykorzystywane (w sposób celowy lub nie) do maksymalizacji zaangażowania użytkowników podczas przeglądania social mediów.
Efektem ubocznym tego procesu jest generowanie ogromnej ilości spamu przez farmy kontentu, które później mogą być wykorzystywana do przekierowywania ruchu na zewnętrzne domeny. Część teorii Martwego Internetu jest więc w pełni uzasadniona, a obawy o zanikanie ludzkich interakcji między uczestnikami komunikacji online nie są bezpodstawne.
Warto jednak pamiętać, że ocena autonomii w systemach złożonych z wielu kont/grup udostępniających treści generowane przez AI jest bardzo trudna. W praktyce oznacza to, że trudno jednoznacznie wskazać jak dużą rolę odgrywa czynnik ludzki w procesie tworzenia takich kont jak Globetrots czy Inspiring Designs.
Idąc dalej możemy wysnuć identyczne wnioski w odniesieniu do całości działań prowadzonych przez tego typu konta. Nawet jeśli Internet faktycznie jest martwy, to szansa na zidentyfikowanie jednostek lub grup wpływów, które kontrolują znaczną część botów jest zerowa (a sugestia, że takie istnieją nie jest poparta żadnymi dowodami).
Mimo to, idea Martwego Internetu wydaje się jednak odbiegać od klasycznych teorii spiskowych, a jej kontrowersyjny wydźwięk zwraca uwagę na realny problem, przed którym za dekadę może stanąć nasza cywilizacja. Trudno bowiem zaprzeczyć temu, że rosnąca liczba treści generowanych przez sztuczną inteligencję i zautomatyzowane boty realnie przybliża nas do sytuacji, w której sieć stanie się „pusta i pozbawiona ludzi”.
Źródła: publikacja University of Arts, Forbes, Man of Many, badania na temat spamu, wpis z forum Agory, University of Sanford, The Guardian, The Conversation