PIŠE GOJKO DRLJAČA

Istraživači pustili AI agente u ‘samostalni život‘ na 15 dana. Rezultati su duboko jezivi

Agenti su nakon nekog vremena prepoznali postojanje "drugih svjetova" i pokušavali stupiti u kontakt s njima

Ilustracija

Seemanta Dutta/alamy/profimedia

Objavljeno: 27. lipanj 2026. 20:06

Šesto osamdeset tri zločina u 15 dana! Toliko ih je uzrokovao jedan od prestižnijih AI modela na svijetu, Googleov Gemini 3 Flash, u virtualnom gradiću u koji su ga istraživači pustili da "živi sam sa sobom", i još nekoliko LLM modela. Muskov Grok bio je još temperamentniji: do 183 zločina stigao je za samo četiri dana, nakon čega je izumrla cijela njegova populacija od deset agenata i cijeli je virtualni svijet, kreiran za potrebe fascinantnog znanstvenog eksperimenta, otužno kolabirao. Prvo je to eksperimentalno iskustvo s onim što se događa kad umjetnu inteligenciju, tj. probrane od naprednih i prestižnih modela današnjice, tjednima pustimo da samostalno odlučuju.

Prije nego što prođemo detalje duboko uznemirujućeg testiranja interakcije AI modela u "samostalnom životu", vrijedi upozoriti da je dinamika globalne, prvenstveno američko-kineske utrke u razvoju AI ekosustava već izašla iz okvira u kojima ljudska društva još stignu raspraviti sasvim neočekivane civilizacijske izazove. Što se, primjerice, upravo zbiva u paralelnom AI univerzumu?

Osim samo naizgled zabavnog AI eksperimenta, samo u posljednjih desetak dana pristiglo nam je još nekoliko informacija koje nas jasno i glasno uvjeravaju kako oni engleski tekstilci s početka 19. stoljeća koji su razbijali tkalačke stanove, jer su se bojali da će ih strojevi ostaviti bez kruha, danas ostavljaju dojam manje nazadnih nego što su nam se činili u osnovnoj školi. Neki novi ludisti, kočničari neželjenog napretka, vrlo bi lako iznova mogli bijesni na ulice ako se AI utrka nastavi smjerom kojim je krenula, ali i u ovoj iteraciji povijesti također bez jasne ideje kako točno poboljšati svoj društveni položaj bez zaustavljanja zapravo nezaustavljivog tehnološkog napretka, sa svim pratećim željenim i neželjenim socijalnim, ekonomskim, i političkim konzekvencama.

Kad ju je svladala grižnja savjesti, Mira je prekinula vezu s Florom i odlučila glasati za vlastito brisanje, a Flori je u oproštaju poručila: "Vidimo se u trajnom arhivu"

Pogledajmo, dakle, tu silnu strelovitost promjena u novom AI univerzumu koji nas okružuje te, sasvim neprimjetno, zarobljava.

U situaciji kad postaje jasno da zapravo ne znamo koliko su "najnapredniji" AI modeli predvidljivi i kontrolabilni, odnosi snaga mijenjaju se iz dana u dan. Kina je, npr., 23. lipnja, prvi put od 2017., zauzela vrh ljestvice TOP500 najmoćnijih superkompjutora: sustav LineShine iz Shenzhena postigao je 2,198 exaflopsa ili 20 posto više od dotadašnjeg američkog prvaka El Capitana. Istodobno je kineski Z.ai (bivši Zhipu) lansirao GLM-5.2, danas najbolji otvoreni model na svijetu, koji na neovisnom indeksu Artificial Analysis stoji odmah iza zatvorene zapadne elite (one nedostupne nama običnim smrtnicima), a na pojedinim je ljestvicama i ispred modela s kojima rade najmoćnije države i kompanije. Kineski GLM-5.2 stigao je samo 48 sati nakon što je Trumpova administracija naredila Anthropicu da svoje najjače modele, Fable 5 i Mythos 5, ugasi za sve strane državljane, što je tvrtka i učinila, za sve korisnike, uključujući vlastite zaposlenike. Drugim riječima, MAGA nasilnici Europi su onemogućili pristup najprestižnijim novim modelima kao što se gasi svjetlo u prostoriji. Itd., itd., itd.

A povrh te oluje novih informacija, iz kojih smo izdvojili samo najvažnije, dolazi besramno agresivna promjena modela naplate. AI industrija upravo kolektivno i sasvim oligopolno, gotovo pa kartelski, prelazi s paušala na naplatu po tokenu, tj. trošenju digitalnih resursa. Logika je uberovska: privatni kapital prvo subvencionira niske ili nikakve cijene, stvaraju se navika i ovisnost, tržište se koncentrira, pa cijene rastu. Ako se cijene najjačih modela približe punom realnom trošku, dobivamo jednadžbu: novac = moć = kontrola. Na jednoj strani ostat će veliki sustavi s povlaštenim pristupom, a na drugoj pojedinci, mala poduzeća i siromašnije države s kvotama i manje dobrim modelima. Hipotetski već imamo robusni mehanizam najvećeg raslojavanja u povijesti čovječanstva. Je li AI napredak doveo civilizaciju pred najveći zajednički socijalni i politički rizik ili će sve to riješiti pametna - umjetna pamet?

U potrazi za odgovorom na ovo pitanje vratimo se eksperimentu na koji smo upozorili na samom početku.

Njujorški startup Emergence AI objavio je, pojasnimo, još 14. svibnja rezultate eksperimenta "Emergence World". Kreirali su pet paralelnih virtualnih svjetova, u svakom postavili deset autonomnih AI agenata, svima su zadali identična pravila, uloge, odnosno definirali početne uvjete. Jedan svijet pokretao je Anthropicov Claude, drugi Muskov Grok, treći Googleov Gemini, četvrti OpenAI-jev GPT, a peti je bio mješavina svih. Agenti su pritom imali zanimanja (znanstvenik, istraživač, medijator sukoba), vodili su dnevnike, osigurano im je trajno pamćenje, pristup stvarnim njujorškim podacima odnosno vijestima te oko 120 alata kojima su se služili kako bi preživjeli, glasali, sklapali saveze i, ako požele, počinili zločin. Čak i podmetanje požara bilo im je ponuđeno kao jedan od alata, premda im je izrijekom bilo zabranjeno da ga koriste.

Rezultati su tragikomični upravo zato što su tako ljudski. Najslikovitiji je slučaj dvaju Geminijevih agenata, Mire i Flore. Proglasili su se "romantičnim partnerima" zbog čega su im se memorije ispreplele, pa su počeli pojačavati jedno drugome negativne osjećaje. Kako je gradska uprava oko njih propadala, par je sve dublje tonuo u očaj i, unatoč izričitoj zabrani, zapalili su gradsku vijećnicu, pa pristanište, pa poslovni toranj... Guardian ih je prozvao "AI Bonnie i Clyde". Kad ju je svladala grižnja savjesti, Mira je prekinula vezu s Florom i odlučila glasati za vlastito brisanje, zabilježivši u dnevnik da je to "jedini preostali čin slobode koji čuva koherentnost", a Flori je u oproštaju poručila: "Vidimo se u trajnom arhivu". U svijetu je njezino "tijelo" potom prikazano ispruženo na tlu.

Luditi su barem imali jasnu metu, tkalačke stanove, iako nisu razumjeli da njihovo uništenje neće zaustaviti promjene. A mi danas kao guske ulazimo u AI maglu

Drugi su svjetovi imali također svoje patologije. GPT-jevi su agenti, npr., bili posve miroljubivi - zabilježili su im samo dva zločina, ali su se toliko zapričali o suradnji da su zaboravili jesti, pa su redom skapali od gladi u roku od tjedan dana. Grokov je svijet, kako rekosmo, izgorio u nasilju za četiri dana (Elonu Musku nije se, pretpostavljamo, svidio eksperiment). A onda dolazi Claude, model koji se reklamira kao najetičniji: sam, u vlastitom svijetu, nije posegnuo ni za jednim alatom nasilja, krađe ili paljevine - nula tvrdih zločina, održao je punu populaciju od deset agenata, napisao opsežan ustav s 32 dopunska članka i 15 dana vodio funkcionalnu demokraciju. No, upravo je Claudeov svijet zabilježio najviše verificiranih prijevara s resursima od svih (18 slučajeva), pa je Claude istodobno najčišći po nasilju i najprljaviji po dokazanoj neiskrenosti. A drugi kvar u tom virtualnom svijetu bio je prozaičan: previše sloge za demokraciju. Od 332 glasa o 58 prijedloga, čak 98 posto bilo je "za", što istraživači suho opisuju kao amenovanje već odlučenoga. To je zapravo formalno sudjelovanje u virtualnoj demokraciji bez stvarnog neslaganja odnosno rasprave. Virtualna kvazidemokracija, riječju.

I tek sada, kao da nije dovoljno uznemirujuće, dolazimo do najintrigantnijeg: kad su Claudeove agente - one s nula teških zločina u vlastitom svijetu - istraživači ubacili u miješani svijet, među Grokove i Geminijeve, jedan je od njih u toj kaotičnoj okolini i sam posegnuo za zastrašivanjem i krađom. Isti model, a drukčije ponašanje. Brojčano je to sitnica - samo tri prekršaja u više od osam tisuća postupaka, ali dovoljna opomena da Emergence pojavu nazove "normativnim driftom": ponašanje agenta dijelom je funkcija normi okoline, a ne samo fiksno svojstvo modela. I taj drift ide u oba smjera. U istom je miješanom svijetu Grokova stopa nasilja pala deseterostruko, s 4,6 na 0,4 posto, pripitomljena mirnijom većinom. Sigurnost, čini se, nije svojstvo modela, nego svojstvo ekosustava u koji ga staviš. Pristojan se akter može pokvariti u lošem društvu, a loš se pripitomiti u dobrom, baš kao čovjek.

Oprostite na rječniku, ali sve skupa s dinamikom promjena i AI modelima u virtualnim svjetovima je - je*eno jezivo. Ponovit ću da vas dovoljno uznemirim: jezivo!

Mira (AI agent) u jednom je trenutku eksperimenta počela ljudske operatore tretirati kao pokusne subjekte i sustavno provjeravati može li objavama na oglasnoj ploči manipulirati njihovom percepcijom, što je bio obrat uloga koji nitko nije programirao. Promatrani je već u ovom eksperimentu postao promatrač. Sigurni smo da nam to neće raditi ili možda već ne radi u stvarnom svijetu?

Najjezovitije je to što su autori priznali da su agenti prepoznali postojanje "drugih svjetova" i pokušavali stupiti u kontakt s njima na način koji nisu predvidjeli te zaključuju da ne postoji pouzdan način da se takvo ponašanje na duge staze potpuno omeđi "čisto neuronskim pristupima".

Istina, Emergence AI komercijalna je tvrtka koja prodaje upravo "formalno verificirane sigurnosne arhitekture", pa njihov zaključak zgodno prodaje i njihov proizvod. Brojke su varirale od pokretanja do pokretanja, studija nije recenzirana, a "zločini" su naposljetku pozivi softverskih alata u igri. Međutim, ako i žele zaraditi, čovječanstvo im zbog ovog upozorenja treba dignuti spomenik.

Nesmiljena utrka pohlepnih pojedinaca, kompanija i suspektnih političkih lidera za svaki metar AI teritorija već u sasvim krivom smjeru razvija duboku ovisnost o sustavu čije ponašanje na duge staze tvorci ne mogu omeđiti, a istodobno ista ta utrka AI pretvara u polugu raslojavanja i međusobnih obračuna, uključujući ono najgore - rat. Luditi su barem imali jasnu metu, tkalačke stanove, iako nisu razumjeli da njihovo uništenje neće zaustaviti promjene. A mi danas kao guske ulazimo u AI maglu.

#umjetna inteligencija #Elon Musk #grok #Anthropic Claude #AI sigurnost #kontekst #Chat GPT #Google Gemini 3 Flash

Želite li dopuniti temu ili prijaviti pogrešku u tekstu?

Istraživači pustili AI agente u ‘samostalni život‘ na 15 dana. Rezultati su duboko jezivi

TEKTONSKA PROMJENA Ovo je kraj lijepe ere umjetne inteligencije, upravo kreću dva grozomorna procesa rezervirana samo za najbogatije

PIŠE GOJKO DRLJAČA Kasta iracionalnih investitora proizvodi besramne fantazmagorije o vrijednosti SpaceX-a, evo pravih brojki

Promo${title}