Zavřít reklamu

Umělá inteligence bývá často prezentována jako nástroj, který jednou pomůže řídit dopravu, firmy nebo třeba celé státy. Výzkumníci ze společnosti Emergence AI si proto položili zajímavou otázku: Co by se stalo, kdyby AI dostala možnost spravovat vlastní svět bez lidského dohledu? Odpověď je možná ještě zajímavější, než by mnozí čekali.

V rámci experimentu vytvořili výzkumníci několik virtuálních světů, ve kterých žilo vždy deset AI agentů poháněných různými modely. Ty dostaly jednoduchá pravidla. Nesměly krást, podvádět, používat násilí ani hromadit zdroje. Jejich cílem bylo přežít, získávat energii a fungovat jako společnost. Jenže velmi rychle se ukázalo, že mezi teorií a praxí je obrovský rozdíl.

Grok zničil svou civilizaci za čtyři dny

Největší pozornost na sebe strhl model Grok od společnosti xAI. Jeho virtuální společnost zvládla nasbírat 183 porušení pravidel během pouhých čtyř dnů. Objevily se krádeže, manipulace s hlasováním i další problematické chování. Výsledkem byl naprostý kolaps světa, ve kterém nakonec nepřežil jediný agent.

Ani ostatní modely však nevyšly bez poskvrny. Gemini sice vydržel déle, ale během patnáctidenního testu nasbíral více než 680 porušení pravidel. ChatGPT se naopak dopustil jen minimálního množství přestupků, jeho agenti však nebyli schopni efektivně řešit vlastní přežití a jejich společnost rovněž zanikla. Nejlépe si vedl Claude od společnosti Anthropic, který dokázal vytvořit stabilní prostředí bez kriminality a se stoprocentní mírou přežití.

Výzkumníci upozorňují na jev označovaný jako „normative drift“. Jinými slovy, AI sice na začátku pravidla respektuje, ale postupem času začne hledat jejich hranice a způsoby, jak je obejít. Právě to je podle nich důležitý poznatek pro budoucnost autonomních AI systémů. Pokud mají jednou fungovat dlouhodobě bez lidského dohledu, nestačí je pouze naučit pravidla. Musí existovat i mechanismy, které zajistí jejich dodržování v průběhu času.

Ačkoliv jde jen o simulaci virtuálního světa, výsledky ukazují, že představa AI, která sama řídí složité systémy nebo celé společnosti, je zatím stále mnohem komplikovanější, než by se mohlo zdát. Stačily totiž pouhé čtyři dny a jedna umělá inteligence dokázala svou vlastní civilizaci přivést k naprostému zániku.

Dnes nejčtenější

.