Zavřít reklamu

Tým výzkumníků z Kalifornské univerzity v Berkeley tvrdí, že se jim podařilo replikovat klíčovou technologii, která stojí za populární umělou inteligencí DeepSeek. Na vše jim přitom stačil rozpočet pouhých 30$. Čínská společnost DeepSeek přitom stála za tím, že obří americké společnosti zaměřující se na AI odepsaly miliardy dolarů z hodnoty svých akcií. DeepSeek totiž ukázal, že to co dělají oni, dokáže tato společnost za výrazně nižší náklady na hardware, spotřebu elektrické energie a vody. Konkrétně její model R1 dokáže konkurovat systémům jako je ChatGPT za zlomek nákladů.

Tým z Berkeley na to reagoval ještě radikálněji, rozhodl se vytvořit ještě levnější alternativu AI a pod vedením doktoranta Jiayiho Pana vytvořil TinyZero, menší verzi modelu DeepSeek. Veškeré podklady pro TinyZero přitom univerzita zveřejnila na GitHubu, kde jsou volně dostupné pro každého, kdo má zájem se touto problematikou zabývat. I když TinyZero nedosahuje rozměrů hlavního modelu DeepSeeku, který má ohromujících 671 miliard parametrů, Pan tvrdí, že zachycuje podstatu chování DeepSeek modelu „R1-Zero“. Právě podstata jak AI od DeepSeek funguje je přitom tím hlavním o co se aktuálně ve světě AI jedná.

Jak funguje TinyZero?

TinyZero využívá takzvané posilované učení (reinforcement learning).  Tedy metodu, kdy AI začíná téměř s náhodnými odpověďmi a postupně se učí zlepšovat své výsledky pomocí oprav a vyhledávání správných řešení. Jednoduše to lze přirovnat ke hře Countdown, kdy hráči kombinují čísla tak, aby dosáhli cílové hodnoty. AI sice na začátku generovala nesmyslné odpovědi, ale nakonec dokázala samostatně pochopit pravidla a opravit své chyby. Skutečnost, že lze klíčovou AI technologii replikovat za několik dní práce a s náklady v řádu desítek dolarů, je šokující. Jde proti zavedené představě, že vývoj umělé inteligence vyžaduje rozsáhlá datová centra, tisíce výkonných GPU a investice v miliardách dolarů.

DeepSeek už dříve tvrdil, že trénink jeho hlavního modelu stál pouze několik milionů dolarů, což je podstatně méněnež u většiny západních AI firem. Nyní tým z Berkeley dokázal, že to lze udělat ještě levněji a to za pouhých 30 dolarů. Samozřejmě v této částce není započítán plat vědců, ale pouze náklady na hardware a energii. TinyZero sice ukazuje, že pokročilé posilované učení lze dělat levně, ale nedosahuje komplexnosti a škálovatelnosti většího systému DeepSeek. Zatím se jedná o koncept ukazující jistou možnost toho, jak může AI také fungovat, než skutečným konkurentem pro zavedené AI modely.

Změní se trh s umělou inteligencí díky DeeepSeek nebo TinyZero?

Zatím se jedná spíše o experiment, který však ledacos naznačuje. Pokud dokáží nezávislí vývojáři vytvářet pokročilé modely AI s minimálními náklady, můžou tyto technologie využít i obrovské společnosti jako je OpenAI, Google, Microsoft nebo mnoho dalších. Ty totiž doposud investovaly miliardy dolarů do svých AI modelů, datacenter a dalších technologií, které se AI souvisí. Může se náhle ukázat, že AI sektor je značně předražený a to, za co dnes platí tyto firmy miliardy dolarů lze jen díky použití jiného způsobu značně zlevnit. Mohou se tak objevit menší hráči, kteří zkrátka jen přinesou novou technologii, jak k AI přistupovat a mohou snadno konkurovat společnostem, které nyní těží zejména ze svých nekonečných budgetů. Vše ukáže až čas, ale jedno je jisté již nyní, je potřeba brát v potaz, že některé AI modely již dnes mohou fungovat se značně nižšími prostředky, než jak nám to ukazují zavedení hráči na trhu.

Související články

Dnes nejčtenější

.