Vědci dokázali reprodukovat základní technologii DeepSeek, stačilo k tomu 30$

3. 2. 2025

Tým výzkumníků z Kalifornské univerzity v Berkeley tvrdí, že se jim podařilo replikovat klíčovou technologii, která stojí za populární umělou inteligencí DeepSeek. Na vše jim přitom stačil rozpočet pouhých 30$. Čínská společnost DeepSeek přitom stála za tím, že obří americké společnosti zaměřující se na AI odepsaly miliardy dolarů z hodnoty svých akcií. DeepSeek totiž ukázal, že to co dělají oni, dokáže tato společnost za výrazně nižší náklady na hardware, spotřebu elektrické energie a vody. Konkrétně její model R1 dokáže konkurovat systémům jako je ChatGPT za zlomek nákladů.

Tým z Berkeley na to reagoval ještě radikálněji, rozhodl se vytvořit ještě levnější alternativu AI a pod vedením doktoranta Jiayiho Pana vytvořil TinyZero, menší verzi modelu DeepSeek. Veškeré podklady pro TinyZero přitom univerzita zveřejnila na GitHubu, kde jsou volně dostupné pro každého, kdo má zájem se touto problematikou zabývat. I když TinyZero nedosahuje rozměrů hlavního modelu DeepSeeku, který má ohromujících 671 miliard parametrů, Pan tvrdí, že zachycuje podstatu chování DeepSeek modelu „R1-Zero“. Právě podstata jak AI od DeepSeek funguje je přitom tím hlavním o co se aktuálně ve světě AI jedná.

Jak funguje TinyZero?

TinyZero využívá takzvané posilované učení (reinforcement learning). Tedy metodu, kdy AI začíná téměř s náhodnými odpověďmi a postupně se učí zlepšovat své výsledky pomocí oprav a vyhledávání správných řešení. Jednoduše to lze přirovnat ke hře Countdown, kdy hráči kombinují čísla tak, aby dosáhli cílové hodnoty. AI sice na začátku generovala nesmyslné odpovědi, ale nakonec dokázala samostatně pochopit pravidla a opravit své chyby. Skutečnost, že lze klíčovou AI technologii replikovat za několik dní práce a s náklady v řádu desítek dolarů, je šokující. Jde proti zavedené představě, že vývoj umělé inteligence vyžaduje rozsáhlá datová centra, tisíce výkonných GPU a investice v miliardách dolarů.

DeepSeek už dříve tvrdil, že trénink jeho hlavního modelu stál pouze několik milionů dolarů, což je podstatně méněnež u většiny západních AI firem. Nyní tým z Berkeley dokázal, že to lze udělat ještě levněji a to za pouhých 30 dolarů. Samozřejmě v této částce není započítán plat vědců, ale pouze náklady na hardware a energii. TinyZero sice ukazuje, že pokročilé posilované učení lze dělat levně, ale nedosahuje komplexnosti a škálovatelnosti většího systému DeepSeek. Zatím se jedná o koncept ukazující jistou možnost toho, jak může AI také fungovat, než skutečným konkurentem pro zavedené AI modely.

Změní se trh s umělou inteligencí díky DeeepSeek nebo TinyZero?

Zatím se jedná spíše o experiment, který však ledacos naznačuje. Pokud dokáží nezávislí vývojáři vytvářet pokročilé modely AI s minimálními náklady, můžou tyto technologie využít i obrovské společnosti jako je OpenAI, Google, Microsoft nebo mnoho dalších. Ty totiž doposud investovaly miliardy dolarů do svých AI modelů, datacenter a dalších technologií, které se AI souvisí. Může se náhle ukázat, že AI sektor je značně předražený a to, za co dnes platí tyto firmy miliardy dolarů lze jen díky použití jiného způsobu značně zlevnit. Mohou se tak objevit menší hráči, kteří zkrátka jen přinesou novou technologii, jak k AI přistupovat a mohou snadno konkurovat společnostem, které nyní těží zejména ze svých nekonečných budgetů. Vše ukáže až čas, ale jedno je jisté již nyní, je potřeba brát v potaz, že některé AI modely již dnes mohou fungovat se značně nižšími prostředky, než jak nám to ukazují zavedení hráči na trhu.

Diskuze k článku

Holeček

5. 2. 2025 15:51

Že by se mi zase z DeepSeeku podlamovaly kolena, to ne. Gemini od Google dělá co potřebuju, sem tam si udělám nějaký obrázek, i česky umí velmi dobře. Na prohnání ostatních AI poslouží velmi dobře, ale že by to byl nějaký zlom…

Odpovědět

Marek

6. 2. 2025 17:49

Asi článek nechápu… Co přesně za těch 30 dolarů vzniklo? Z Githubu to vypadá, že jen subset R1 vhodný jen na hru countdown a násobení. Takže srovnávat to cenově s plným modelem je dost mimo. Ani nevím, jestli to má stejnou architekturu, ale předpokládám, že ano.

Odpovědět

Drakor

8. 2. 2025 7:22

On i ten DeepSeek není zdaleka takové terno. Stačí mu zadat vyřešit úlohu kde se potkají parabola s exponencielou a umlátí se tím přemýšlením a na konci ve shrnutí vyplivne úplné blbosti. Na vymýšlení povídek je dobrý, ale pokud chcete něco analyticky přesně, tak dost naprd.

Odpovědět

Vložte vlastní komentář Zrušit odpověď na komentář

Vaše jméno nebo Přihlásit se

Váš komentář

Vyplněním shora uvedených údajů beru na vědomí, že společnost TEXT FACTORY s.r.o., sídlem Brno, Durďákova 336/29, Černá Pole, PSČ: 613 00, IČ: 06157831, zapsané u Krajského soudu v Brně, oddíl C, vložka 100399, bude zpracovávat mé osobní údaje uvedené v rámci mnou vyplněného registračního formuláře na základě oprávněných zájmů TEXT FACTORY s.r.o. dle čl. 6 odst. 1 písm. f) GDPR a pro splnění právních povinností (čl. 6 odst. 1 písm. c) GDPR), a to pro tyto účely: nezbytnost zajistit oprávnění návštěvníka webových stránek provozovaných společností TEXT FACTORY s.r.o. přispívat aktivně ke zveřejněným článkům nebo v rámci diskusních fór a výkon práv TEXT FACTORY s.r.o. jako administrátora těchto diskusních fór. Více informací o zpracování osobních údajů a právech lze nalézt v Poučení o ochraně osobních údajů. celý text

Dnes nejčtenější

Unikl údajný vzhled iPhone 20! Tato pecka má dorazit už příští rok

Apple rozšiřuje zdravotní funkce Watch a AirPods

Apple chystá tajemnou AI novinku. Nová doména před WWDC budí velká očekávání

Nejčtenější

Vědci dokázali reprodukovat základní technologii DeepSeek, stačilo k tomu 30$

Jak funguje TinyZero?

Změní se trh s umělou inteligencí díky DeeepSeek nebo TinyZero?

Diskuze k článku

Vložte vlastní komentář Zrušit odpověď na komentář

Související

Dnes nejčtenější

Unikl údajný vzhled iPhone 20! Tato pecka má dorazit už příští rok

Apple rozšiřuje zdravotní funkce Watch a AirPods

Apple chystá tajemnou AI novinku. Nová doména před WWDC budí velká očekávání

Nejčtenější