Tim istraživača s kalifornijskog sveučilišta Berkeley tvrdi da je replicirao ključnu tehnologiju koja stoji iza popularne umjetne inteligencije DeepSeek. Imali su budžet od samo 30 dolara za sve. Kineska tvrtka DeepSeek odgovorna je za to što su divovske američke AI tvrtke otpisale milijarde dolara vrijednosti svojih dionica. DeepSeek je pokazao da ova tvrtka može raditi ono što radi uz znatno niže troškove hardvera, potrošnje električne energije i vode. Točnije, njegov model R1 može konkurirati sustavima kao što su ChatGPT za djelić cijene.
Tim s Berkeleyja odgovorio je još radikalnije, odlučivši stvoriti još jeftiniju AI alternativu te pod vodstvom doktoranda Jiayija Pana izradio TinyZero, manju verziju modela DeepSeek. Sve materijale za TinyZero osigurava sveučilište objavljeno na GitHubu, gdje su besplatno dostupni svima zainteresiranima za bavljenje ovom problematikom. Dok TinyZero zaostaje za veličinom DeepSeekovog glavnog modela, koji ima nevjerojatnih 671 milijardu parametara, Pan tvrdi da hvata bit DeepSeekovog "R1-Zero" ponašanja. Suština rada DeepSeekove umjetne inteligencije je glavna stvar o kojoj se trenutno raspravlja u svijetu umjetne inteligencije.
Kako TinyZero radi?
TinyZero koristi takozvano učenje s pojačanjem. Metoda u kojoj umjetna inteligencija počinje s gotovo nasumičnim odgovorima i postupno uči poboljšati svoje rezultate unošenjem ispravaka i pronalaženjem pravih rješenja. Može se jednostavno usporediti s igrom Countdown, gdje igrači kombiniraju brojeve kako bi postigli ciljanu vrijednost. Iako je umjetna inteligencija isprva generirala besmislene odgovore,onec je bila u stanju samostalno razumjeti pravila i ispraviti svoje pogreške. Činjenica da se ključna AI tehnologija može replicirati u nekoliko dana rada i po cijeni od nekoliko desetaka dolara je šokantna. Protivi se ustaljenom mišljenju da razvoj umjetne inteligencije zahtijeva velike podatkovne centre, tisuće moćnih grafičkih procesora i milijarde dolara ulaganja.
DeepSeek je ranije tvrdio da je obuka njegovog glavnog modela koštala samo nekoliko milijuna dolara, što je znatno manje od većine zapadnih AI tvrtki. Sada je tim s Berkeleya dokazao da se to može učiniti i jeftinije, za samo 30 dolara. Naravno, u ovaj iznos nisu uključene plaće znanstvenika, već samo troškovi hardvera i energije. Iako TinyZero pokazuje da se napredno učenje s potkrepljenjem može izvesti jeftino, ne zadovoljava složenost i skalabilnost većeg sustava DeepSeek. Za sada je to koncept koji pokazuje određenu mogućnost kako AI također može funkcionirati, a ne pravi konkurent etabliranim AI modelima.
Hoće li se tržište umjetne inteligencije promijeniti zahvaljujući DeeepSeek-u ili TinyZero-u?
Zasad je ovo više eksperiment, ali puno sugerira. Ako neovisni programeri mogu stvoriti napredne AI modele s miniUz niske troškove, ove tehnologije mogu koristiti i velike tvrtke kao što su OpenAI, Google, Microsoft ili mnogi drugi. Do sada su uložili milijarde dolara u svoje AI modele, podatkovne centre i druge tehnologije povezane s AI. Može se iznenada ispostaviti da je AI sektor značajno precijenjen i ono za što ove tvrtke danas plaćaju milijarde dolara može se značajno pojeftiniti samo korištenjem druge metode. To bi moglo dovesti do pojave manjih igrača koji jednostavno donose novu tehnologiju kako bi pristupili umjetnoj inteligenciji i lako se mogu natjecati s tvrtkama koje trenutno imaju koristi uglavnom od svojih snaga.oneproračuni. Vrijeme će pokazati, ali jedno je sada sigurno: potrebno je uzeti u obzir da neki AI modeli već sada mogu funkcionirati sa znatno manjim resursima nego što nam pokazuju etablirani igrači na tržištu.
Nije da mi od DeepSeek-a opet klecaju koljena. Gemini Google radi što mi treba, tu i tamo poslikam, a i odlično govori češki. Poslužit će jako dobro da istjera druge AI-je, ali to bi bila prekretnica...
Valjda ne razumijem članak... Što je točno nastalo za tih 30 dolara? Iz Githuba izgleda da je samo podskup R1 prikladan za igru odbrojavanja i množenja. Stoga usporedba cijene s punim modelom ne dolazi u obzir. Ne znam čak ni ima li istu arhitekturu, ali pretpostavljam da ima.
On i DeepSeek nisu ni približno tako loši. Samo mu dajte zadatak da riješi gdje se parabola susreće s exp.onencielou i tuče se razmišljajući o tome i na kraju ispljune potpunu glupost u sažetku. Dobar je za smišljanje priča, ali ako želite nešto analitički precizno, za sada dosta.