Apple vylepšuje svou AI za pomoci Googlu! Podívejte se, co umí

30. 10. 2025

Apple překvapil technologickou komunitu vydáním rozsáhlého výzkumného datasetu Pico-Banana-400K, který obsahuje 400 000 obrázků určených pro trénink AI modelů zaměřených na úpravu fotografií podle textových instrukcí. Co je možná ještě překvapivější – k jeho vytvoření Apple využil modely Gemini-2.5 od Googlu.

Dataset má nekomerční výzkumnou licenci, což znamená, že jej mohou volně využívat akademici a výzkumníci po celém světě – ale nikoliv pro komerční účely. Součástí je i odborná studie zveřejněná na arXiv, která celý projekt detailně popisuje.

Vstoupit do galerie

Cílem projektu bylo odstranit nedostatky dosavadních datasetů, které často trpí nekonzistencí, nevyvážeností a nízkou kvalitou. Apple tedy vybral reálné fotografie z veřejného datasetu OpenImages, a navrhl 35 typů úprav rozdělených do osmi kategorií – např. změna počasí, přidání efektu filmu, přesun objektu nebo stylizace osoby.

Jak Pico-Banana-400K vznikal

Výzkumníci každý snímek nahráli do modelu „Nano-Banana“ (interní název pro Gemini-2.5-Flash-Image) spolu s jednou z úprav. Výstup pak analyzoval model Gemini-2.5-Pro a rozhodl, zda daná úprava splnila zadání a je vizuálně kvalitní. Vznikly tak nejen úspěšné editace, ale i příklady nevydařených pokusů, které poslouží k tréninku AI, aby se naučila rozpoznávat a vyvarovat se chyb.

Apple doufá, že Pico-Banana-400K se stane základním kamenem pro novou generaci modelů, které upravují obrázky podle textových pokynů s větší přesností a konzistencí. Dataset je již dostupný na GitHubu a může výrazně posunout vývoj AI v oblasti grafiky a vizuální tvorby.

Diskuze k článku

Vložte vlastní komentář Zrušit odpověď na komentář

Vaše jméno nebo Přihlásit se

Váš komentář

Vyplněním shora uvedených údajů beru na vědomí, že společnost TEXT FACTORY s.r.o., sídlem Brno, Durďákova 336/29, Černá Pole, PSČ: 613 00, IČ: 06157831, zapsané u Krajského soudu v Brně, oddíl C, vložka 100399, bude zpracovávat mé osobní údaje uvedené v rámci mnou vyplněného registračního formuláře na základě oprávněných zájmů TEXT FACTORY s.r.o. dle čl. 6 odst. 1 písm. f) GDPR a pro splnění právních povinností (čl. 6 odst. 1 písm. c) GDPR), a to pro tyto účely: nezbytnost zajistit oprávnění návštěvníka webových stránek provozovaných společností TEXT FACTORY s.r.o. přispívat aktivně ke zveřejněným článkům nebo v rámci diskusních fór a výkon práv TEXT FACTORY s.r.o. jako administrátora těchto diskusních fór. Více informací o zpracování osobních údajů a právech lze nalézt v Poučení o ochraně osobních údajů. celý text

Dnes nejčtenější

Apple se chystá na největší proměnu iPhonu v jeho historii

iOS 27 datum představení je venku! Apple oficiálně oznámil termín WWDC 2026

WhatsApp chystá revoluci v komunikaci! iPhone vám přeloží zprávy v reálném čase, a to i offline

Nejčtenější