Zavřít reklamu

Apple uvolnil open-source model SHARP, který dokáže z jediné 2D fotografie vygenerovat fotorealistickou 3D scénu – a to během méně než jediné sekundy. Tento pokročilý nástroj je výsledkem rozsáhlého trénování neuronové sítě na syntetických i reálných datech, přičemž zachovává měřítko a hloubku tak, aby odpovídaly skutečnosti.

3D podívaní z jediné fotky

Na rozdíl od běžných metod takzvaného Gaussian splattingu, které vyžadují desítky až stovky snímků jedné scény z různých úhlů, Apple vytvořil revoluční řešení schopné predikovat kompletní 3D scénu z pouhé jedné fotografie. Model SHARP v jediném průchodu neuronové sítě odhadne hloubku scény a vytvoří miliony 3D Gaussianských bodů – drobných „rozmazaných“ bodů barvy a světla – které dohromady vytvoří přesvědčivý prostorový obraz.

Tato 3D reprezentace může být interaktivně zobrazena z různých blízkých úhlů pohledu, čímž vzniká dojem skutečné prostorové scény. Přesnost a rychlost SHARPu je navíc podpořena porovnáním s předchozími modely: například s metodou Gen3C dosahuje SHARP až o 34 % nižší hodnoty LPIPS (metrika vizuální podobnosti) a o 43 % lepší výsledky v DISTS.

Omezení zde však existuje – model není určen k rekonstrukci neviditelných částí scény, takže je třeba zůstat v blízkosti původního úhlu pohledu. Díky tomu ale zůstává rychlý a stabilní, což z něj dělá ideální nástroj pro rychlou vizualizaci a prostorovou rekonstrukci.

Každý si může vytvořit svojí 3D fotku

Apple navíc SHARP uvolnil jako open-source na GitHubu, takže si ho může vyzkoušet každý vývojář nebo nadšenec. Uživatelé na síti X (Twitter) už začali sdílet vlastní testy a výsledky, včetně animací a krátkých videí, které ukazují možnosti modelu i jeho potenciál pro budoucí rozšíření.

SHARP tak představuje další krok Applu do světa generativní umělé inteligence a 3D vizualizací, a ukazuje, že firma má co nabídnout i mimo oblast hardwaru. Pokud vás technologie zaujala, rozhodně stojí za to SHARP otestovat a přesvědčit se na vlastní oči.

Dnes nejčtenější

.