Zavřít reklamu

Apple vyvíjí AI technologii, která převádí běžné fotky na 3D modely. Novinka slibuje rychlé a přesné výsledky i bez specializovaného vybavení.

Apple v nové výzkumné práci popisuje technologii, která umožňuje vytvořit realistický 3D model objektu pouze na základě několika běžných fotografií. Tato metoda, označovaná jako „3D Gaussian Splatting with DiT“, využívá pokročilé strojové učení a představuje výrazný posun oproti předchozím postupům.

Výzkum dokumentuje systém, který dokáže vygenerovat 3D reprezentaci i z takových zdrojů, jako jsou snímky z běžné iPhone kamery. Cílem je zjednodušit celý proces 3D rekonstrukce bez nutnosti speciálního vybavení nebo rozsáhlého počtu snímků z různých úhlů.

Co je Gaussian Splatting?

Tato metoda využívá koncept „splattingu“ – tedy rozprostírání trojrozměrných dat do 2D roviny, přičemž se zachová iluze hloubky a prostorovosti. Apple vylepšil tento přístup přidáním tzv. DiT modelu (Denoising Diffusion Transformer), který během učení optimalizuje rozmístění jednotlivých 3D bodů.

matrix3d inference pipeline.jpg

Výsledkem je výrazně rychlejší a přesnější převod 2D fotografií do plnohodnotného 3D modelu. Podle výzkumu Apple se jejich metoda dostává blízko kvalitě fotogrammetrie, ale s podstatně menšími nároky na zdrojová data i výpočetní výkon.

Kam tím Apple míří?

Ačkoliv zatím nejde o komerčně dostupnou technologii, její možné využití je široké – od vylepšení funkce Apple Vision Pro, přes rozšířenou realitu až po pokročilé nástroje pro tvůrce obsahu nebo e-commerce. Možné je i budoucí využití v aplikacích pro iPhone nebo iPad.

Apple v posledních letech výrazně investuje do výzkumu AI a tato práce je dalším důkazem, že firma nechce zůstat pozadu. Výsledky této studie jsou veřejně dostupné na portálu arXiv.

Dnes nejčtenější

.