Zavřít reklamu

Apple se příští týden chystá na významnou konferenci o počítačovém vidění, která se koná každoročně pod názvem IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Akce se letos uskuteční od 11. do 15. června v americkém Nashvillu. Na místě představí tři odborné ukázky.

Tři studie a praktická ukázka FastVLM

Mezi hlavními novinkami, které Apple na konferenci představí, je model FastVLM. Ten nabízí efektivní vizuální kódování pro modely kombinující obraz a jazyk, přičemž dramaticky urychluje práci s vysoce kvalitními snímky při použití menšího počtu vizuálních tokenů.

Dále firma ukáže model Matrix3D, který usnadňuje vytváření 3D obsahu, a to i tehdy, pokud jsou tréninková data neúplná.

Třetím modelem je World-Consistent Video Diffusion with Explicit 3D Modeling, který zlepšuje konzistenci ve 3D prostoru a umožňuje přesnější predikce 3D struktury, i když není známá poloha kamery.

Konference CVPR je v oblasti počítačového vidění považována za jednu z nejprestižnějších. Vznikla v roce 1983 a patří mezi nejnáročnější konference v oboru — méně než 5 % příspěvků je vybráno k ústní prezentaci. Apple bude svůj model FastVLM ukazovat ve třech termínech a to v pátek 13. června, následující sobotu a také v neděli.

Apple je lídrem

Dalším zajímavým faktem je, že více než 20 vývojářů spojených s Applem figuruje v seznamu recenzentů konference. To dokazuje, jak hluboce se firma snaží integrovat do akademického prostředí v oblasti umělé inteligence a počítačového vidění.

Tento krok potvrzuje, že Apple pokračuje v budování své pozice v oblasti AI a počítačového vidění, kde konkurence neustále roste. Výzkumné týmy společnosti tak přispívají nejen technologickým produktům, ale i celosvětové komunitě odborníků na AI. S napětím budeme sledovat, jaké další inovace Apple v tomto segmentu přinese.

Dnes nejčtenější

.