Modely ChatGPT o3 a o4-mini ukazují, že AI už zdaleka není jen o psaní textů nebo generování obrázků. Díky pokročilým schopnostem analýzy obrazu, jako je ořezávání, přibližování a otáčení, dokážou tyto modely získávat vizuální podněty a na jejich základě odhalit konkrétní místa. A to i bez běžně dostupných dat jako jsou EXIF informace nebo GPS souřadnice. Jak upozornil web Vocal Media, uživatelé experimentují s tím, že ChatGPT posílají snímky měst, památek či interiérů restaurací. A model o3 často správně identifikuje nejen města, ale dokonce i konkrétní podniky či místa, která nejsou nijak označena.
Mohlo by vás zajímat
Zkušenost vývojáře Simona Willisona, který funkci testoval, popisuje tuto záležitost jako znepokojivou. Na svém blogu uvedl, že o3 po počátečních problémech začal analyzovat fotografii auta s rozmazanou SPZ. Postupným přibližováním a dedukcí dokázal model přesně určit lokalitu, a sice El Granadu v Kalifornii. Willison dodal, že jiné modely v podobě Gemini nebo Claude se takto pokročilé analýze ani nepřiblížily. Podle webu AIbase je síla o3 v tom, že kombinuje vizuální zpracování s generováním kódu, čímž umožňuje podrobnější a přesnější analýzu. Model tak například dokáže vytvořit mapu podle nápisů, tvarů silnic nebo architektury a odvodit, kde se snímek nachází. Willison, že lidé by měli vědět, že jakákoli fotografie, kterou sdílí na sociálních sítích, může být použita k identifikaci jejich polohy.