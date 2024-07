Na začátku týdne se technologickým světem prohnala poměrně znepokojivá zpráva o tom, že některé velké technologické společnosti využívaly k tréninku jejich AI modelů titulky z YouTube, aniž by k tomu dali tvůrci jejich videí souhlas. Jedním z těchto gigantů měl být i Apple, u kterého se zprvu tvrdilo, že takto získaná data, která však nestáhl on, ale jistý startup, čímž byl kalifornský gigant de facto kryt, využíval i k tréninku Apple Intelligence. To však nyní Apple ve svém prohlášení pro 9to5mac popřel.

Apple sice potvrdil, že k trénování svých open-source modelů OpenELM, které jsou dostupné na internetu k volnému použití, skutečně tento soubor titulků z YouTube stažený startupem použil, neměl však jednak ponětí, že se jedná o tímto způsoben získaná data a jednak jej ani k ničemu dalšímu než tréninku open-source řešení nepoužil. A jelikož OpenELM vytvořil dle svých slov jako způsob, jak přispět výzkumné komunitě v pokroku na poli AI a celkově tedy pokročit ve vývlji velkého jazykového modelu s otevřeným zdrojovým kódem, je použití tréninkových dat, jejichž původ byl ne zcela ověřený, do jisté míry odpustitelný.

Co se pak týče Apple Intelligence a modelů, které jsou pro její provoz používány, Apple říká, že v tomto případě je vše trénováno na licencovaných datech včetně dat vybraných pro konkrétní vylepšení specifických funkcí. U produktu, který je komerční, tedy kontroverze s použitím prazvláštně získaných dat nehrozí.