Apple čelí nové hromadné žalobě kvůli údajnému zneužití autorsky chráněných děl při trénování svého jazykového modelu pro Apple Intelligence. Žalobu podali spisovatelé Grady Hendrix a Jennifer Roberson u federálního soudu v Kalifornii.
Apple Intelligence z ukradených dat?
Podle podrobností zveřejněných agenturou Reuters se Apple údajně opíral o dataset s názvem Books3, který vychází z obsahu „stínové knihovny“ Bibliotik. Ta podle žaloby obsahovala tisíce pirátských kopií knih. Books3 byl krátce dostupný na platformě HuggingFace a později se stal součástí datasetu RedPajama, využívaného v modelech OpenELM. Ty Apple zpřístupnil v roce 2024.
Žalobci tvrdí, že pokud byl tento dataset použit pro vývoj OpenELM, je velmi pravděpodobné, že stejné postupy Apple využil i pro vývoj svých Foundation Language Models, které jsou základem Apple Intelligence.
Autoři zároveň upozorňují, že Apple se nepokusil kontaktovat ani odměnit autory knih, jejichž obsah měl být použit k trénování modelů. Požadují soudní řízení s porotou, náhradu škody, zničení modelů vytvořených s tímto datasetem a proplacení právních výdajů.
Apple dbá na soukromí a etice
Apple se dosud prezentoval jako firma, která si dává zvlášť záležet na etice AI. V minulosti uzavřel dohody s vydavateli a společností Shutterstock, aby mohl legálně využívat texty i obrázky pro trénink. Firma se také veřejně zavázala respektovat pravidla robots.txt a nevytěžovat obsah webů bez souhlasu majitelů.
Zda ale Apple skutečně využil pirátský obsah, bude nyní předmětem soudního přezkumu.