Zavřít reklamu

Apple čelí nové hromadné žalobě kvůli údajnému zneužití autorsky chráněných děl při trénování svého jazykového modelu pro Apple Intelligence. Žalobu podali spisovatelé Grady Hendrix a Jennifer Roberson u federálního soudu v Kalifornii.

Apple Intelligence z ukradených dat?

Podle podrobností zveřejněných agenturou Reuters se Apple údajně opíral o dataset s názvem Books3, který vychází z obsahu „stínové knihovny“ Bibliotik. Ta podle žaloby obsahovala tisíce pirátských kopií knih. Books3 byl krátce dostupný na platformě HuggingFace a později se stal součástí datasetu RedPajama, využívaného v modelech OpenELM. Ty Apple zpřístupnil v roce 2024.

Žalobci tvrdí, že pokud byl tento dataset použit pro vývoj OpenELM, je velmi pravděpodobné, že stejné postupy Apple využil i pro vývoj svých Foundation Language Models, které jsou základem Apple Intelligence.

Autoři zároveň upozorňují, že Apple se nepokusil kontaktovat ani odměnit autory knih, jejichž obsah měl být použit k trénování modelů. Požadují soudní řízení s porotou, náhradu škody, zničení modelů vytvořených s tímto datasetem a proplacení právních výdajů.

Apple dbá na soukromí a etice

Apple se dosud prezentoval jako firma, která si dává zvlášť záležet na etice AI. V minulosti uzavřel dohody s vydavateli a společností Shutterstock, aby mohl legálně využívat texty i obrázky pro trénink. Firma se také veřejně zavázala respektovat pravidla robots.txt a nevytěžovat obsah webů bez souhlasu majitelů.

Zda ale Apple skutečně využil pirátský obsah, bude nyní předmětem soudního přezkumu.

Dnes nejčtenější

.