Szerzők perelik az OpenAI-t és a Meta-t, mert szerzői joggal védett műveken tanították a modelleket
Szerzők perelik az OpenAI-t és a Meta-t, mert szerzői joggal védett műveken tanították a modelleket
Újabb mérföldkőhöz érkezett a mesterséges intelligencia fejlesztői és a tartalomgyártók közötti feszültség, miután Sarah Silverman humorista és két másik író pert indított az OpenAI és a Meta ellen. A vád szerint a technológiai óriások engedély nélkül, szerzői joggal védett irodalmi műveket használtak fel a ChatGPT és a LLaMA nyelvi modelljeinek tanításához. Ez a jogi lépés nem elszigetelt eset, hanem egy szélesebb körű ellenállás része, ahol az írók, művészek és kreatív szakemberek próbálják megvédeni szellemi tulajdonukat a generatív AI térnyerésével szemben. A felperesek szerint a modellek úgy lettek kalibrálva, hogy képesek legyenek rendkívül pontos összefoglalókat készíteni a műveikről, ami szerintük egyértelmű bizonyítéka annak, hogy az adatbázisok részét képezték a könyveik.
A per középpontjában különösen a Meta nyelvi modellje, a LLaMA áll, amelyet a kereset szerint olyan forrásokból tanítottak, mint a ThePile nevű hatalmas adathalmaz. Ez az adatbázis többek között a Bibliotik nevű „árnyékkönyvtárat” is használja forrásként, amely köztudottan illegális úton terjesztett digitális könyveket tartalmaz. A szerzők érvelése alapján ezek a vállalatok tudatosan használtak fel etikátlan vagy egyenesen illegális forrásokat a modellek fejlesztéséhez, megkerülve a licencdíjak megfizetését. Ez a jelenség az egész iparágat érinti: az elmúlt hetekben több más író is beperelte az OpenAI-t, miközben a vizuális művészek a Midjourney és a Stability AI ellen folytatnak hasonló jogi küzdelmet. Még Hollywoodban is pattanásig feszült a helyzet, ahol a forgatókönyvírók az AI használata ellen tiltakoznak, tartva attól, hogy az algoritmusok kiszorítják őket a kreatív munkafolyamatokból.
A helyzet súlyát az adja, hogy mára mindenki számára nyilvánvalóvá vált: ezek a nagy nyelvi modellek (LLM) hatalmas mennyiségű jogvédett tartalmat nyeltek el az internetről mindenféle előzetes engedélykérés vagy kompenzáció nélkül. A szakértők szerint a szituáció kísértetiesen emlékeztet a digitális korszak korábbi nagy csatáira, például a filmek és zenék illegális streamelésére vagy letöltésére. Bár a jogsértés ténye nehezen vitatható, a gyakorlat annyira elterjedtté és mélyen beágyazottá vált a technológiai ökoszisztémába, hogy szinte lehetetlennek tűnik a folyamat visszafordítása. A jelenlegi perek kimenetele döntő fontosságú lesz a jövőre nézve, hiszen meghatározhatják, hogy a nagyvállalatoknak kötelező lesz-e licencszerződéseket kötniük a szerzőkkel az adatok felhasználása előtt. Bár valószínűleg több peren kívüli egyezségre is számíthatunk a közeljövőben, a hagyományos tartalomvédelem egyre inkább vesztett csatának tűnik az AI-modellek telhetetlen adatéhségével szemben.
- A LLaMA-t állítólag a ThePile-on tanították, amely a Bibliotik nevű árnyékkönyvtárat használja
- A szerzők azt állítják, hogy a Bibliotik köztudottan „nyilvánvalóan illegális”
- A felperesek azzal érvelnek, hogy a modellek túlságosan hatékonyan foglalják össze a szerzői joggal védett könyveiket
Vakítóan nyilvánvaló, hogy ezek a modellek engedélykérés nélkül nyelik el a tartalmakat. DE: ez kicsit olyan, mint a filmek illegális streamelése — mindenki csinálja, és senki sem kerül bajba. További perekre és talán néhány egyezségre számíthatunk, de a tartalom védelme a digitális térben egyre inkább vesztett csatává válik. ---