Vita az internetes adatokat lekaparó AI-cégek körül
Komoly vita bontakozott ki a technológiai világban az internetes adatokat lekaparó AI-cégek gyakorlata körül. Évtizedek óta létezik a weboldalakon egy robots.txt nevű kódrészlet, amely hagyományosan úgy működik, mint egy múzeumi őr: azt üzeni a látogatóknak, hogy szabadon nézhetik az oldalt, de semmit sem vihetnek el onnan. A TollBit nevű tartalomlicencelő startup legfrissebb adatai szerint azonban az AI-cégek mostanában hajlamosak figyelmen kívül hagyni ezt a régi konvenciót, és záróra után osonnak be a digitális múzeumokba, hogy egyenesen a falról emeljék le a szerzői joggal védett tartalmakat. Ez a jelenség alapjaiban kérdőjelezi meg az internetes tartalomgyártás eddigi szabályait.
A konfliktus nemrégiben kapott nagyobb nyilvánosságot, amikor a Wired és a Forbes technológiai szaklapok azzal vádolták meg a Perplexity AI-platformját, hogy egyes cikkeiket megfelelő forrásmegjelölés nélkül emelte át, majd tette közzé a saját felületén. A TollBit jelentése alapján azonban a probléma messze túlmutat egyetlen platformon. A kiadói naplófájlok elemzése során kirajzolódó minták szerint úgy tűnik, hogy az OpenAI, az Anthropic és más nagy vállalatok is rendszeresen figyelmen kívül hagyják a robots.txt konvencióit. Bár az OpenAI a Business Insider megkeresésére úgy nyilatkozott, hogy minden új modell tanítása során figyelembe veszik a webes engedélyeket, a feldolgozott adatok egyértelmű mintázatot mutatnak.
Az érintett AI-vállalatok azzal védekeznek a vádak ellen, hogy rendszereik csupán hivatkoznak a harmadik felektől származó tartalmakra, nem pedig teljes egészében lemásolják azokat. Ezt a gyakorlatot ahhoz hasonlítják, mintha egy fotót mutatnának a múzeumban lévő műalkotásról, arra biztatva az embereket, hogy látogassanak el az eredeti helyszínre és nézzék meg azt élőben. A jogi kimenetel valószínűleg azon a kérdésen múlik majd, hogy a mesterséges intelligencia modellek valóban képesek-e teljesen új tartalmat létrehozni, vagy csupán a már megismert, meglévő információkat rendezik át egy új formába.
A helyzet tisztázása azért rendkívül fontos, mert sok múlik majd azon, hogyan értelmezi az AI által generált tartalmat a Kongresszus és a Legfelsőbb Bíróság. Ahhoz, hogy hosszú távon is megfeleljenek a szerzői jogi törvényeknek, az AI-cégeknek valószínűleg hitelt érdemlően be kell bizonyítaniuk, hogy modelljeik valóban valami újat hoznak létre, nem csak a már megismert tartalmakat rendezik át. Ez a döntés alapjaiban határozhatja meg a jövő technológiai fejlesztéseit és a tartalomkiadók gazdasági túlélését.
- A Wired és a Forbes állítása szerint a Perplexity megfelelő forrásmegjelölés nélkül tette közzé cikkeiket
- A TollBit jelentése alapján az OpenAI, az Anthropic és mások is figyelmen kívül hagyják a robots.txt konvencióit
- Az AI-cégek azzal védekeznek, hogy csak „hivatkoznak” a tartalomra, nem pedig teljes egészében másolják azt
- A jogi kimenetel valószínűleg azon múlik majd, hogy a modellek új tartalmat hoznak-e létre, vagy csak a meglévőt rendezik át
Sok múlik majd azon, hogyan értelmezi az AI által generált tartalmat a Kongresszus és a Legfelsőbb Bíróság. Ahhoz, hogy megfeleljenek a szerzői jogi törvényeknek, az AI-cégeknek valószínűleg be kell bizonyítaniuk, hogy modelljeik valóban valami újat hoznak létre, nem csak a már megismert tartalmakat rendezik át. ---