„A szellemi tulajdon példátlan mértékű lopása”
2025. szeptember 4.
Minden ismert mesterséges intelligencia-alkalmazás betanításához jogvédett tartalmakat használtak – bizonyítják a zeneműkiadók szervezete által gyűjtött adatok. Köztük vannak azok az ismert cégek is, amelyek ezt tagadják, vagy az üzleti titokra hivatkozva semmit nem árulnak el semmit a betanításhoz használt adatokról. Közben az MI-cégek a saját tartalmaikra egészen más mércét alkalmaznak.
Minden ismert MI-alkalmazás jogvédett tartalmakat használt
Két éven keresztül gyűjtött bizonyítékokat a generatív mesterséges intelligencia-alkalmazásokról a zeneműkiadók nemzetközi szervezete, az ICMP. Így „átfogó és világos” kép rajzolódik ki arról, hogy gyakorlatilag az összes ismert MI-alkalmazást jogvédett tartalmakon tanítottak be – írja a Billboard az alapján, hogy az újságok közt egyedül betekintést kapott a szervezettől az anyagba.
A nyilvánosan hozzáférhető adatok, a betanításhoz mindenki számára elérhető adathalmaz-gyűjtemények, publikált kutatási tanulmányok, kiszivárgott adatok és független MI-szakértők elemzései alapján az ICMP bizonyítottnak látja, hogy korábbinál nem sejtett mértékű, „globális és igen széles körű” volt a jogvédett tartalmak felhasználása.
Ez azért fontos, mert gyakran az MI-cégek üzleti titokként kezelik a betanításhoz felhasznált anyagokat; tagadják vagy legalábbis elkenik azt a kérdést, hogy vannak-e köztük jogvédett tartalmak. A legismertebb zeneíró alkalmazásokról először az alapján lehetett tudni, hogy használtak jogvédett zenéket, hogy rá lehetett venni ezeket ismert slágerekhez nagyon hasonló zenék előállítására. A Suno vezetője azután ismerte el a tényt, miután a nagy kiadók beperelték.
Az ICMP részletes adatai többek között a következőket tartalmazzák:
- A Suno és az Udio a YouTube-ról szerzett zenéket.
- Az OpenAI, a Google, a Meta, az X, az Anthropic és a kínai DeepSeek nagy nyelvi modelljei különböző forrásokból rengeteg dalszöveget használtak fel. (Az ICMP szerint a zeneszerzők, szövegírók jogainak semmibe vételében a Grokot fejlesztő X jár az élen.)
- A Midjourney képalkotó MI betanításához használt anyagok között lemezborítók is szerepeltek.
Az ICMP igazgatója szerint valójában nem másról van szó, mint „a szellemi tulajdon a történelemben ismert legnagyobb lopásáról – és ez nem túlzás. Napi szinten tízmilliós nagyságrendben történik a jogsértés”, gyakran olyan cégek részéről, amik tagadják ezt, de a bizonyítékok ellenük szólnak.
„Ez nem egy olyan lopás, aminek nincs áldozata” – hangsúlyozta a Billboardnak az ICMP-tag Concord szóvivője; a fejlesztett MI eszközöket a szövegírók „kiváltására” használják, a szerzők jogdíjai csökkennek. Az eddigi legnagyobb, a CISAC által megrendelt tanulmány már 2024 végén arra jutott, hogy szabályozás nélkül az MI-eszközök a szerzők bevételeinek 24%-os csökkenéséhez vezethetnek.
Kettős mérce
Az ICMP arra is felhívta a figyelmet, hogy miközben mások szellemi tulajdonát szabadon hozzáférhető anyagként kezelik az MI-fejlesztők, ha az ő szellemi tulajdonukról van szó, akkor egészen másként járnak el. Összegyűjtötték a legnagyobb tech cégek olyan szövegeit, amelyek előzetes írásbeli engedélyhez kötik az általuk létrehozott tartalmak összegyűjtését, másolását, nyilvánosságra hozatalát.
A szervezet szerint abban is tetten érhető a kettős mérce, hogy az MI-fejlesztők az átláthatóságra vonatkozó követeléseket – amelyek például az EU-s MI-rendeletbe is bekerültek – túlzónak tartják, arra hivatkozva, hogy milyen nehéz összegyűjteni és megosztani a felhasznált tartalmak metaadatait.
Ehhez képest az ICMP-nek van bizonyítéka arra, hogy valójában a betanításhoz használt zenei tartalmakat a rendszerek részletes metaadatok kíséretében gyűjtik be. Az audio mellett számon tartják a dal- és albumcímeket, előadókat, szerzőket, műfajt, szöveget, tempót és a megjelenés évét is. Azt is feltárták, hogy a YouTube-ról, Spotify-ról ezeknek az adatoknak a kíséretében gyűjtik be a zenéket egyes alkalmazások.
Döntéshozók és perek
A számos nagy és független zeneműkiadót – és a világrepertoár kb. 90%-át – képviselő ICMP nem hozta nyilvánosságra az említett anyagot, viszont az elmúlt másfél évben tucatnyi döntéshozónak, kormányzati képviselőnek mutatták meg, hogy mit találtak. Emellett a jogsértésben érintett cégekkel is megosztottak adatokat, segítve a jogászaik munkáját.
Mint arra a Billboard figyelmeztet, nem pusztán az a kérdés, hogy használtak-e engedély nélkül az MI-alkalmazások jogvédett tartalmakat, hiszen a standard érvelésük az, hogy ez ún. méltányos használat (fair use) volt. Az első, erre vonatkozó bírósági ítéleteket egyelőre nem konzisztensek (részletesen itt írtunk erről). További probléma az, hogy a méltányos használat egy specifikusan az Egyesült Államokban létező jogi fogalom. Az EU-s szabályozás explicit módon kimondja, hogy az itt használható MI-alkalmazásoknak akkor is meg kell felelniük az európai előírásoknak, ha a fejlesztést, betanítást máshol végezték.
Nyitókép: CISAC