Az AI nem segíti a kreativitást, hanem megpróbálja leváltani
2026. január 21.
A gondolat teremtő erő. Ott rejlik az alkotásban is. A Dalszerzőben ezért olyan sorozatot indítunk, amelyben dedikált szakmai tapasztalatból megszólaló kreatívipari szereplők fejtik ki gondolataikat égető aktuális kérdésekben. A Véleményformálóval megpróbáljuk megérteni a jelenségeket és megoldást találni a kihívásokra a zeneiparon innen és túl.
Véleményformáló op. 1: Rónai András a mesterséges intelligenciáról.
A generatív AI valójában segíti a kreativitást azzal, hogy „a fárasztó aprómunkát” átveszi az embertől – állítják a technológia támogatói. Ez az elgondolás azonban a kreativitás alapvető félreértésén alapul, hiszen annak az „aprómunka” lényegi része. Szerencsére a zeneíró AI eddig nem igazán sikeres abban, amire elvben létrehozták.
Túl jogosításon, monetizáción és számos, amúgy nagyon fontos kérdésen, a generatív AI fő kérdése valójában az, hogy mi a kreativitás, és hogy segíti vagy gátolja-e ezt az a környezet, amit éppen most alakítanak ki és át a legnagyobb hatalmú cégek és azok vezetői, akik a kreativitást csak hírből ismerik.
Azt mondják, holmi statisztikai adatok nem tudják megváltoztatni az emberek gondolkodását. Nos, legalább egy kivétel létezik: az AI zeneírással kapcsolatos gondolkodásomat legalábbis árnyalta néhány új adat, amit nemrég olvastam. De előbb jöjjön a kirohanás.
A kreativitás valójában / a kreativitás, amilyennek az AI prófétái hiszik
Az egyik legidegesítőbb dolog a mesterséges intelligenciában (ha az emberiség potenciális megsemmisítését most nem számítjuk) az a diskurzus, ami arról szól, hogyan segíti a kreativitást az AI – miközben valójában gyakran a kreativitás leváltását értik ezalatt.
Szerencsére van erről egy tökéletes megfogalmazás, ráadásul a legismertebb zeneíró AI, a Suno alapító-vezérigazgatója, Mikey Shulman mondta 2025 januárjában: „Most [mármint a Suno előtti világkorszakban, ami szerencsére véget ért] nem igazán élvezetes zenét csinálni. Rengeteg idő kell hozzá, rengeteg gyakorlás, magas szinten el kell sajátítanod egy hangszer vagy egy szoftver használatát. Szerintem jelenleg a legtöbb ember nem élvezi annak az időnek a nagy részét, amit zenekészítéssel tölt.”
Most tekintsünk el attól, hogy az ezek szerint rengeteg szenvedés árán született zenéket a Suno úgy használta fel, hogy még arra sem vetemedett, hogy szóljon erről a szenvedő alkotóknak, az engedélykérésről, netán kompenzációról nem is beszélve. Koncentráljunk arra, amit a 404 Media kommentárja így fogalmazott meg frappánsan: Shulman „nem érti vagy úgy csinál, mintha nem értené, hogy mi a zene, miért foglalkoznak az emberek művészettel és hogy egyáltalán mit jelent elsajátítani és magas szintre fejleszteni egy készséget”.
Ennek a gondolkodásnak a kevésbé éles, de gyakoribb megfogalmazása az, hogy az AI eszközök engedik az embert az alkotás „kreatív részére” koncentrálni, azzal, hogy a „fárasztó aprómunkát” átveszik tőle. Így sokkal rokonszenvesebb, nem?
Ám ez a megközelítés is ugyanannyira téves képet fest a kreativitásról, mint Shulman elszólása. Én ugyan nem írok dalokat, sőt, irodalmat (fikciót, lírát) sem, csak cikkeket, kritikákat, olykor tanulmányokat, amiket talán nem szokás a legeminensebben kreatív műfajoknak tartani. Mégis biztos vagyok benne, hogy az, amit a kreativitásról tapasztalok, ugyanúgy vagy talán még jobban is megjelenik a zeneírásban is.
A kreativitás nem az, hogy „erről a témáról fogok írni”. A kreativitás az, hogy megírom a szöveget. Igen: az, hogy megírom az összes mondatot. Pont, hogy maga az aprómunka: az adott mondat adott pontján a megfelelő szó használata (vagy: hang, hangszín, frazírozás, effektezés stb.); a szöveg (dal, szobor, balettelőadás) felépítésének kitalálása, adott esetben újragondolása, vagy újra- és újra- és újragondolása; az újraolvasás, annak észrevételezése, hogy ezt itt lehetne jobban mondani; kitalálni, hogyan lehet jobban mondani (sokszor még nehezebb, mint az első változat megírása).
A sémák, könnyen alkalmazható szabályok elsajátítása, begyakorlása, ami után következhet az, hogy az ember azt is tudja, hogy mikor és hogyan lehet és érdemes eltérni ezektől. Hogy egy lemezkritikát általában úgy kezdünk, hogy kontextualizáljuk az alkotót, aztán a diszkográfiáján belül elhelyezzük az adott albumot – de most ezt úgy fogom kezdeni, hogy az első dal első fél percéről írok két mondatot.
A generatív AI népszerűsítői úgy tesznek, mintha a kreativitás kulcsa az ötlet lenne. Tegyünk egy próbát egy baromi unalmas ötlettel: „Történet egy romantikus regények által elkábított vidéki asszonyról, akinek unalmas férje mellett több szeretője is van, egyik kapcsolat sem végződik jól, és végül (spoiler!) öngyilkos lesz.” Ebből a promptból nem jönne ki sehogy se a világirodalom egyik legeslegnagyszerűbb regénye – még akkor sem, ha mindenféle plusz utasításokat találunk ki. („Legyen az elbeszélői hang szenvtelen”, „Kezdődjön a szöveg a főszereplő férjének diákkori leírásával, különös hangsúlyt fektetve a furcsa fejfedőjére” stb.) Flaubert kreativitása abban rejlett, ahogy az összes mondatot – jelenetet, párbeszédet, leírást – egytől egyig megírta.
De abban az esetben is, amikor az ötlet eredeti, akkor is csak a kreativitás kiindulópontja. „R&B-dal a szexuális csábításról, alig bújtatott allegóriába csomagolva; legyen benne egy repetitív, hangsúlyos koszos szinti, darbuka meg egy csengettyű, meg egy la-la-la rész is” – ez már izgalmasabbnak tűnik, mint az előző, de kb. egymillióképpen lehetne vacakul megcsinálni, és ahhoz, hogy mégis zseniális lett, még számtalan lényeges „apró” döntést kellett meghozni az ötleten túl.
Még egy fontos jellemzője van a kreativitásnak, amit a promptolt generatív AI nem tud: az, hogy pontosan a mű pontosan milyen lesz, gyakran a megalkotásának aprólékos, fáradságos folyamata közben alakul ki, sőt, akár át is formálódhat. Aki szövegeket ír, bizonyára tapasztalta, hogy az írás megkezdése előtt vannak többé-kevésbé határozott ötletei, ezek ilyen-olyan kapcsolatban állnak egymással; de ahogy ezt szavakba önti, struktúrává formálja, úgy egyre határozottabb körvonalat kénytelenek ölteni, és néha, ha nem is nagyon, de kicsit más jön ki a végén, mint amivel nekiindult. A zeneszerzők számára is az a ritkább élmény, amikor sikerül pontosan megvalósítaniuk azt, ami „a fejükben szól”.
Csakhogy mindannyian lusta disznók vagyunk
Persze az, hogy mindenféle tech CEO-k hülyeségeket beszélnek, még nem feltétlenül a világ vége. Csak az a baj, hogy Shulmannak részben igaza van: alkotni ebben a pre-Suno értelemben tényleg sok idő- és energiabefektetést igényel; sokszor bizony még frusztráló is, amikor nem úgy sikerülnek a dolgok elsőre, másodszorra és ötödszörre sem, ahogy szeretnénk – ráadásul senki nem garantálja, hogy hatodszorra majd összejön.
Ugyanakkor ha valaki már próbálta, az azt is tudja, hogy olyan örömöt nyújt mindez, ami egészen más minőség, mint hogy promptolsz egyet és pár másodperc múlva kész a dal / szöveg / kép. Akkor is, ha az, amit készítesz, nem minden idők legjobb alkotása, de talán még csak a hété sem.
Csakhogy ha a tech világ abban nem is feltétlenül jó, hogy „közelebb hozza egymáshoz az emberiséget”, meg „mindenki számára elérhetővé tegye az alkotás örömét” stb. stb., abban kifejezetten hatékony, hogy kielégülést nyújtson a „még egy kis dopamint! és még! és megint! és még!” részünk számára; hogy meggyőzzön arról, hogy amikor ezt csináljuk órákon keresztül, akkor tényleg csinálunk valamit. Másfelől pedig abban, hogy elhitesse velünk, hogy a fáradozás, a frusztráció, a friction az rossz. Nyilvánvalóan van olyan, hogy rossz – de van, hogy szükséges, és ez utóbbi kategóriába tartozik úgy kb. minden igazán fontos dolog.
Mindannyian lusta disznók vagyunk, és ha valaki azt ígéri, hogy a csak hosszú távon és akkor sem 100%-os bizonyossággal megtérülő, fáradságos munka helyett most és tutira csinálhatunk valamit, és elhiteti velünk, hogy ez tulajdonképpen ugyanaz, csak megspóroltuk a „kevésbé lényeges” „fárasztó” részeket, akkor hajlani fogunk rá, hogy ezt elhiggyük neki.
Persze mindig lesznek, akikben olyan közléskényszer van, hogy nem fognak megelégedni azzal, hogy íratnak egy dalt; mindig lesznek, akik szerencsés módon találkoznak olyanokkal, akik inspirálják őket ebben. De sokkal jobb lenne, ha azon fáradoznánk, hogy a környezet (mind az IRL, mind a digitális, ha van még ennek az elválasztásnak értelme) minél több embert alkotásra inspiráljon. Ehelyett mintha abba az irányba mennénk, hogy csak azok legyenek valóban kreatív emberek, akik annak ellenére, hogy iszonyatos pénzbefektetéssel létrehozott, iszonyatosan túlhájpolt, könnyebb(nek mondott) utak állnak rendelkezésükre – a nehezebbet választják.
A zeneíratás meghozza a kedvet a zeneíráshoz?
Mindezt fenntartom, ámde: a legjobb elemzőcég, a MiDIA a blogján közölt egy adatot, amely szerint a genAI zeneírók felhasználói valójában a mostanában sokat emlegetett superfanek, vagyis a legnagyobb zenerajongók. Az átlagnál négyszer nagyobb valószínűséggel vásárolnak zenei merchöt; az átlagnál másfélszer nagyobb köztük a streamelőfizetésők aránya – és ami talán a legmeglepőbb (nem kizárt, hogy Shulmant is meglepte): az átlagnál háromszor nagyobb valószínűséggel játszanak hangszeren, vagy legalább fontolgatják, hogy elkezdenek tanulni.
Úgy tűnik tehát, hogy bár a Suno elvileg leginkább azoknak szólna, akik eddig nem zenéltek (mert „nem élvezetes”), valójában inkább a zenével foglalkozó emberek próbálják ki. A Billboard által megszerzett adatok szerint jó részük nem tér sokszor vissza, illetve egy-egy alkalommal átlagban 20 percet töltenek az oldalon. Ez leginkább arra látszik utalni, hogy a prompttal való zeneíratás nem egy olyan tevékenység, amire igazán rá lehetne függeni.
Bizonyára nem arról van szó, hogy a Suno élvezhetetlen vackokat hoz létre, mert tényleg döbbenetes, hogy mire képes; hanem arról, hogy egyszeri mókának érdekes, hogy beírod, hogy „írj egy dalt Mirciről, a macskámról és a kedvenc jutifalatjáról, energikus hard rock stílusban, epikus szólóval”, és akkor tényleg lesz egy ilyen dal, de hosszú távon keveseket elégít ki igazán.
Talán túlságosan a ChatGPT mintájára gondoltam el (és talán gondolta el Shulman is) az AI zeneírást. Azt ugyanis a jelek szerint nagyrészt arra használják az emberek, hogy helyettük írjon meg szövegeket, amikhez nekik nincs kedvük, energiájuk, vagy talán volna, de egyszerűbb így (még ha sok hosszútávú haszna nincs is). Vagy arra, hogy információkat szedjen össze, még ha tudható az is, hogy ezek jóval kevésbé rögzülnek az emlékezetünkben, mintha keresőt használnának.
De a zenecsinálás nem feladatteljesítés és nem is információszerzés: a kreativitás elengedhetetlen, lényegi összetevője. (Mondjuk ez akár egy egyetemi beadandó megírására is igaz lehetne, ha a CV-írásra nem is.) Ezek szerint a Suno pótlás helyett inkább arra jó, hogy meghozza a kedvet ahhoz, amit elvileg kivált.
A közeljövő
Úgy tűnik, hogy a dolgok abba az irányba mennek, hogy 2026-ban jönnek az „Írj Dua Lipa stílusában diszkószámot Mirciről!” és a „Milyen lenne a Shape Of You mulatós műfajban, női énekessel, német nyelven, kétszeres sebességgel?” típusú alkalmazások. A nagy kérdés az, hogy ezek ugyanúgy fognak-e működni, mint ezek szerint a Suno, vagyis pár ilyen szám – minden bizonnyal legalább néhányszor pompás szórakozást nyújtó – megalkottatása után a felhasználók egy része továbbáll, másoknak meg talán megjön a kedve: „mi lenne, ha én is képes lennék írni egy diszkószámot Mirciről?”
Vagy pedig ez sokkal izgalmasabb lesz a felhasználók számára a sima promptos zeneíratásnál? Pláne megspékelve mindenféle közösségi aspektusokkal, amik arra jók, hogy az emberek egymást erősítve, pörgetve (plusz algoritmus, plusz hájp) meggyőzzék magukat-egymást arról, hogy érdemi dolgot csinálnak?
A zene és a kreativitás jövője érdekében remélem, hogy az új Suno, az új Udio, feltehetően a Spotify szuperprémium akármicsodája és a többi százezer AI startup nem lesz annyira sikeres, mint szeretne, de annyira igen, hogy legalább felkeltse az igényt a valódi kreativitás iránt. Nehéz eltalálni ezt az egyensúlyt – pláne, hogy egyáltalán nem is ez a céljuk.
Rónai András
A Dalszerző újságírója, szerkesztője. A Recorder újságírója, többek között a magyar megjelenéseket bemutató Rec.hu rovat szerzője 2018 óta. Több angol nyelvű tanulmány, valamint Szemere Annával együtt a 33 1/3 sorozat első magyar tárgyú kötetének szerzője (Palya Bea: Én leszek a játékszered). Filozófiai könyve A kifejezés címmel jelent meg.