Alig egy nappal azután, hogy sokan felfigyeltek rá, már nem is működik a Youka nevű oldal. Ez a YouTube Karaoke rövidítése, és a Verge beszámolója szerint pont ezt csinálta: egy kiválasztott YouTube-klipből karaokeverziót készített, vagyis eltávolította a vokált, a szöveget pedig feliratként elhelyezte a videó alján. A lap azt írja, hogy „bár nem tökéletes a vokál eltávolítása – a háttérben halványan még ott marad valami a hangból -, de meglepően gyors és hatékony.”
Természetesen a Youka működése annyi szerzői jogi problémát vetett fel, hogy az első hírek is már arról szóltak, hogy „próbáld ki, amíg lehet”. Az alkotója azt ígéri, hogy nyílttá teszi a forráskódot, úgyhogy a Music Ally azt írja, hogy valószínűleg találkozunk még a YouTube karaokéval, vagy ebben a verzióban, vagy az ötlet más megvalósításával.
Ami a megnyílt, majd hamar bezárt oldal hírében önmagán túlmutatóan érdekes, hogy a technológia már képes ennek a feladatnak a megoldására, ha nem is tökéletesen, de majdnem. Az elemzők szerint valószínű, hogy a Youka a Deezer nyílt forráskódú Spleeter technológiáját használta. Ennek leírása részletesen, de közérthetően foglalkozik a source separation problémájával, vagyis azzal, hogy hogyan lehet a különböző hangforrásokból (pl. különféle hangszerek, énekesek hangjából) összeálló zenében szétválasztani ezeket a forrásokat.
Mint írják, az emberi agy ebben nagyon jó (mármint a felismerésben, nem a tényleges „szétszedésben”). Azt, hogy ezt hogyan lehet automatizálni, évtizedek óta foglalkoztatja a kutatókat. A mesterséges intelligencia, a gépi tanulás fejlődése hatalmas előrelépést hozott ezen a területen. A Spleeter például az eredeti hangfájl hosszúságának századrésze alatt elvégzi a szétválasztást. A Deezer ismertető szövege hangsúlyozza, hogy nem gondolják, hogy „megoldották” a problémát, és hogy komolyan építettek más kutatók munkáira.
A mesterséges intelligencia betanítása természetesen rendkívül adatigényes, és ez a zenével foglalkozó kutatók számára komoly problémát jelent, hiszen a zenében a szerzői jogi korlátozások miatt nem áll rendelkezésre nagy méretű, szabadon hozzáférhető „adatbázis”. A Deezer viszont – lévén a betanításban alkalmazhatta a katalógusát – komoly előnyben volt a fejlesztésben. Ezért gondolták, hogy mivel az adatokat nem tehetik nyilvánossá, ezért az ezeken betanított eszközt azzá teszik. A szöveg szerint „mondani sem kell”, hogy a szerzői jogi előírásokat a Spleeter használata közben be kell tartani.
Categories: Hírek
Leave a Reply